第134页

DP-Auditorium:用于审计差异隐私的灵活库
商业应用

DP-Auditorium:用于审计差异隐私的灵活库

49 0

差异隐私(DP) 是随机机制的一种属性,可在处理和分析数据时限制任何个人用户信息的影响。DP 提供了一种强大的解决方案来解决人们对数据保护日益增长的担忧,使跨行业和政府应用(例如美国人口普查)的技术能够在不 损害个人用户身份的情况下实现。随...

了解概念漂移下训练数据的重要性
数据计算

了解概念漂移下训练数据的重要性

57 0

我们周围世界不断变化的性质对 AI 模型的开发提出了重大挑战。通常,模型是在纵向数据上进行训练的,希望所使用的训练数据能够准确地代表模型未来可能收到的输入。更一般地说,所有训练数据都同样相关的默认假设在实践中经常被打破。例如,下图显示了来自...

生产设备上语言模型的私人训练取得进展
人工智能

生产设备上语言模型的私人训练取得进展

49 0

语言模型 (LM) 经过训练可以预测给定输入文本的下一个单词,这是许多应用程序的关键技术 [ 1、2 ]。在Gboard中,LM 通过支持下一个单词预测(NWP)、智能撰写、智能完成和建议、滑动输入和校对等功能来改善用户的打字体验。在用户设...

VideoPrism:用于视频理解的基础视觉编码器
商业应用

VideoPrism:用于视频理解的基础视觉编码器

44 0

网络上的视频数量惊人,涵盖了从人们分享的日常时刻到历史时刻再到科学观察的各种内容,每个视频都包含着对世界的独特记录。合适的工具可以帮助研究人员分析这些视频,从而改变我们理解周围世界的方式。视频提供的动态视觉内容远比静态图像丰富,可以捕捉实体...

Google 参加 APS 2024
商业应用

Google 参加 APS 2024

48 0

谷歌参加 2024 年 3 月美国物理学会 (APS) 会议的概况。今天,美国物理学会(APS) 2024 年 3 月会议在明尼苏达州明尼阿波利斯拉开帷幕。APS 2024 是关于物理学和相关领域主题的顶级会议,它汇集了研究人员、学生和行业...

Croissant:适用于 ML 数据集的元数据格式
数据计算

Croissant:适用于 ML 数据集的元数据格式

64 0

今天,我们推出 Croissant,一种适用于 ML 数据集的新元数据格式。Croissant 是由来自行业和学术界的社区共同开发的,是 MLCommons 工作的一部分。希望重用现有数据集来训练 ML 模型的机器学习 (ML) 从业者通常...

社会学习:利用大型语言模型进行协作学习
人工智能

社会学习:利用大型语言模型进行协作学习

47 0

我们概述了一个社交学习框架,其中 LLM 使用自然语言以隐私意识的方式相互分享知识。我们评估了该框架在各种数据集上的有效性,并提出了在此设置中衡量隐私的定量方法。大型语言模型 (LLM) 显著提高了解决使用自然语言指定任务的最新水平,通常可...

针对皮肤病学和病理学的健康专用嵌入工具
人工智能

针对皮肤病学和病理学的健康专用嵌入工具

44 0

谷歌研究发布了两种仅供研究使用的新工具,用于训练皮肤病学和病理学的医学成像模型,并建立在其特定领域的嵌入之上。全球范围内,放射科、皮肤科和病理科等各专业都缺乏医学影像专家的解读。机器学习 (ML) 技术可以帮助减轻这一负担,它为医生提供工具...

表链:在推理链中不断发展的表格,用于表格理解
商业应用

表链:在推理链中不断发展的表格,用于表格理解

46 0

我们提出了一个框架来解决表格理解任务,在这个框架中,我们训练 LLM 逐步概述其推理过程,迭代更新给定的表格以反映思维过程的每个部分。这使 LLM 能够将表格转换为更简单、更易于管理的部分,以便它能够深入理解和分析表格的每个部分。人们每天都...

像图一样说话:大型语言模型的编码图
人工智能

像图一样说话:大型语言模型的编码图

45 0

我们深入研究了如何最好地将图表表示为文本,以便法学硕士 (LLM) 能够理解它们——我们的调查发现了影响结果的三个主要因素。想象一下你周围的一切——你的朋友、厨房里的工具,甚至是自行车的零件。它们都以不同的方式连接在一起。在计算机科学中,术...