第111页

通过人类注意力的预测模型实现愉悦的用户体验
人工智能

通过人类注意力的预测模型实现愉悦的用户体验

45 0

人类具有非凡的能力,能够接收大量信息(估计每秒约有 10 10比特进入视网膜),并选择性地关注一些与任务相关且有趣的区域,以便进一步处理(例如记忆、理解、行动)。因此,对人类注意力进行建模(其结果通常称为显着性模型)一直是神经科学、心理学、...

利用 NeRF 重建室内空间
商业应用

利用 NeRF 重建室内空间

36 0

在选择地点时,我们经常会问自己以下问题:这家餐厅的氛围适合约会吗?户外座位好吗?有足够的屏幕观看比赛吗?虽然照片和视频可以部分回答这些问题,但它们无法代替身临其境的感觉,即使无法亲自前往也不行。具有交互性、照片级真实感和多维度的沉浸式体验可...

世界上第一个非阿贝尔任意子的编织
商业应用

世界上第一个非阿贝尔任意子的编织

36 0

想象一下,有人向你展示了两个完全相同的物体,然后要求你闭上眼睛。当你睁开眼睛时,你会看到两个完全相同的物体,它们的位置也完全相同。你如何判断它们是否被调换了位置?直觉和量子力学定律一致:如果物体真的完全相同,就无法分辨。虽然这听起来像是常识...

Google 研究部负责任的 AI:AI 造福社会
人工智能

Google 研究部负责任的 AI:AI 造福社会

38 0

Google 的AI for Social Good团队由研究人员、工程师、志愿者和其他人员组成,他们共同关注积极的社会影响。我们的使命是通过实现现实世界的价值来展示 AI 的社会效益,项目涉及公共卫生、无障碍、危机应对、气候和能源以及自然...

SoundStorm:高效的并行音频生成
人工智能

SoundStorm:高效的并行音频生成

41 0

生成式 AI 的最新进展开启了在文本、视觉和音频等多个不同领域创建新内容的可能性。这些模型通常依赖于这样一个事实:原始数据首先被转换为标记序列的压缩格式。对于音频,神经音频编解码器(例如SoundStream或EnCodec)可以有效地将波...

通过自动反馈进行缓存驱逐的偏好学习
商业应用

通过自动反馈进行缓存驱逐的偏好学习

38 0

缓存是计算机科学中一种普遍存在的概念,它通过根据请求模式将一部分热门项目存储到离客户端更近的地方,显著提高存储和检索系统的性能。缓存管理的一个重要算法是用于动态更新存储项目集的决策策略,该策略经过了几十年的广泛优化,产生了几种高效、鲁棒的启...

使用前缀条件统一图像标题和图像分类数据集
商业应用

使用前缀条件统一图像标题和图像分类数据集

41 0

最近,在网络规模的图像标题数据集上对视觉语言 (VL) 模型进行预训练已成为传统图像分类数据预训练的有力替代方案。图像标题数据集被认为更“开放领域”,因为它们包含更广泛的场景类型和词汇,这使得模型在少样本和零样本识别任务中表现优异。然而,具...

用于条件性文本到图像生成的设备内扩散插件
人工智能

用于条件性文本到图像生成的设备内扩散插件

47 0

近年来,扩散模型在文本到图像的生成中取得了巨大成功,实现了高图像质量、提升了推理性能,并拓展了我们的创作灵感。然而,有效控制生成仍然具有挑战性,特别是在难以用文字描述的条件下。今天,我们发布了MediaPipe扩散插件,该插件支持在设备上运...