第7页

迈向实用机器人:机器人功能中的基础语言
人工智能

迈向实用机器人:机器人功能中的基础语言

12 0

过去几年,我们看到机器学习在机器人领域的应用取得了重大进展。然而,如今的机器人系统只能执行非常短的硬编码命令,例如“拿起一个苹果”,因为它们往往在有明确任务和奖励的情况下表现最佳。它们很难学会执行长期任务和推理抽象目标,例如用户提示“我刚刚...

OptFormer:使用 Transformer 实现通用超参数优化
商业应用

OptFormer:使用 Transformer 实现通用超参数优化

12 0

机器学习中最重要的方面之一是超参数优化,因为为机器学习任务找到合适的超参数可以成就或破坏模型的性能。在内部,我们定期使用Google Vizier作为超参数优化的默认平台。在过去 5 年的部署中,Google Vizier 已被使用超过 1...

UVQ:测量 YouTube 的感知视频质量
人工智能

UVQ:测量 YouTube 的感知视频质量

12 0

在线视频共享平台(例如YouTube)需要了解感知视频质量(即用户对视频质量的主观感知),以便更好地优化和改善用户体验。视频质量评估(VQA)试图通过使用客观数学模型来近似用户的主观意见,在视频信号和感知质量之间架起一座桥梁。传统视频质量指...

利用机器学习提高印度妇幼保健计划的参与度
人工智能

利用机器学习提高印度妇幼保健计划的参与度

9 0

手机的普及使得非营利组织能够及时向其受益人提供重要的健康信息。虽然智能手机上的高级应用程序可以提供更丰富的多媒体内容,并实现受益人和健康教练之间的双向沟通,但更简单的文本和语音消息服务可以有效地向大型社区传播信息,特别是那些信息和智能手机获...

Google Meet 中的高清分割
人工智能

Google Meet 中的高清分割

10 0

近年来,视频会议在许多用户的工作和个人交流中发挥着越来越重要的作用。在过去的两年中,我们通过引入隐私保护机器学习 (ML) 支持的背景功能(也称为“虚拟绿屏”)增强了 Google Meet 中的这种体验,该功能允许用户模糊背景或将其替换为...

宣布专利短语相似度数据集
数据计算

宣布专利短语相似度数据集

10 0

专利文件通常使用法律和高度技术性的语言,其中的上下文相关术语的含义可能与口语用法完全不同,甚至在不同文件之间也存在差异。使用传统的专利搜索方法(例如关键字搜索)搜索超过一亿份专利文件的语料库的过程可能非常繁琐,并且由于使用的语言广泛且不标准...

数字化气味:利用分子图谱了解气味
商业应用

数字化气味:利用分子图谱了解气味

11 0

我们 如何测量气味?气味是由飘过空气、进入我们鼻子并与感觉受体结合的分子产生的。可能有数十亿个分子可以产生气味,因此很难分类或预测哪些分子会产生哪些气味。感官地图可以帮助我们解决这个问题。色彩视觉有这些地图最熟悉的例子,从我们在小学学习的色...

视觉变换器和 MLP 模型的多轴方法
人工智能

视觉变换器和 MLP 模型的多轴方法

9 0

自 2012 年推出AlexNet以来,卷积神经网络一直是计算机视觉领域的主要机器学习架构。最近,受到自然语言处理中Transformers演变的启发,注意力机制已被广泛纳入视觉模型中。这些注意力机制会增强输入数据的某些部分,同时最小化其他...

从地形语义学中学习野外行走
人工智能

从地形语义学中学习野外行走

9 0

四足机器人的一个重要前景是它们有可能在人类难以或无法进入的复杂户外环境中运行。无论是在深山中寻找自然资源,还是在地震灾区寻找生命信号,一个坚固而多功能的四足机器人都会非常有用。为了实现这一点,机器人需要感知环境,了解其运动挑战,并相应地调整...

LOLNeRF:一眼就能学会
人工智能

LOLNeRF:一眼就能学会

9 0

人类视觉的一个重要方面是,我们能够从观察到的二维图像中理解三维形状。利用计算机视觉系统实现这种理解一直是该领域的一项基本挑战。许多成功的方法依赖于多视图数据,即从不同角度获得同一场景的两张或多张图像,这使得推断图像中物体的三维形状变得容易得...