第65页

简单有效的零镜头任务导向对话
商业应用

简单有效的零镜头任务导向对话

27 0

现代对话代理需要与越来越多的服务集成,以执行各种各样的任务,从预订航班和查找餐厅,到播放音乐和讲笑话。添加此功能可能很困难——对于每个新任务,都需要收集新数据并重新训练为对话代理提供支持的模型。这是因为大多数面向任务的对话 (TOD) 模型...

锁定图像调整:为图像模型添加语言理解
人工智能

锁定图像调整:为图像模型添加语言理解

20 0

深度学习改变了将图像分类的能力。迁移学习也大大加快了这一速度。迁移学习首先在大型数据集(如ImageNet)上对模型进行预训练,以学习视觉表征,然后通过微调将其迁移到数据较少的新任务(例如对动物进行分类)。BiT和ViT等先前的研究采用了这...

学会促进持续学习
人工智能

学会促进持续学习

19 0

监督学习是机器学习 (ML) 的一种常见方法,其中使用针对当前任务适当标记的数据来训练模型。普通的监督学习在独立同分布 (IID) 数据上进行训练,其中所有训练示例均从一组固定的类别中采样,并且模型在整个训练阶段都可以访问这些示例。相比之下...

FormNet:超越基于表单的文档理解的顺序建模
人工智能

FormNet:超越基于表单的文档理解的顺序建模

18 0

基于表单的文档理解是一个日益增长的研究课题,因为它具有将非结构化文本数据自动转换为结构化信息以深入了解文档内容的实际潜力。最近的序列建模是一种自注意力机制,它直接对选定文本中所有单词之间的关系进行建模,在自然语言任务上表现出了最先进的性能。...

环境计算的隐藏接口
硬件技术

环境计算的隐藏接口

27 0

随着消费电子产品和联网设备越来越普遍,家庭开始采用各种类型的联网设备,这些设备提供音乐控制、语音助手和家庭自动化等功能。设备的优雅集成需要适应现有的美学和用户风格,而不是简单地添加屏幕,因为屏幕很容易破坏视觉空间,尤其是当它们在断电或不主动...

Pix2Seq:一种用于对象检测的新语言接口
人工智能

Pix2Seq:一种用于对象检测的新语言接口

18 0

物体检测是一项由来已久的计算机视觉任务,旨在识别和定位图像中所有感兴趣的物体。在尝试识别或定位所有物体实例的同时还要避免重复时,复杂性就会增加。现有的方法(如Faster R-CNN和DETR)都经过精心设计,并且在架构和损失函数的选择上高...

从价值函数中提取以技能为中心的状态抽象
人工智能

从价值函数中提取以技能为中心的状态抽象

21 0

机器人强化学习 (RL) 技术的进步使机器人代理能够在具有挑战性的环境中执行越来越复杂的任务。最近的结果表明,机器人可以学会折叠衣服、灵巧地玩魔方、按颜色分类物体、在复杂环境中导航以及在崎岖不平的地形上行走。但是,与机器人在现实世界中可能面...

尽管法院下令禁止,X 仍可在巴西短暂播放
商业应用

尽管法院下令禁止,X 仍可在巴西短暂播放

30 0

在马斯克与巴西法官亚历山大·德莫赖斯 (Alexandre de Moraes) 发生争执后,法院此前已要求移动和互联网服务提供商封锁该平台。令人惊讶的是,埃隆·马斯克旗下的社交媒体平台 X尽管被巴西最高法院下令封锁,但该平台仍短暂地恢复了...

Meta 赢得针对苹果隐私变化的诉讼
法律法规

Meta 赢得针对苹果隐私变化的诉讼

32 0

该案因有偏见而被驳回,无法重新提起。.在美国法院驳回一项诉讼后,Meta Platforms 获得了法律胜利。该诉讼指控这家科技巨头误导股东,使其了解苹果隐私变化对其广告业务的影响。这起由以色列保险公司和养老基金提起的诉讼声称,Meta 隐...

谷歌因在英国搜索领域的主导地位面临 70 亿英镑的诉讼
商业应用

谷歌因在英国搜索领域的主导地位面临 70 亿英镑的诉讼

33 0

谷歌坚称该诉讼存在缺陷,并否认对消费者造成任何伤害,并称其与苹果达成的协议合法。谷歌在伦敦面临亿万富翁的诉讼,其母公司 Alphabet 要求法庭驳回指控这家科技巨头滥用其在在线搜索市场的主导地位的指控。这起诉讼的金额可能高达 70 亿英镑...