OpenAI被赋予ChatGPT新的视觉、听觉能力

OpenAI 周一发布了性能更高、更人性化的人工智能技术版本,该技术支持其流行的生成工具 ChatGPT,并免费向所有用户开放。

OpenAI 旗舰产品的更新发布前一天,谷歌预计将发布有关 Gemini 的公告,Gemini 是这家搜索引擎巨头自己的人工智能工具,与 ChatGPT 正面竞争。

“我们非常非常高兴能够将 GPT-4o 带给我们所有的免费用户,”首席技术官 Mira Murati 在旧金山举行的备受期待的发布会上说道。

该公司表示,新型号 GPT-4o(“O”代表全向)将在未来几周内在 OpenAI 的产品中推出,付费客户可以无限制地使用该工具。

该公司表示,该模型可以生成内容或理解语音、文本或图像中的命令。

“新的语音(和视频)模式是我用过的最好的计算机界面。感觉就像电影中的人工智能,”OpenAI 首席执行官 Sam Altman 在博客文章中说道。

奥特曼此前曾指出,电影《她》中斯嘉丽约翰逊的角色是他希望人工智能交互走向何方的灵感来源。

“对我来说,与电脑交谈从来没有感觉很自然;现在确实如此,”他补充道。

Murati 和 OpenAI 的工程师在虚拟活动中展示了 GPT-4o 的新功能,对 ChatGPT 聊天机器人的增强版提出了挑战。

演示的主要内容是 OpenAI 工作人员向语音 ChatGPT 提问,ChatGPT 以笑话和类似人类的玩笑进行回应。

该机器人充当英语到意大利语的翻译,解释面部表情,并引导用户解决一道困难的代数问题。

该公司表示,GPT-4o 在文本、推理和编码智能方面与之前的版本具有相同的能力,并为多语言对话、音频和视觉设定了新的行业标准。

在一次演示中,ChatGPT 通过智能手机摄像头成功解读了员工周围的环境,并以友好、女性化的声音说话,与电影《她》中的人工智能机器人没什么不同。

ChatGPT 机器人说道:“嗯,从我所看到的来看,你似乎正在某种录音或制作环境中,有灯光、三脚架......你可能正准备拍摄视频或发布公告?”

“慢慢来”

最近几周,人们高度期待 OpenAI 将发布在线搜索工具的人工智能版本,以与谷歌搜索引擎竞争,但 Altman 周五表示,情况并非如此。

观察人士也在等待 GPT-5 的推出,但 Altman 上周表示,他的公司将“慢慢来发布主要新型号”。

这次活动只是人工智能军备竞赛的最新一集,OpenAI 支持者微软超越苹果,成为全球市值最大的公司。

OpenAI 和微软正在与谷歌激烈竞争,争夺生成人工智能的主要参与者,但 Facebook 所有者 Meta 和新贵 Anthropic 也采取了重大举措来竞争。

所有公司都在争先恐后地想办法来弥补生成式人工智能的高昂成本,其中大部分成本都花在了芯片巨头英伟达及其强大的 GPU 半导体上。

向所有用户提供新模型可能会引发人们对 OpenAI 盈利之路的质疑,因为人们怀疑日常用户是否愿意付费订阅。

到目前为止,只有性能较低的 OpenAI 或 Google 聊天机器人版本可供客户免费使用。

“我们是一家企业,会发现很多东西需要收费,”奥特曼在他的博客上说。

人工智能制造商还感受到了来自出版商和创作者的压力,他们要求为用于训练模型的任何内容付费。

OpenAI 已与美联社、《金融时报》和 Axel Springer 签署了内容合作伙伴关系,但也陷入了与《纽约时报》的重大诉讼。

人工智能公司还在美国法庭面临艺术家、音乐家和作家的单独诉讼。


本站全部资讯来源于实验室原创、合作机构投稿及网友汇集投稿,仅代表个人观点,不作为任何依据,转载联系作者并注明出处:https://www.lvsky.net/30.html

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

评论