谷歌承认其 AI 概览功能需要改进,但我们都在帮助它进行 Beta 测试

谷歌也因其 AI 概述而感到尴尬。在过去一周,这家科技巨头的 AI 搜索功能质量低劣,信息完全错误,引发了一系列恶搞和嘲讽,周四,该公司发布了道歉声明。谷歌——这家公司的名字与网络搜索同义——其品牌专注于“整理全球信息”并将其放在用户的指尖——实际上在一篇博客文章中写道,“确实出现了一些奇怪、不准确或无用的 AI 概述。”

这还只是轻描淡写而已。

谷歌副总裁兼搜索主管利兹·里德 (Liz Reid) 撰写的这份承认失败的报告似乎证明了将人工智能技术融入一切的动力在某种程度上让谷歌搜索变得更糟。

在题为“关于上周”的帖子中(这已经通过了 PR?),Reid 详细说明了其 AI 概览犯错的多种方式。她说,虽然它们不会像其他大型语言模型 (LLM) 那样“产生幻觉”或编造事物,但它们可能会因为“其他原因”而出错,例如“误解查询、误解网络上语言的细微差别,或者没有大量可用的重要信息”。

里德还指出,过去一周在社交媒体上分享的一些截图是伪造的,而其他截图则用于无意义的查询,例如“我应该吃多少块石头?”——以前没有人真正搜索过这个。由于关于这个主题的事实信息很少,谷歌的人工智能引导用户找到讽刺内容。(在岩石的案例中,讽刺内容已发布 在地质软件提供商的网站上。)

值得一提的是,如果你在 Google 上搜索“我应该吃多少块石头?”,结果得到的是一系列无用的链接,甚至是一篇搞笑的文章,你不会感到惊讶。人们之所以做出反应,是因为人工智能自信地回答道“地质学家建议每天至少吃一块小石头”,就好像这是事实一样。从技术角度来说,这可能不是“幻觉”,但最终用户并不关心。这太疯狂了。

同样令人不安的是,里德声称谷歌“在发布之前对该功能进行了广泛的测试”,包括“强大的红队努力”。

那么,Google 里就没有人有幽默感吗?就没有人想到会产生糟糕结果的提示吗?

此外,谷歌淡化了人工智能功能对 Reddit 用户数据作为知识和真相来源的依赖。尽管人们长期以来经常在搜索中添加“Reddit”,以至于谷歌最终将其作为内置搜索过滤器,但 Reddit 并不是事实知识的集合。然而,人工智能会指向 Reddit 论坛帖子来回答问题,却不了解第一手 Reddit 知识何时有用,何时没用——或者更糟的是,什么时候是恶意信息。

如今,Reddit通过向Google、OpenAI等公司提供数据来训练他们的模型,从而大赚一笔,但这并不意味着用户希望 Google 的 AI 决定何时在 Reddit 上搜索答案,或暗示某人的观点是事实。学习何时在 Reddit 上搜索存在细微差别,而 Google 的 AI 尚不了解这一点。

正如里德所承认的,“论坛往往是真实的、第一手信息的重要来源,但在某些情况下,也会导致一些不太有用的建议,比如用胶水把奶酪粘在披萨上,”她在谈到过去一周人工智能功能最引人注目的失败之一时说道。

谷歌人工智能概述建议添加胶水让奶酪粘在披萨上,结果发现来源是用户 F*cksmith 在 11 年前发表的 Reddit 评论  

— Peter Yang (@petergyang) 2024 年 5 月 23 日

如果上周是一场灾难,那么至少谷歌正在迅速进行迭代 — — 或者它是这么说的。

该公司表示,它研究了 AI Overview 中的示例并确定了可以做得更好的模式,包括为无意义的查询建立更好的检测机制、限制用户生成内容以获得可能提供误导性建议的响应、为 AI Overviews 没有帮助的查询添加触发限制、不显示硬新闻主题的 AI Overviews,“新鲜度和事实性很重要”,并在对健康搜索的保护中添加额外的触发改进。

随着人工智能公司每天都在构建不断改进的聊天机器人,问题不在于它们是否能够在帮助我们了解世界信息方面胜过谷歌搜索,而是谷歌搜索是否能够在人工智能方面赶上并反过来挑战它们。

尽管谷歌的错误可能很荒谬,但现在将其退出竞争还为时过早——特别是考虑到谷歌的 beta 测试团队规模庞大,基本上所有使用搜索的人都是其中的一员。

里德说:“没有什么比拥有数百万人使用该功能进行许多新颖的搜索更棒的了。”

本站全部资讯来源于实验室原创、合作机构投稿及网友汇集投稿,仅代表个人观点,不作为任何依据,转载联系作者并注明出处:https://www.lvsky.net/394.html

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

评论