彭博社来打脸了:谷歌的 Gemini AI 模型表现出色,但与 OpenAI 相比仍有差距
这家科技巨头最新推出的 AI 模型,与 OpenAI 八个月前推出的产品相比,进步有限。
一般而言,感恩节和圣诞节之间推出新技术的机会并不多,但对于 Alphabet Inc. 旗下的谷歌来说,这是充满挑战的时刻。
这个搜索引擎巨头在一年前被 ChatGPT 搅动了局面,此后一直在努力展示自己的快速发展。在延迟发布的报道之后,周三谷歌突然宣布推出了 Gemini,这是一款新的 AI 模型,它能够识别魔术戏法并通过会计考试。谷歌发布的示范视频(如下所示)在社交媒体上引起了广泛关注——但这更多的是一种营销策略。从技术角度看,谷歌仍在追赶 OpenAI。
让我们看看具体的技术数据。以下是谷歌公布的数据表,显示了 Gemini 与 OpenAI 的顶尖模型 GPT-4 的比较:
(参考图二)
谷歌的 Gemini Ultra 略微超过了 OpenAI 大约一年前完成的 GPT-4。来源:谷歌
谷歌的数据表明,它的 Gemini Ultra(用蓝色表示)在多数标准测试中超越了 GPT-4。这些测试主要评估 AI 智能体如何处理高中物理、法律专业知识和道德判断等领域,现如今的 AI 竞争主要由这些能力决定。
但是,在这些基准测试中,Gemini Ultra 仅以微弱优势领先于 OpenAI 的 GPT-4 模型。也就是说,谷歌的最新 AI 模型仅在 OpenAI 一年前就已完成的基础上做出了较小的提升。而且 Ultra 目前仍未公布。
如果谷歌如其所暗示的那样在明年一月初发布 Gemini Ultra,那么它作为顶尖模型的地位可能不会持续太久。在谷歌努力赶上 OpenAI 的过程中,这个更灵活的对手已经有近一年的时间研发下一代 AI 模型,GPT-5。
此外,还有一个视频演示,技术专家们在曾经的 Twitter 现在称为 X 的网站上对其评价为“令人震惊”:
首次观看这个视频,确实给人留下深刻印象。模型能够跟踪一个纸球在塑料杯下的移动,或者在一张点连线图画完之前就推断出它将是一只螃蟹,这展示了谷歌 DeepMind AI 实验室多年来培养的推理能力,这是其他 AI 模型所缺乏的。然而,视频中展示的许多其他功能并非独一无二,可以通过 ChatGPT Plus 实现,正如沃顿商学院的 Ethan Mollick 教授在这里 https://t.co/xHeNgh6rDc 和这里 https://t.co/IFHt3hby07 所示。
谷歌也坦承视频进行了剪辑。他们在 YouTube 视频描述中提到:“为了本次演示,我们缩短了延迟并精简了 Gemini 的输出。”这表明,视频中的每个回应所需时间实际上比展示的要长。
事实上,这个演示并非实时进行,也非通过语音完成。彭博社的一篇评论中提到,一位谷歌发言人解释说,演示是用视频的静止画面和文本提示制作的。他们还提到了一个网站,上面展示了人们如何使用手部照片或绘画等图像与 Gemini 互动。换言之,演示中的语音实际上是在朗读人工制作的提示,展示给 Gemini 看的是静止图像。这与谷歌暗示的情况大相径庭,即人们可以与 Gemini 进行流畅的语音对话,而 Gemini 则实时观察并响应周围环境。
图三:谷歌网站提供的视频演示步骤说明,透露出这一过程其实没有那么引人注目。来源:谷歌
视频中也没有明确指出,这次演示可能是使用了还未上市的 Gemini Ultra 模型。这种对细节的含糊表述反映了谷歌背后更大的营销策略:谷歌想让我们记住,它拥有全球最大的 AI 研究团队之一,拥有的数据量超过任何竞争对手。它还希望提醒我们,正如它上周三所做的,谷歌正通过将较低版本的 Gemini 引入 Chrome、Android 和 Pixel 手机,展示其庞大的部署网络。
但在科技领域,无处不在并不总是优势。早期的移动通信领导者诺基亚和黑莓就在 2000 年代因苹果推出功能更强、更直观的 iPhone 而失去了市场优势。在软件市场,成功取决于拥有最优秀的系统。
谷歌最近的这场表演,很可能是为了抓住 OpenAI 最近动荡不安的局面。当这家小型 AI 初创企业的董事会暂时撤掉了首席执行官 Sam Altman,使公司的未来变得不确定时,据《华尔街日报》报道,谷歌迅速发起了一场销售活动,试图吸引 OpenAI 的企业客户转向谷歌。现在,谷歌似乎正在利用这种不确定性的浪潮推出 Gemini。
但是,仅凭出色的演示并不能走得太远。谷歌以前也展示过一些惊人的新技术,但最终没有取得太大进展。(还记得 Duplex https://t.co/UdDdJfqqqJ 吗?)谷歌庞大的官僚机构和层层的产品经理一直阻碍着它像 OpenAI 那样敏捷地推出产品。在社会努力适应 AI 带来的变革性影响时,这可能不是件坏事。但对于谷歌最新的快速前进,我们应保持一些怀疑。它仍然在后面追赶。
原文:https://t.co/YLX5sMfZ6D
点击图片查看原图
点击图片查看原图
点击图片查看原图