来自连线的报道:这家中国初创企业正在领跑开源 AI 领域
AI 领域的专家兼知名投资人李开复,曾助力谷歌和微软在中国发展,他现在表示自己的新公司https://t.co/8MDVLV2UOZ(零一万物)即将推出生成式 AI 领域的首款突破性应用。
去年七月,Meta 通过发布 Llama 2,这是一个类似于支持 ChatGPT 的 AI 模型,打破了构建更强大 AI 的传统格局,任何人都可以下载并使用这个模型。11月,一家相对不太知名的北京初创公司https://t.co/8MDVLV2UOZ(零一万物)推出了自家开源模型,其性能超越 Llama 2,在众多 AI 模型能力评比的榜单上名列前茅。
https://t.co/8MDVLV2UOZ 推出的模型 Yi-34B 发布仅几日,就在初创公司 Hugging Face 维护的排行榜上名列第一,该榜单通过各项标准智能测试评估 AI 语言模型的能力。几个月后,https://t.co/8MDVLV2UOZ 模型的改进版本在 Hugging Face 的榜单和其他评比中持续表现出色。本周一,该公司推出了一款能处理图像并分析其内容的“多模态” AI 模型 Yi-VL-34B。
OpenAI、谷歌等大型 AI 公司通常对自家技术进行严格控制,但https://t.co/8MDVLV2UOZ 则选择免费分享其 AI 模型,目的是吸引并培养一群忠实的开发者,共同开发出引领潮流的 AI 应用。https://t.co/8MDVLV2UOZ 成立于去年六月,已从阿里巴巴等中国电商巨头那里获得了2亿美元投资,据 Pitchbook 报道,其估值已超过10亿美元。
李开复,这家新兴企业的创始人和 CEO,是一位在建立微软北京研究院并领导谷歌中国业务之前就进行过开创性人工智能研究的知名投资人。他表示,Yi-34B的创造是他一生致力于打造更智能机器的巅峰之作。
“这是我整个职业生涯的追求,”李开复通过视频会议软件 Zoom 在其位于北京的精美公寓中表示。“我们已经学习计算机语言太久了,我们真正需要的是能够理解我们的语言——即语音和文本——的系统。”在中国,https://t.co/8MDVLV2UOZ 被称为“零一万物”(Ling-Yi Wan-Wu),这一名称源于道教经典《道德经》,寓意“零生一,一生万物”。
https://t.co/8MDVLV2UOZ 是中国在由 OpenAI 和 ChatGPT 启动的 AI 竞赛中的领军企业之一,这场竞赛迄今为止主要由美国公司主导。李开复表示,他的公司旨在通过开发基于语言模型的首批创新应用来引领这场革命的下一阶段,这些应用已为 https://t.co/8MDVLV2UOZ 带来了丰厚的收益。“在移动时代胜出的应用是那些以移动为先的,如 Uber、微信、Instagram、TikTok,”李开复说。“未来一代的生产力工具应该跳出传统的 Office 模式,像 Word、Excel、PowerPoint 这样的工具已经不再是发展的正确方向。”
https://t.co/8MDVLV2UOZ 的工程师们正在开发不同的“以 AI 为核心”的应用,李开复表示,这些应用涵盖办公生产力、创意和社交媒体等领域。他的计划是让这些应用在全球范围内取得成功,就像中国支持的社交网络 TikTok 和在线零售商 Temu 在美国消费者中的流行那样。
虽然 https://t.co/8MDVLV2UOZ 的应用尚未推出,但该公司的开源语言模型已在西方国家赢得了赞誉。“在许多方面,即便是与那些拥有高达 700 亿参数的模型相比,它依然是我们目前最优秀的模型,”AI 专家 Jerermy Howard 表示。他最近创立了 Answer AI,这是一家同时进行 AI 研究和应用开发的新企业。
AI 领域的先行者
李开复的 AI 职业生涯堪称光辉。他从台湾迁移到美国,在田纳西州的橡树岭读完高中后,先后在哥伦比亚大学和卡内基梅隆大学攻读计算机科学,最终凭借一篇关于开发当时领先的语音识别系统的论文获得了博士学位。
1990年,李开复加入苹果公司,担任研究科学家。六年后,他转投硅谷图形公司,随后于1998年回到中国,助力创建了微软亚洲研究院——这是一个蜚声国际的北京实验室,培育了众多中国杰出的工程师和企业高管。到了2005年,李开复成为了谷歌中国搜索业务的总裁,四年后离职,创立了自己的投资公司创新工场,活跃在中国蓬勃的科技行业中。
伴随智能手机在中国的兴起,科技行业迅猛发展,创新工场投资了诸多中国 AI 领域的成功创业公司,包括图像识别公司旷视和自动驾驶卡车公司图森未来。李开复成为中国 AI 产业的领军人物,他穿梭于中美之间,鼓励在美国的中国研究生回国发展 AI 项目。2018年,他出版了《AI 超级大国》,在书中他论证了中国的 AI 实验室和公司凭借国内丰富的人才、数据和用户资源,将很快与美国抗衡甚至超越。同时,他也经常呼吁中美两国在 AI 领域进行合作。
《AI 超级大国》的出版正值西方逐渐认识到中国科技产业的崛起,与美国相比肩甚至有望超越。华盛顿的决策者和评论家开始关注中国挑战美国霸权的野心,以及由此可能产生的风险。
在这种背景下,中美之间搭建桥梁变得愈发困难。2019年,由于在中美公司间交易日益复杂,创新工场关闭了其在硅谷的办公室。同年10月,美国政府针对中国 AI 产业采取了直接行动,对旷视实施制裁,理由是政府使用了该公司的面部识别技术。
重建桥梁
随着 https://t.co/8MDVLV2UOZ 推出其开源 Yi-34B AI 模型,李开复再次成为技术连接的桥梁。Yi-34B 发布数月后,西方的开发者们对这一模型进行了改进,并在 Hugging Face 的模型排行榜上超越了它的性能。现在,一些美国和欧洲国家正在以这个精通中英文的中国模型为基础,制定他们的 AI 发展战略。
“这是一个极好的模型,众多开发者正基于它进行创新。”HuggingFace 的 CEO Clément Delangue 在 https://t.co/8MDVLV2UOZ 发布模型后不久的 11 月份一次简id:71z6od10t43gm0ia <意译> 报会上如是说。
Delangue 还提到,开源语言模型的发展速度惊人,它们在某些专项任务上甚至能超越 OpenAI 的市场领军产品 GPT-4。不过,他也指出许多顶尖的开源模型多来自美国以外的地区,这意味着 https://t.co/8MDVLV2UOZ 可能从围绕其模型涌现的各种创新中受益。他在简报中表示:“美国的公司变得不太开放和透明。但在 AI 领域,越多开源的公司,其生态系统发展得越好,它们在 AI 构建上也越强大。”
Meta 的 Llama 2 是美国公司中罕见的顶级开源模型之一,它代表这家社交媒体巨头向 OpenAI、微软、谷歌等大型科技竞争对手发起的挑战,这些竞争对手正在大力投资生成式 AI。Meta 选择以允许商业再利用的方式发布其 AI 语言模型,但这种发布方式并非没有限制。
Yi-34B 和 Llama 2 不仅作为领先的开源 AI 模型有共同之处。中国的 Yi-34B 模型发布不久后,一些开发者发现https://t.co/8MDVLV2UOZ 的代码曾提到过 Meta 的模型,但后来这些提及被移除了。https://t.co/8MDVLV2UOZ 的开源项目负责人 Richard Lin 后来表示,他们将撤回这些更改,并承认 Llama 2 在 Yi-34B 架构上发挥了一定作用。https://t.co/8MDVLV2UOZ 的模型和所有顶尖的语言模型一样,都基于 Google 研究人员在 2017 年开发的 Transformer 架构,而这部分则是基于 Llama 2。https://t.co/8MDVLV2UOZ 的发言人 Anita Huang 表示,根据公司咨询的法律专家,Yi-34B 不受 Llama 2 许可的限制。Meta 对此并未作出回应。
尽管 Yi-34B 在某种程度上借鉴了 Llama 2,但由于其处理的数据不同,这个中国模型的工作方式有很大差异。“Yi-34B 虽然使用了 Llama 2 的架构,但在训练方法上完全不同,而且更为先进,”专注于开源 AI 项目的 https://t.co/I53Bua1bIZ 研究员 Eric Hartford 表示,“它们实际上是完全不同的。”
Yi-34B 与 Meta 的 Llama 2 的关系显示了一个事实:尽管中国在 AI 领域有一定的自信,但在生成式 AI 方面,它仍在跟随美国的步伐。研究中国 AI 发展的乔治华盛顿大学助理教授 Jeffrey Ding 指出,虽然中国研究人员已经发布了许多大型语言模型,但整体上,中国的 AI 行业仍落后于美国。
他还提到,“西方公司在大型语言模型的开发上领先,因为它们可以通过公开发布模型来测试问题、收集用户反馈,并围绕新模型激发公众兴趣。”Ding 和其他专家认为,相比美国,中国的 AI 公司面临更多的监管和经济方面的挑战。
在上周的达沃斯世界经济论坛上,李开复提出一个观点——他希望这个信息能传达到中国——对于任何国家来说,采用开放的方式是充分利用 AI 的关键。
李开复指出,一个或几家公司掌握了所有强大的模型,导致了巨大的不平等。这种不平等不仅影响到了经济条件较差的人们和国家,也波及到教授、研究员、学生、企业家和业余爱好者。“如果没有开源资源,他们怎么去学习呢?他们或许正是未来的创造者、发明者或应用开发者。”他说。
李开复认为,如果这一预测成真,https://t.co/8MDVLV2UOZ 的技术及其衍生应用将使中国技术成为科技行业下一发展阶段的关键。
原文:https://t.co/TuH5OD9du8
点击图片查看原图