全球数字财富领导者

中美重磅!华尔街日报:中国人工智能公司已找到变通途径 正快速追赶美国同行

2024-12-27 08:41:31
tqttier
FX168副主编
关注
0
0
获赞
粉丝
3 3 0收藏举报
— 分享 —
摘要:美国《华尔街日报》称,尽管中国在购买先进芯片方面面临限制,但开发者们已经找到变通途径。有迹象表明,中国初创企业追赶美国领先的人工智能(AI)模型的速度比业内许多人预期的要快。OpenAI前研究员、现任人工智能企业家Andrew Carr表示,中国正在“更快地追赶”。

FX168财经报社(亚太)讯 美国《华尔街日报》称,尽管中国在购买先进芯片方面面临限制,但开发者们已经找到变通途径。有迹象表明,中国初创企业追赶美国领先的人工智能(AI)模型的速度比业内许多人预期的要快。

(截图来源:美国《华尔街日报》)

根据《华尔街日报》12月24日报道,由中国最成功的对冲基金经理之一投资的初创公司DeepSeek在11月发布了其最新大型语言模型的预览版。该公司表示,该程序的能力优于OpenAI的推理模型01,后者于9月以预览版形式推出。

最近几周,其他中国公司也发表了类似的声明。由中国互联网巨头阿里巴巴(Alibaba)和腾讯(Tencent)支持的初创公司Moonshot AI表示,它开发了一个专门研究数学的模型,其能力接近OpenAI 的 o1,而阿里巴巴表示,他们自己的一个实验研究模型在数学上优于OpenAI的o1预览版本。

这些公司还没有发表描述他们模型的论文,而且难以评估这些说法,因为对人工智能模型的能力没有一个公认的测试。不过,一些美国专家表示,他们对对这些模型“印象深刻”。

OpenAI前研究员、现任人工智能企业家Andrew Carr表示,中国正在“更快地追赶”。他说,DeepSeek的研究人员试图复制OpenAI的推理模型,“在几个月内就弄清楚了,坦率地说,我的许多同事对此感到惊讶。”

一个用来做比较的测试是美国国际数学邀请赛(AIME),它是为了挑战最聪明的高中数学学生而设计的。

DeepSeek表示,其模型在AIME上击败了OpenAI。但《华尔街日报》利用今年AIME的15个问题进行的一项实验发现,OpenAI的o1预览模型比 DeepSeek、Moonshot和阿里巴巴的实验模型更快找到了答案。在一个假设的双人游戏中涉及策略的字谜中,OpenAI程序在10秒内给出了答案,而DeepSeek花了两分钟多时间。

在第一次尝试中获得正确答案仍然是一项壮举,因为文字问题经常难倒人工智能程序。

自2022年以来,中国人工智能开发人员一直面临美国对世界上最先进的人工智能芯片的限制,包括芯片领导者英伟达(Nvidia)的芯片。在12月,拜登政府再次收紧出口管制规定。

但《华尔街日报》称,开发人员已经找到了变通途径。在由阿里巴巴和腾讯支持的初创公司Moonshot,创始人杨植麟表示,该公司专注于强化学习,模仿人类的试错过程。这种方法可能在提高性能方面较少地使用计算能力。

自去年年底以来,人工智能开发人员越来越多使用一种名为“混合专家模型”(Mixture of Experts, MoE)的技术,这种技术能降低对芯片的需求。

腾讯表示,11月发布的MoE模型的性能堪比Facebook母公司Meta Platforms今年7月推出的Llama 3.1模型。审阅了两家公司发表的论文的研究人员表示,腾讯的模型可能是用Meta使用的大约十分之一的计算能力训练的。

DeepSeek最初是High-Flyer的人工智能研究部门。High-Flyer是一家拥有80亿美元资产的量化对冲基金管理公司,以利用人工智能进行交易而闻名。2021年,DeepSeek将大约1万块英伟达的A100芯片连接起来,形成了一个用于人工智能训练的集群,该集群被称为Fire-Flyer 2。

在今年8月发表的一篇论文中,DeepSeek表示,Fire-Flyer 2的性能接近英伟达包含类似芯片的系统,但中国的系统成本更低,能耗更低。DeepSeek在5月份发表的关于其MoE模型的论文在业界引起了广泛关注,该模型采用了一种更有效地处理数据的技术。

人工智能初创公司Anthropic的联合创始人Jack Clark在他的博客中写道:“中国绕过出口管制的一种方法是,利用它可以访问的硬件建立非常好的软件和硬件培训。”

Clark称:“‘中国制造’将成为人工智能模型的一部分,就像电动车、无人机和其他技术一样。”

《华尔街日报》指出,许多中国人工智能开发人员已经找到获取受限制的英伟达芯片的方法,包括通过与中间商和海外数据中心的交易。尽管如此,据中国高管称,缺乏尖端芯片对中国初创企业来说是痛苦的,而且差距还会扩大。英伟达的客户正准备大规模部署其最新的人工智能数据中心芯片Blackwell。

马斯克(Elon Musk)的xAI公司已经用10万块英伟达芯片建造了一个数据中心,最近还筹集了50亿美元来做更多的事情。亚马逊网络服务公司(Amazon Web Services)计划用数十万块本土芯片打造一台大型人工智能超级计算机。

专注于开源模型的DeepSeek强调数学和编码。Moonshot凭借其类似ChatGPT的聊天机器人Kimi在中国消费者中广受欢迎,并以其处理长文本的能力而闻名。

1. 欢迎转载,转载时请标明来源为FX168财经。商业性转载需事先获得授权,请发邮件至:media@fx168group.com。
2. 所有内容仅供参考,不代表FX168财经立场。我们提供的交易数据及资讯等不构成投资建议和依据,据此操作风险自负。
go