近日,中国量化巨头幻方量化旗下的大模型公司DeepSeek推出的新模型DeepSeek-R1,在数学、编程和推理等关键领域的表现能与OpenAI的最强推理模型相媲美,且训练费用仅为OpenAI最新大模型的三十分之一,这一消息在人工智能领域掀起了轩然大波。然而,随之而来的争议和数据隐私问题,也让DeepSeek站在了风口浪尖。
OpenAI宣称DeepSeek违规“蒸馏”,但没有给出证据
据报道,OpenAI宣称发现了证据表明DeepSeek使用其专有模型来训练自己的模型,违反了服务条款中的“蒸馏”禁令。所谓“蒸馏”,即将较大、功能较强的模型的知识提炼到较小的模型中,以降低成本,这在行业中虽然常见,但OpenAI的服务条款明确禁止了这种做法。美国官员甚至将DeepSeek的行为称为“偷窃”,并对其展开了国家安全调查。但有趣的是,就在本周早些时候,特朗普还称 DeepSeek 是很积极的技术成果,态度的转变令人捉摸不透 。
此外,DeepSeek应用在意大利的Google Play和苹果App Store中已被下架,尽管确切原因未知,但猜测可能与意大利隐私监管机构Garante此前对DeepSeek提出的数据隐私问题有关。Garante表示,正要求DeepSeek提供关于个人数据使用问题的解释,希望了解DeepSeek收集了哪些个人数据、从哪些来源收集、用于什么目的、基于什么法律依据,以及是否存储在中国。
面对DeepSeek引发的争议,美国海军已要求人员避免以任何形式使用DeepSeek模型,基于“潜在安全和道德问题”。而白宫也在评估DeepSeek对美国国家安全的影响,并表示正在努力确保美国人工智能的主导地位。
尽管如此,DeepSeek的创新仍得到了部分业界的认可。阿斯麦CEO称DeepSeek的出现是好消息,对人工智能荣景乐观不改。他认为,降低成本对阿斯麦是好事,成本降低意味着AI可以有更多应用,更多应用就意味着更多芯片。随着AI变得越来越普遍,AI芯片将无处不在。
DeepSeek的成功引发资本市场对算力增长展望的担忧
然而,DeepSeek的成功也引发了资本市场对算力增长展望的担忧。华泰证券研报称,DeepSeek发布R1模型及相关应用,以较低的训练成本达到与现有前沿模型相当的效果,有望降低现有模型的训练和推理成本。但这也让市场对算力投资产生了担忧,特别是在Scaling Law放缓的大背景下,中美在大模型技术上的差距有望缩小的背景下。
微软CEO纳德拉却在电话会上强调,DeepSeek R1模型有“真创新”,AI成本下降是趋势:“缩放定律(Scaling Law)在预训练和推理时间计算中不断积累。多年来,我们已经看到了AI训练和推理方面的效率显著提高。在推理方面,我们通常看到每一代硬件的性价比提高2倍以上,每一代模型的性价比提高10倍以上。”
Meta CEO扎克伯格在Meta Platforms分析师电话会议上则表示,现在就对DeepSeek相关新闻对基础设施和资本支出的影响发表看法还为时过早。
对于本周发生在美股市场上的AI算力股大跌,美联储主席鲍威尔试图淡化这一冲击带来的宏观影响。他表示:“对于人工智能,这是股市里的重大事件,对我们来说真正重要的是宏观的发展。这意味着金融条件发生重大变化,并且这种变化在一段时间内是持续的。”
高盛集团策略师认为,本周初由科技股引领的美股抛售只是一时的。此番暴跌并非股市持续走低的先兆,未来12个月发生经济衰退忧虑所引发的利润下降预期的可能性较低。