泰勒·科恩是Bloomberg Opinion专栏作家,美国乔治·梅森大学经济学教授,也是Marginal Revolution博客的主持人。他在彭博的专栏中写道,中国一款有前景的新模型显示,人工智能的创新未必依赖最新芯片。
近年来,人工智能领域的突破频频出现,几乎让人难以区分哪些是真正重要的进展,哪些只是偶然的成果。
但最近的一项新发展值得特别关注:中国推出了一款新的大型语言模型DeepSeek-V3,其意义不仅关乎技术,还涉及贸易领域。
我已经试用了DeepSeek好几天,在过去几年接触过的数十款大型语言模型中,它是表现最好的之一:运行快速、使用便捷,还有免费版本。
虽然在复杂或困难问题的处理上还达不到美国顶级模型的水平,但我认为它可以跻身顶级行列。这一点也得到了其他测试者的认可。
DeepSeek还有一些值得注意的特点。首先,开发商并非科技公司,而是由一家对冲基金(尽管这类分类可能需要重新定义)。
其次,据报道,其训练成本非常低,某些估算显示仅耗资约550万美元(不包括计算设备以外的成本,这通常是计算标准之一)。
最值得注意的是,DeepSeek并未使用最高质量的半导体芯片。拜登政府一直努力限制此类芯片对华出口,原因是出于国家安全考量。
美国希望通过这一措施延缓中国在人工智能及相关军事技术领域的进步。由于无法获得最新的芯片,DeepSeek只能寻找其他不同且更便宜的方式来训练其模型。
过去,我支持这些贸易限制措施,因为人工智能技术是国家安全的重要领域。但现在,我认为这些禁令的目标过于雄心勃勃,难以奏效。
禁令或许确实延缓了中国在人工智能领域的进展几年,但同时也促成了一个重要的中国创新——DeepSeek。
如今,全世界都知道,一个高质量的人工智能系统可以用相对较少的资金训练出来。这让类似的人工智能系统进入了更多国家的现实视野,例如俄罗斯、伊朗、巴基斯坦等国。
甚至可以想象,一些外国亿万富翁可能会发起类似的计划,尽管人员配置仍是一个限制因素。尽管中国系统及潜在用途带来的风险值得担忧,但受到DeepSeek启发的其他国家的衍生项目,可能会更加令人不安。
找到更便宜的方法来构建人工智能系统,几乎是迟早的事。但我们可以思考这样的权衡:美国政策在妨碍中国在人工智能系统中部署高质量芯片方面取得了成效,这对国家安全有一定益处。但同时,这也加速了那些不依赖最高质量芯片的有效人工智能系统的发展。
这种权衡是否最终有利,仍然需要时间来验证。不仅是狭义上的问题——尽管围绕DeepSeek的动机、定价策略、未来计划以及它与中国政府之间的关系,还有许多未解或无法解答的问题。从更广义的层面来看,这种权衡的结果也不确定。
借用奥地利经济学家路德维希·冯·米塞斯的话:“政府的干预往往会产生重要的意外次级后果。”
要判断一项政策是否奏效,不仅要考虑它的直接影响,还需要考虑其二级和三级效应。
芯片出口限制的一个次生影响是,可能促使一些中国企业通过第三方国家获取高质量芯片,或者租用使用高质量芯片的非中国人工智能系统的运算资源。
在这种情况下,中国企业在某些用途上甚至无需直接购买芯片。美国正在通过进一步的行业管控措施进行应对,但美国政府是否真的能够精确掌控一个全球化的市场?
对此我越来越怀疑。
在考虑对中国实施更多贸易限制时,当选总统特朗普的政府需要认真研究其前任政策的意外后果。可以肯定的是,在某些(但不是所有)非人工智能领域的贸易限制中,国家安全确实有一定的合理性。然而,任何政策的一阶影响往往并不是故事的全部。
例如,如果联邦政府决定限制或对在美国销售的中国商品或服务征税,中国可能会通过第三方重新包装销售同样的产品,许多亚洲国家对此都乐意协助。规避规则的企业家往往比官僚部门行动得更迅速。
从理论上看,国家安全的论点具有很大的说服力。然而在现实中,设计有效保护国家安全的政策却极其困难。关键在于如何深入思考,以便让政策实践更好地符合理论目标。