全球数字财富领导者
财富汇
|
美股投研
|
客户端
|
旧版
|
北美站
|
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
SFFE2030
外汇开户
登录 / 注册
搜 索
综合
行情
速递
日历
话题
168人气号
文章
DeepSeek崛起挑战AI巨头,美股科技股遭遇“黑色星期一”
go
lg
...
遍全球的AI公司DeepSeek推出的
新
模型
有关。 DeepSeek
新
模型
横空出世,科技AI巨头估值受挑战 DeepSeek,这家在AI领域迅速崛起的公司,近期推出了一款全新的低成本AI模型。这款模型以极低的成本实现了与OpenAI的o1模型相当的性能,这一消息无疑给市场带来了巨大的震撼。简而言之,DeepSeek的
新
模型
在性能上与OpenAI的o1模型旗鼓相当,但成本却连后者的零头都不到。 这一突破性的成就,无疑让市场对科技AI巨头的估值产生了深深的担忧。分析人士指出,DeepSeek在有限的硬件资源下实现了顶尖的模型性能,这大大减少了对高端GPU的依赖。而低廉的训练成本,则预示着AI大模型对算力投入的需求将大幅下降。这一变化,无疑将对整个AI产业产生深远的影响。 DeepSeek应用火爆全球,多次宕机显实力 DeepSeek的
新
模型
不仅在技术上取得了突破,其在市场上的表现也是异常火爆。1月27日,DeepSeek在苹果App Store美国区免费应用下载榜上成功超越ChatGPT,登顶榜首。在中国区排行榜上,DeepSeek也同样登顶,成为了当之无愧的AI应用王者。 然而,持续爆火的DeepSeek也遭遇了不小的挑战。由于用户量激增,DeepSeek多次出现宕机情况。1月27日晚20点左右,DeepSeek服务状态页面显示,其网页不可用,公司正在紧急调查这一问题。多位网友纷纷表示,DeepSeek崩了,无法正常使用。实测发现,当时DeepSeek确实无法回答对话问题,让不少用户感到焦急。 不过,DeepSeek的反应速度也是相当迅速。20点55分,DeepSeek对话服务已经恢复,虽然账号服务仍存在问题,用户可能无法登录及注册,但这一进展无疑让不少用户看到了希望。21点05分,DeepSeek再次更新称,将继续监测故障,确保服务的稳定运行。 DeepSeek崛起带动中国科技资产,中概科技股逆势走强 在美股科技股暴跌的同时,中概科技股却逆势走强,成为了一道亮丽的风景线。截至发稿时,纳斯达克中国金龙指数一度涨超0.5%,表现出了强劲的抗跌能力。其中,金山云涨幅超过10%,百度集团涨幅也超过了4%。 这一表现无疑与DeepSeek的崛起密切相关。作为中国科技资产的代表之一,DeepSeek的成功不仅让全球看到了中国在AI领域的实力,也带动了整个中国科技板块的上涨。可以预见,在未来的日子里,随着DeepSeek等中国科技企业的不断发展壮大,中国科技资产在全球市场的地位也将不断提升。 结语 周一晚间的美股市场无疑经历了一场惊心动魄的暴跌。而这场暴跌的背后,则是DeepSeek等新兴AI企业的崛起对科技AI巨头估值的挑战。随着科技的不断发展进步,未来的市场格局也将不断发生变化。投资者需要密切关注市场动态,及时调整投资策略,以应对可能的风险和机遇。而DeepSeek等中国科技企业的崛起,无疑将为全球金融市场带来更多的变数和可能性。
lg
...
金融界
01-28 08:14
蛇年行情如何演绎?科创AIETF(588790)成交额破2亿,或指向人工智能2025新机遇!
go
lg
...
行二次蒸馏训练等。我们实际使用后认为,
新
模型
实际表现优秀,训练成本更低,国产优质模型的开源模式有望推动AI从“寡头游戏”转向“全民创新”,长期来看可能重塑产业格局,促进更公平、高效、可持续的AI发展路径。 以上内容与数据,与界面有连云频道立场无关,不构成投资建议。据此操作,风险自担。
lg
...
有连云
01-27 16:40
这家中国人工智能初创公司超过ChatGPT 在Apple App Store上成为评分最高的免费应用程序
go
lg
...
出全新的 DeepSeek V2.5
新
模型
。2024年12月13日,发布用于高级多模态理解的专家混合视觉语言模型——DeepSeek-VL2。 2024年12月26日晚,AI公司深度求索(DeepSeek)正式上线全新系列模型DeepSeek-V3首个版本并同步开源。12月30日,中信证券研报指出,DeepSeek-V3的正式发版引起AI业内广泛高度关注,其在保证了模型能力的前提下,训练效率和推理速度大幅提升。 中信证券研报评价DeepSeek-V3,“DeepSeek新一代模型的发布意味着AI大模型的应用将逐步走向普惠,助力AI应用广泛落地;同时训练效率大幅提升,亦将助力推理算力需求高增。我们持续看好AI产业链的加速落地机遇,建议重点关注AI应用、AI Infra、AI算力三大主线。”
lg
...
Heidi
01-27 15:42
国产AI大模型震撼硅谷,科创AIETF(588790)成交额超1.5亿元
go
lg
...
行二次蒸馏训练等。我们实际使用后认为,
新
模型
实际表现优秀,训练成本更低,国产优质模型的开源模式有望推动AI从“寡头游戏”转向“全民创新”,长期来看可能重塑产业格局,促进更公平、高效、可持续的AI发展路径。 以上内容与数据,与界面有连云频道立场无关,不构成投资建议。据此操作,风险自担。
lg
...
有连云
01-27 13:29
“神秘的东方力量”DeepSeek一夜爆火,让对手恐慌!超越ChatGPT 登顶苹果美国区免费APP下载排行榜,多只概念股涨停
go
lg
...
分钟内就得到了解决。此次事件可能是由于
新
模型
发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。 就在1月26日晚间,游戏科学创始人、黑神话悟空制作人冯骥甚至在社交媒体上发文力推DeepSeek大模型,其表示DeepSeekV3大模型已经用了一个月,DeepSeekR1大模型用了5天,DeepSeek在推理能力、训练开销与使用费用、开源、免费、联网、本土化都等六方面全部实现突破。 冯骥写到,希望DeepSeek R1会让你对当前最先进的AI祛魅,让AI逐渐变成你生活中的水和电。“太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步”,冯骥表示。
lg
...
金融界
01-27 10:19
国运级别的科技成果!黑神话悟空制作人冯骥深夜发声,力推DeepSeek大模型
go
lg
...
分钟内就得到了解决。此次事件可能是由于
新
模型
发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。不过,官方状态页并未将这一事件标记为事故。 值得注意的是DeepSeek-R1 API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元,输出API价格只有OpenAI o1的3%。低价背后,显然仍是秀肌肉,价格实力展现了技术实力——从AIInfra 层面降本的技术能力。 以下为冯骥具体观点: 游戏科学创始人、黑神话悟空制作人冯骥: 年前还是认真推下DeepSeek吧。 V3已经用了一个月,但R1仅仅用了5天,不得不来发这条微博。 先讲一句暴论:DeepSeek,可能是个国运级别的科技成果。 为了讲清楚这个成果有多惊人,我打个比方:如果有一个AI大模型做到了以下的任何一条,都是超级了不起的突破—— 1、强大。比肩O1的推理能力,暂时没有之一 2、便宜。参数少,训练开销与使用费用小了一个数量级 3、开源。任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的mini模型。 4、免费。官方目前提供的服务完全免费,任何人随时随地可用 5、联网。暂时唯一支持联网搜索的推理模型(o1还不支持) 6、本土。深度求索是一家很小规模的年轻中国公司,由没有海外经历甚至没有资深从业经验的本土团队开发完成 上面的六条,DeepSeek全部、同时做到了。 实在太6了,6到不真实。 如果这都不值得欢呼,还有什么值得欢呼? 那么,现在看到这条微博的你应该去做什么呢? 1、请直接访问:网页链接 马上用起来,也有移动APP 2、使劲用,疯狂用,尝试用它基本取代传统搜索。请想象你已经认识每个领域的顶尖专家,而且他们都是你随时在线的好朋友,把所有可能需要“请教别人”的问题,都拿去先问它——无论是构建一个复杂函数,搞清楚附近哪个游泳池最好,检查合同里的法律陷阱,让新写的歌词再押韵点,或者帮父母确认某个保健品是否真的有效 3、去看看别人是怎么用的,去试试其他大模型,了解AI擅长什么,不擅长什么,如何调教,然后继续解锁与迭代属于自己的用法与更多工具 希望DeepSeek R1会让你对当前最先进的AI祛魅,让AI逐渐变成你生活中的水和电。 太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。 知识与信息平权,至此又往前迈出了坚实的一步。
lg
...
金融界
01-27 08:00
利空英伟达?国产DeepSeek大模型震动全球AI圈,周末疯狂刷屏,量化私募巨头成功跨界AI!网名调侃:中国股民做出贡献
go
lg
...
不仅将模型训练成本大幅降低,而且发布的
新
模型
R1也同步开源模型权重,公开了完整训练细节,挑战了闭源系统的优势。随着DeepSeek将AI大模型技术及使用门槛降低,有市场人士担忧,DeepSeekR1的崛起可能会削弱市场对英伟达AI芯片需求的预期,对英伟达的市场地位和战略布局产生影响。 有观点认为,DeepSeek-V3极低的训练成本预示着AI大模型对算力投入的需求将大幅下降,这无疑将利空全球AI算力的核心供应商英伟达。 网名调侃:中国股民做出贡献 DeepSeek是国内量化巨头幻方量化的子公司。依靠DeepSeek的出色表现,量化巨头幻方量化创始人梁文锋也迅速奠定了在AI圈地位。 梁文锋本硕均就读于浙江大学信息与电子工程学专业。2015年,梁文锋与校友共同创立幻方量化。2021年,幻方量化成为国内首家突破千亿规模的的量化私募大厂,被称为国内量化私募“四大天王”之一。早年,幻方量化开始大规模布局 AI 算力,搭建起“萤火一号”集群。2021年,“萤火二号”落成,这给了DeepSeek快速奔跑的底层支撑。 对此,有人调侃,中国股民给世界AI最大的的贡献就是让幻方量化赚了那么多钱。然后幻方量化创始人有钱买最好的GPU,收纳一批中国最牛的精英,做出了不错的Deepseek。
lg
...
金融界
01-26 17:13
豆包模型毛利率已达50%!政策引导中长期资金入市,“进攻旗手”软件、芯片纷纷大涨!
go
lg
...
型1.5Pro版本正式发布。豆包表示,
新
模型
综合能力显著增强,低训练/推理成本,高效模型结构,全面提升多模态能力、推理能力,多项公开评测基准上全球领先。模型训练过程中,未使用任何其他模型生成的数据,扎实不走“捷径”。知情人士此前表示,豆包大模型去年大幅降价后,毛利率依然为正。其中,字节跳动最新推出的豆包大模型1.5,在推理成本优化上取得进一步突破。在火山引擎上售卖API的Doubao-1.5-pro,毛利率仍能达到50%。 计算机板块内,截至发稿,有“进攻旗手”之称的软件50ETF(159590)涨2.69%,开盘涨幅一度超3%,最新价报0.994元,换手率3.47%,交投活跃!成分股彩讯股份涨超11%,同花顺涨超6%,润和软件、财富趋势涨超4%,指南针、中国软件、恒生电子涨超3%,中科创达涨超2%,科大讯飞涨超1%。 数据显示,软件50ETF(159590)近20日录得资金净流入超2400万元,年初至今份额增长率4.61%,位居同指数首位! 芯片板块内,费率最低的芯片50ETF(560850)涨近1%,盘中一度震荡涨近2%,成交额已超800万元,近5日有2日录得资金净流入!成分股中,士兰微涨超4%,北方华创涨超2%,中芯国际、中微公司、景嘉微、圣邦股份涨超1%,兆易创新、澜起科技、韦尔股份、通富微电微涨。下跌方面,瑞芯微、晶晨股份跌超1%,兆易创新、寒武纪、海光信息、长电科技微跌。 【机构:美国启动“星际之门”项目,继续推荐算力产业链】 开源证券表示,1月22日,美新人总统宣布,将与OpenAI、甲骨文和软银合作,共同投资5000亿美元用于支持美国的人工智能基础设施建设,初期投资为1000亿美元。这个项目名为“星际之门”(Stargate),美新任总统、软银首席执行官孙正义、OpenAI首席执行官山姆·奥特曼以及甲骨文联合创始人拉里·埃里森等人共同出席了发布会,奥特曼称“这将是这个时代最重要的项目”。AI已经成为大国之间科技竞争的高地,Stargate项目也可以看出美国对AI基建的高度重视。 国内互联网厂商资本开支回暖,重点发力AI基建。2023年以来,腾讯、阿里等互联网厂商资本开支明显回暖,2023Q3-2024Q2阿里营业资本支出同比增速分别为-62.47%、25.77%、304.85%和98.75%;腾讯资本开支同比增速分别为236.8%、33.1%、225.5%、120.8%,判断AI算力或为投资重点。此外,据了解字节跳动计划2025年在人工智能基础设施上投入逾120亿美元,其中,字节跳动已为2025年在中国购买人工智能芯片编列了400亿人民币(55亿美元)的预算,是2024年支出的两倍。公司还计划在海外投资约68亿美元,加强基础模型训练能力。(来源:开源证券20250122《美国启动“星际之门”项目,继续推荐算力产业链》) 【机构:美芯片限制强化,自主可控主线凸显】 信达证券表示,AI芯片出口限制落地,国产AI算力芯片大有可为。1月13日,美有关部门正式发布了关于人工智能扩散的临时最终规则,根据机构计算,目前主流AI芯片和即将推出的AI芯片均在新规出口管制范围内。信达证券认为,随着美政府陆续推出限制中国半导体政策,自主可控重要性凸显。制裁升级或将加速国产替代节奏,产业链核心环节在自主可控大趋势下仍具备较大成长空间。(来源:信达证券20250120《半导体行业专题研究:美国芯片制裁不断强化,自主可控主线凸显》) 硬件为基,软件为核。软件50ETF(159590)紧跟中证全指软件指数,一键布局软件全产业链。指数精选50只成分股,对于基础软件、应用软件、软件服务覆盖全面:约67%权重为应用软件,15%以上为AI相关领域,信息安全占10%,其余约7%为信息技术和基础软件。 一键布局“科技之矛”,首选芯片50ETF(516920),联接基金(A类:020630;C类:020631)。芯片50ETF(516920)跟踪的中证芯片产业指数囊括了芯片板块的50只龙头股,综合覆盖设备材料、晶圆代工、设计、封测等芯片全产业链环节。此外,芯片50ETF(516920)的管理费率为0.15%,托管费率0.05%,为芯片主题ETF中费率最低的品种! 风险提示:任何在本文出现的信息,包括但不限于个股、评论、预测、图表、指标、理论、任何形式的表述等均只作为参考,投资人须对任何自主决定的投资行为负责。另,本文中的任何观点、分析及预测不构成对阅读者任何形式的投资建议,本公司亦不对因使用本文内容所引发的直接或间接损失负任何责任。软件50ETF、芯片50ETF属于中等风险等级(R3)产品,适合经客户风险等级测评后结果为平衡型(C3)及以上的投资者。标的指数并不能完全代表整个股票市场。标的指数成份股的平均回报率与整个股票市场的平均回报率可能存在偏离。基金投资有风险,基金的过往业绩并不代表其未来表现,投资需谨慎。请投资者关注指数化投资的风险以及集中投资于中证信息技术应用创新产业指数成份股的持有风险,请关注部分指数成份股权重较大、集中度较高的风险,请关注指数化投资的风险、ETF运作风险、投资特定品种的特有风险等。 以上内容与数据,与界面有连云频道立场无关,不构成投资建议。据此操作,风险自担。
lg
...
有连云
01-23 10:53
Variant:为什么更好的AI需要Crypto
go
lg
...
以对模型进行微调,或者将模型的输出用作
新
模型
的输入。 虽然 Meta 公布了 LLaMa 的权重值得称赞,但它并不是一个真正的开源软件项目。Meta 在私下使用自己的计算、数据和决策来训练模型,并单方面决定何时向全世界开放该模型。Meta 不邀请独立研究人员 / 开发人员参与社区,因为单个社区成员无法负担训练或重新训练模型所需的计算或数据资源——数以万计的高内存 GPU、容纳它们的数据中心、大量冷却基础设施,以及数万亿的训练数据代币。正如斯坦福大学 2024 年AI指数报告所述,“培训费用的不断上涨实际上已经将大学(传统上是AI研究中心)排除在开发自己的前沿基础模型之外。”为了了解成本,Sam Altman 提到 GPT-4 的培训成本为 1 亿美元,而且可能还不包括资本支出;Meta的资本支出同比增长 21 亿美元(2024 年第二季度 vs. 2023 年第二季度),主要来自对与训练 AI 模型相关的服务器、数据中心和网络基础设施的投资。因此,虽然 LLaMa 的社区贡献者可能具有在基本模型架构上做出贡献和迭代的技术能力,但他们仍然缺乏这样做的手段。 总而言之,与传统的开源软件项目不同,开源软件项目仅要求贡献者贡献时间,而开源 AI 项目的贡献者则被要求以计算和数据的形式贡献时间和大量成本。依靠善意和志愿服务来激励足够多的各方提供这些资源是不现实的。他们需要进一步的激励。176B 参数开源 LLM BLOOM的成功可能是善意和志愿服务对开发开源 AI 的优点的最佳反例,它涉及来自 70 多个国家和 250 多个机构的 1000 名志愿研究人员。虽然这无疑是一项令人印象深刻的成就(我完全支持),但协调一次训练运行花了一年时间,并从法国研究机构获得了 300 万欧元的资助(而且这笔费用不包括用于训练模型的超级计算机的资本支出,其中一个法国机构已经可以使用它)。协调和依靠新拨款来迭代 BLOOM 的过程过于繁琐和官僚主义,无法与大型科技实验室的步伐相媲美。虽然 BLOOM 发布已有两年多时间,但我不知道这个集体是否制作了任何后续模型。 为了使开源AI成为可能,我们需要激励资源提供者贡献他们的计算和数据,而无需开源贡献者承担费用。 为什么Crypto可以解决开源AI的资源问题 Crypto 的突破在于利用所有权使资源成本较高的开源软件项目成为可能。Crypto 通过激励具有网络潜在上升空间的投机资源提供者,而不是要求开源贡献者预先支付成本来提供这些资源,从而解决了开源 AI 固有的资源问题。 要证明这一点,只需看看最初的加密项目比特币。比特币是一个开源软件项目;运行它的代码是完全开放的,从项目开始的那一天起就一直如此。但代码本身并不是秘密武器;下载并运行比特币节点软件来创建仅存在于本地计算机上的区块链并没有多大用处。只有当计算挖掘区块的数量足够超过任何单个贡献者的计算能力时,该软件才有用。只有这样,软件的增值才能实现:维护一个无人控制的账本。与基金会开源 AI 一样,比特币也代表了一个开源软件项目,它需要超出任何单个贡献者能力的资源。他们可能出于不同的原因需要这种计算——比特币是为了使网络防篡改,而基金会 AI 是为了迭代模型——但更广泛的一点是,它们都需要超出任何单个贡献者需求的资源才能作为可行的开源软件项目发挥作用。 比特币,或者说任何加密网络,用来激励参与者为开源软件项目提供资源的魔术技巧是以代币形式提供网络所有权。正如 Jesse早在 2020 年为 Variant 撰写的创始论文中所写的那样,所有权激励资源提供者为项目贡献资源,以换取网络的潜在上行空间。这类似于如何利用汗水股权来启动一家刚刚起步的公司——通过主要通过对企业的所有权来支付早期员工(例如创始人)的工资,初创公司可以通过获得原本无法负担的劳动力来克服启动问题。加密将汗水股权的概念扩展到资源提供者,而不仅仅是那些奉献时间的人。因此,Variant 专注于投资利用所有权建立网络效应的项目,例如 Uniswap、Morpho 和 World。 如果我们想让开源 AI 成为可能,那么通过crypto实现所有权就是解决其面临的资源问题的办法。研究人员可以自由地将他们的模型设计想法贡献给开源项目,因为实现他们的想法所需的资源将由计算和数据提供商提供,以换取他们对项目的所有权,而不是要求这些研究人员支付高昂的前期成本。所有权在开源 AI 中可以采取多种不同的形式,但我最兴奋的是模型本身的所有权,就像Pluralis提出的方法一样。 Pluralis 将这种方法称为协议模型,其中计算提供商可以贡献计算资源来训练特定的开源模型,并获得该模型未来推理收入的所有权。由于所有权属于特定模型,并且所有权的价值基于推理收入,因此计算提供商有动力选择最佳模型,而不是欺骗训练(因为提供无用的训练会降低未来推理收入的预期价值)。那么问题就变成了:如果需要将权重发送给计算提供商进行训练,如何在 Pluralis 上强制执行所有权?答案是模型并行性用于在工作者之间分配模型分片,从而允许利用神经网络的一个关键属性:可以为训练更大的模型做出贡献,同时只能看到总权重的一小部分,从而确保完整的权重集仍然不可提取。而且由于在 Pluralis 上训练了许多不同的模型,训练者将拥有许多不同的权重集,这使得重新创建模型变得极其困难。这是协议模型的核心概念:它们是可训练的,可以使用,但无法从协议中提取(不使用比从头训练模型所需的更多的计算能力)。这解决了开源AI批评者经常提出的一个担忧,即封闭的AI竞争对手将占用开放项目的劳动成果。 为什么Crypto+开源=更好的AI 我在这篇文章的开头描述了大科技公司控制的问题,以从规范的角度说明为什么封闭式AI是坏的。但在一个我们的在线体验带有宿命论色彩的世界里,我担心这对大多数读者来说可能毫无意义。所以最后我想给出两个理由,即由加密支持的开源AI实际上将带来更好的人工智能。 首先,Crypto和开源 AI 的结合将使我们能够达到下一层基础模型,因为它将比封闭式 AI 协调更多的资源。我们目前的研究表明,以计算和数据形式存在的更多资源意味着更好的模型,这就是基础模型通常会变得越来越大的原因。比特币向我们展示了开源软件加上加密在计算能力方面所释放的东西。它是世界上最大、最强大的计算网络,比大型科技公司的云大几个数量级。加密将孤立的竞争变成了合作竞争。资源提供者被激励贡献他们的资源来解决集体问题,而不是囤积他们的资源来单独(和冗余地)解决该问题。使用加密的开源 AI 将能够利用世界集体计算和数据来构建远远超出封闭式 AI 可能的模型大小。像Hyperbolic这样的公司已经展示了利用集体计算资源的力量,任何人都可以以更低的价格在他们的开放市场上出租 GPU。 其次,将Crypto和开源 AI 结合起来将推动更多创新。这是因为,如果我们能够克服资源问题,我们就可以回归机器学习研究的高度迭代和创新的开源性质。在最近推出基础 LLM 之前,机器学习研究人员几十年来一直公开发布他们的模型和复制模型的蓝图。这些模型通常使用更有限的开放数据集,并且具有可管理的计算要求,这意味着任何人都可以对它们进行迭代。正是通过这种迭代,我们在序列建模方面取得了进展,例如 RNN、LSTM 和注意力机制,这使得当前基础 LLM 所依赖的“Transformer”模型架构成为可能。但随着 GPT-3 的推出(它逆转了 GPT-2 开源的趋势)和 ChatGPT 的巨大成功,这一切都发生了变化。这是因为 OpenAI 证明,如果你在海量模型上投入足够的计算和数据,你就可以构建似乎能理解人类语言的 LLM。这造成了资源问题,导致学术界无法负担高昂的价格,并导致大型科技公司实验室基本停止公开发布其模型架构以保持竞争优势。目前主要依赖个别实验室的状态将限制我们突破最先进技术界限的能力。通过加密技术实现的开源 AI 将意味着研究人员将再次能够在尖端模型上继续这一迭代过程,以发现“下一个transformer”。
lg
...
金色财经
01-17 12:02
彭博观点:中国出现了DeepSeek,表明特朗普的贸易战和拜登复杂的技术封锁难以见效
go
lg
...
他在彭博的专栏中写道,中国一款有前景的
新
模型
显示,人工智能的创新未必依赖最新芯片。 近年来,人工智能领域的突破频频出现,几乎让人难以区分哪些是真正重要的进展,哪些只是偶然的成果。 但最近的一项新发展值得特别关注:中国推出了一款新的大型语言模型DeepSeek-V3,其意义不仅关乎技术,还涉及贸易领域。 我已经试用了DeepSeek好几天,在过去几年接触过的数十款大型语言模型中,它是表现最好的之一:运行快速、使用便捷,还有免费版本。 虽然在复杂或困难问题的处理上还达不到美国顶级模型的水平,但我认为它可以跻身顶级行列。这一点也得到了其他测试者的认可。 DeepSeek还有一些值得注意的特点。首先,开发商并非科技公司,而是由一家对冲基金(尽管这类分类可能需要重新定义)。 其次,据报道,其训练成本非常低,某些估算显示仅耗资约550万美元(不包括计算设备以外的成本,这通常是计算标准之一)。 最值得注意的是,DeepSeek并未使用最高质量的半导体芯片。拜登政府一直努力限制此类芯片对华出口,原因是出于国家安全考量。 美国希望通过这一措施延缓中国在人工智能及相关军事技术领域的进步。由于无法获得最新的芯片,DeepSeek只能寻找其他不同且更便宜的方式来训练其模型。 过去,我支持这些贸易限制措施,因为人工智能技术是国家安全的重要领域。但现在,我认为这些禁令的目标过于雄心勃勃,难以奏效。 禁令或许确实延缓了中国在人工智能领域的进展几年,但同时也促成了一个重要的中国创新——DeepSeek。 如今,全世界都知道,一个高质量的人工智能系统可以用相对较少的资金训练出来。这让类似的人工智能系统进入了更多国家的现实视野,例如俄罗斯、伊朗、巴基斯坦等国。 甚至可以想象,一些外国亿万富翁可能会发起类似的计划,尽管人员配置仍是一个限制因素。尽管中国系统及潜在用途带来的风险值得担忧,但受到DeepSeek启发的其他国家的衍生项目,可能会更加令人不安。 找到更便宜的方法来构建人工智能系统,几乎是迟早的事。但我们可以思考这样的权衡:美国政策在妨碍中国在人工智能系统中部署高质量芯片方面取得了成效,这对国家安全有一定益处。但同时,这也加速了那些不依赖最高质量芯片的有效人工智能系统的发展。 这种权衡是否最终有利,仍然需要时间来验证。不仅是狭义上的问题——尽管围绕DeepSeek的动机、定价策略、未来计划以及它与中国政府之间的关系,还有许多未解或无法解答的问题。从更广义的层面来看,这种权衡的结果也不确定。 借用奥地利经济学家路德维希·冯·米塞斯的话:“政府的干预往往会产生重要的意外次级后果。” 要判断一项政策是否奏效,不仅要考虑它的直接影响,还需要考虑其二级和三级效应。 芯片出口限制的一个次生影响是,可能促使一些中国企业通过第三方国家获取高质量芯片,或者租用使用高质量芯片的非中国人工智能系统的运算资源。 在这种情况下,中国企业在某些用途上甚至无需直接购买芯片。美国正在通过进一步的行业管控措施进行应对,但美国政府是否真的能够精确掌控一个全球化的市场? 对此我越来越怀疑。 在考虑对中国实施更多贸易限制时,当选总统特朗普的政府需要认真研究其前任政策的意外后果。可以肯定的是,在某些(但不是所有)非人工智能领域的贸易限制中,国家安全确实有一定的合理性。然而,任何政策的一阶影响往往并不是故事的全部。 例如,如果联邦政府决定限制或对在美国销售的中国商品或服务征税,中国可能会通过第三方重新包装销售同样的产品,许多亚洲国家对此都乐意协助。规避规则的企业家往往比官僚部门行动得更迅速。 从理论上看,国家安全的论点具有很大的说服力。然而在现实中,设计有效保护国家安全的政策却极其困难。关键在于如何深入思考,以便让政策实践更好地符合理论目标。 来源:加美财经
lg
...
加美财经
01-11 00:00
上一页
1
•••
5
6
7
8
9
•••
32
下一页
24小时热点
【直击亚市】北京将被迫坐到谈判桌前!市场等中国进一步刺激,黄金又大跌了
lg
...
黑天鹅事件可能爆发!特朗普突传将被国会“弹劾”,究竟怎么回事?
lg
...
中美关税突传重大消息!特朗普语出惊人 比特币9.35万多头受阻、黄金3310避险回落
lg
...
中国国家主席习近平重大发声!事关在与美国竞争中的人工智能发展和监管
lg
...
突然向社群发话!昔日华人首富曝光“中本聪”真实身份……
lg
...
最新话题
更多
#Web3项目情报站#
lg
...
6讨论
#SFFE2030--FX168“可持续发展金融企业”评选#
lg
...
32讨论
#链上风云#
lg
...
82讨论
#VIP会员尊享#
lg
...
1917讨论
#CES 2025国际消费电子展#
lg
...
21讨论