全球数字财富领导者
美股投研
|
客户端
|
旧版
|
北美站
|
繁体
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
香港论坛
外汇开户
登录 / 注册
搜 索
综合
行情
速递
日历
话题
168人气号
文章
DeepSeek横空出世,中国AI震惊业界!芯片股回调,寒武纪探底回升,一度跌近10%,科创芯片50ETF(588750)跌超2%,溢价频现
go
产大模型公司深度求索正式发布推理大模型
DeepSeek
-
R
1。该模型因其可比肩OpenAI o1的性能、极低的服务价格,以及代码和模型架构的完全开源,震惊业界。 1月27日,Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。业内多位知名科技人士均对DeepSeek近期取得的成就表示赞叹。 同时,外界普遍认为,美国尖端芯片出口管制等限制并没有削弱中国的AI能力,反而似乎在推动DeepSeek等初创公司以优先考虑效率、资源池和协作的方式进行创新。R1的发布不仅表明中国AI企业在国际舞台崭露头角,还展示了中国在人工智能领域的巨大潜力。 中信证券指出,近日,DeepSeek-V3的正式发版引起AI业内广泛高度关注,其在保证了模型能力的前提下,训练效率和推理速度大幅提升。我们认为,DeepSeek新一代模型的发布意味着AI大模型的应用将逐步走向普惠,助力AI应用广泛落地;同时训练效率大幅提升,亦将助力推理算力需求高增。我们持续看好AI产业链的加速落地机遇。 受益于行业复苏和政策利好,2024年半导体行业并购重组热度不断升温。国内半导体市场,特别是作为半导体产业未来发展重点的封装领域,正逐渐成为新一轮投资热点。专家建议,在此过程中要进一步提升投资质量,推动半导体行业健康有序发展。 资料显示,科创板“含芯量”高,聚焦高精尖,可谓是A股芯片龙头“大本营”,近三年平均超九成数量的芯片类上市公司选择在科创板上市,平均市值占比高达96%!科创芯片50ETF(588750)跟踪复制科创芯片指数,涨跌幅弹性高达20%,覆盖芯片产业链核心环节,高纯度、高锐度、高弹性!指数季度调仓更有助于敏捷地反映芯片行业新发展、新趋势。科创芯片50ETF(588750)提供了低门槛布局科创芯片核心环节、高效把握“新质生产力”大行情的投资利器,抢反弹快人一步!场外投资者可关注联接基金(A:020628;C:020629),可7*24申赎。 风险提示:基金有风险,投资需谨慎。本资料仅为宣传材料,不作为任何法律文件。投资有风险,基金管理人承诺以诚实信用、勤勉尽职的原则管理和运用基金资产,但不保证基金一定盈利,也不保证最低收益。基金的过往业绩不预示未来表现,基金管理人管理的其他基金业绩并不构成基金业绩表现的保证,投资人应当仔细阅读《基金合同》、《招募说明书》及《产品资料概要》等法律文件以详细了解产品信息。标的指数并不能完全代表整个股票市场。标的指数成份股的平均回报率与整个股票市场的平均回报率可能存在偏离。基金资产投资于科创板股票,会面临科创板机制下因投资标的、市场制度以及交易规则等差异带来的特有风险,包括但不限于市场风险、流动性风险、科创板企业退市风险、政策风险等。基金可根据投资策略需要或市场环境的变化,选择将部分基金资产投资于科创板股票或选择不将基金资产投资于科创板股票,基金资产并非必然投资于科创板股票。本基金属于中高风险等级(R4)产品,适合经客户风险承受等级测评后结果为成长型(C4)及以上的投资者,客户-产品风险等级匹配规则详见汇添富官网。在代销机构认购时,应以代销机构的风险评级规则为准。 以上内容与数据,与界面有连云频道立场无关,不构成投资建议。据此操作,风险自担。
有连云
01-27 03:39
A股午评:创业板半日跌1.55% 算力硬件方向集体重挫,寒武纪、中际旭创等多股跌超4%
go
。1月20日,该公司正式发布推理大模型
DeepSeek
-
R
1。一经推出,
DeepSeek
-
R
1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。 机构观点 广发宏观:化债用专项债的发行进度预计将在一季度实现较快推进 2025年开年以来的财政节奏。整体来看,1月广义财政较去年同期有所加速:一是普通国债呈相对前倾趋势,1月关键期限国债发行额相较去年同期增加16%左右,从预期赤字规模看仍有进一步加速空间。二是项目建设类的新增专项债发行规模相较去年同期有所增加,但弱于近年1月平均水平,可能因专项债新规仍需学习时间,且去年部分专项债尚未用完;预计新增专项债2月发行环比增加,3月开工季开始加速。三是化债用的专项债,1月已发行1869亿元,2月已公布1055亿元,年后或将公布更多,2025年化债用专项债的发行进度预计将在一季度实现较快推进。简单来看,一季度发行结构大概率以化债类专项债为主,国债小幅前倾为辅;项目建设在开年以去年未使用资金支撑,至3月项目类专项债或开始加速,超长期特别国债或在两会后的3-4月始发。 东吴证券:以旧换新政策逐步落地,社零有望实现开门红 从1月前三个周的高频数据来看,ECI供给指数为50.45%,较12月回落0.09个百分点;ECI需求指数为49.89%,较12月回落0.03个百分点。从分项来看,ECI投资指数为50.01%,较12月回落0.01个百分点;ECI消费指数为49.47%,较12月回落0.03个百分点;ECI出口指数为50.40%,较12月回落0.06个百分点。从ECI指数来看,春节假期前供给端和需求端均延续季节性回落的特征,但在前期增量政策的支撑下,供需两端回落的幅度均小于去年同期,预计随着新一轮以旧换新政策在内的消费刺激政策逐步落地,经济增长有望在一季度实现开门红。消费方面,1月17日商务部等八部门下发了汽车以旧换新的细则通知,节前乘用车零售需求有所释放,而节前全社会跨区域人流量等出行数据的同比增长也表征服务消费景气度或有所回暖;地产方面,自月初以来主要城市商品房成交面积处于边际回落的态势,但与去年节前同期相比增长明显,可关注节后地产销售是否会初现“小阳春”的迹象;出口方面,受节前运输需求回落影响,海运价格指数延续下行,而韩国前20日出口增速转负则表征全球贸易需求在近期也有所走弱。
金融界
01-27 03:39
Deepseek周末刷屏!引爆AI概念股,人工智能ETF科创(588760)开盘获资金大举加仓!
go
初创企业DeepSeek发布最新模型“
DeepSeek
-
R
1”(以下简称R1),这一举动引起了全球AI行业的广泛关注。R1的发布不仅表明中国AI企业在国际舞台崭露头角,还展示了中国在人工智能领域的巨大潜力。从性能上来看,R1与OpenAI、Meta以及Anthropic等硅谷知名企业的大模型不相上下,但其收费仅为OpenAI o1的约三十分之一。 有市场观点认为,DeepSeek通过优化算法和架构,降低了训练和推理成本,可能使部分企业减少对传统算力集群的依赖,从而对算力市场的短期需求结构产生一定冲击。然而,从长期来看,AI技术仍在快速发展,多模态、复杂推理等新兴应用对算力的需求持续增长,同时,AI的普及也将推动算力需求的进一步爆发。 中信证券研报指出,近日,DeepSeek-V3的正式发版引起AI业内广泛高度关注,其在保证了模型能力的前提下,训练效率和推理速度大幅提升。我们认为,DeepSeek新一代模型的发布意味着AI大模型的应用将逐步走向普惠,助力AI应用广泛落地;同时训练效率大幅提升,亦将助力推理算力需求高增。我们持续看好AI产业链的加速落地机遇。 人工智能 ETF 科创(588760)紧密跟踪科创AI指数,可一键投资科创板30家人工智能企业,可谓纯AI投资利器。 以上内容与数据,与界面有连云频道立场无关,不构成投资建议。据此操作,风险自担。
有连云
01-27 02:20
“神秘的东方力量”DeepSeek一夜爆火,让对手恐慌!超越ChatGPT 登顶苹果美国区免费APP下载排行榜,多只概念股涨停
go
。1月20日,该公司正式发布推理大模型
DeepSeek
-
R
1。一经推出,
DeepSeek
-
R
1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。 作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。 值得一提的是,在2024年12月,DeepSeek-V3发布后,AI数据服务公司Scale AI创始人Alexander Wang就曾发贴称,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。” 今年1月24号,一条发布在匿名平台teamblind上的帖子疯传,让Deepseek的讨论度进一步提升。据报道,一名Meta员工称,现在Meta内部因为DeepSeek的模型,已经进入恐慌。其写道,“一切源于DeepSeek-V3的出现,它在基准测试中已经让Llama 4相形见绌。更让人难堪的是,一家‘仅用550万美元训练预算的中国公司’就做到了这一点。” 1月26日,有网友反映称,在使用DeepSeek时出现了短时闪崩的现象。对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。 就在1月26日晚间,游戏科学创始人、黑神话悟空制作人冯骥甚至在社交媒体上发文力推DeepSeek大模型,其表示DeepSeekV3大模型已经用了一个月,DeepSeekR1大模型用了5天,DeepSeek在推理能力、训练开销与使用费用、开源、免费、联网、本土化都等六方面全部实现突破。 冯骥写到,希望
DeepSeek
R1
会让你对当前最先进的AI祛魅,让AI逐渐变成你生活中的水和电。“太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步”,冯骥表示。
金融界
01-27 02:19
“黑马”DeepSeek出圈!金融科技ETF(516860)跳空高开超1%
go
公司DeepSeek正式发布推理大模型
DeepSeek
-
R
1。 在5000亿美元的“星际之门”计划公布之际,DeepSeek以极低的价格建立了一个突破性的AI模型。1月20日,DeepSeek在官微上发布了
DeepSeek
-
R
1,性能对标OpenAI o1正式版。
DeepSeek
-
R
1的发布震动了美国科技界,不仅因其性能上比肩OpenAI o1,且完全开源,还以极低的成本实现了这一突破。 AI科技初创公司ScaleAI创始人Alexandr Wang称,过去十年来,美国可能一直在人工智能竞赛中领先于中国,但DeepSeek的AI大模型发布可能会“改变一切”。DeepSeek的AI大模型性能大致与美国最好的模型相当。 中信建投证券指出,展望2025年,我们看好AI应用的落地,随着智能眼镜、机器人以及各种可穿戴设备的涌现,新的应用与新的硬件终端结合有望打造出更多的爆款场景,也将进一步拉动基础设施的需求,持续看好AI板块,包括基础设施产业链和端侧AI应用相关产业链。 开源证券指出,
DeepSeek
-
R
1基于强化学习再次让“低成本+高性能”大模型成为可能,并有望引领模型往开源方向发展,强大的推理能力或助力其在教育、办公、科研领域应用加快落地;豆包、阶跃星辰大模型不断升级语音、情感、视觉理解及生成等多模态能力,在社交陪伴、影视、教育、电商、广告等领域商业化或加快;智谱、OpenAI不断推动Agent成为AI应用落地的重要工具。模型迭代、Agent升级、端侧AI推新三方共振下,AI应用商业化空间或不断打开,建议继续布局:(1)AI+陪伴;(2)多模态数据语料;(3)AI+影视;(4)AI+广告/电商;(5)AI+教育的相关标的。 长城证券指出,资本市场持续处在发展过程中,产品丰富度不断提高,行业风险控制及资产分配问题亟待解决。在信创政策出台、数字化中国发展目标的加持下,金融机构对金融科技的未来投入存在向好预期,其重点发展环节与未来潜在落地场景也将愈发明晰。随之而来的是资本市场的健康发展,与市场情绪乐观、交易活跃性增强。预计相关标的有望受益此次发展趋势。 以上内容与数据,与界面有连云频道立场无关,不构成投资建议。据此操作,风险自担。
有连云
01-27 02:09
DeepSeek刷屏,训练成本大降,“AI界的拼多多”呼声四起,DeepSeek干崩A股算力股
go
1月20日,该公司正式发布推理大模型
DeepSeek
-
R
1。一经推出,
DeepSeek
-
R
1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。 目前,在国外大模型排名榜Chatbot Arena上,
DeepSeek
-
R
1的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。 训练成本大降,利空英伟达? 值得注意的是
DeepSeek
-
R
1 API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元,输出API价格只有OpenAI o1的3%。低价背后,显然仍是秀肌肉,价格实力展现了技术实力——从AIInfra 层面降本的技术能力。 而训练成本一直是DeepSeek的一大优势。 在其12月底发布的DeepSeek-V3中,参数量为671B,激活参数为37B,使用的预训练token量为14.8万亿。其多项评测成绩超越了阿里的Qwen2.5-72B和MetadeLlama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。 前OpenAI联创、知名AI科学家AndrejKarpathy在其个人社交平台上表示,DeepSeek-V3整个训练过程仅用了不到280万GPU小时,相比之下,Meta旗下顶尖的开源模型Llama-3405B的训练时长是3080万GPU小时。如果DeepSeekV3的优良表现能够得到广泛验证,那么这将是资源有限情况下对研究和工程的一次出色展示。若从成本上进行更直观的对比,假设H800的租金为每GPU小时2美元,DeepSeek-V3的总训练成本仅为600万美元不到,是Llama-3405B超6000万美元训练成本的十分之一不到。 对于深度求索强大的降本能力,“AI界的拼多多”呼声四起。 中信证券研报指出,DeepSeek模型相比GPT4模型更小的参数量也意味着更低的推理成本,推理成本的降低,将是AI应用普及的前奏。
金融界
01-27 01:49
DeepSeek超越ChatGPT!登顶苹果美国区免费APP下载排行榜,DeepSeek概念股全梳理
go
1月20日,该公司正式发布推理大模型
DeepSeek
-
R
1。一经推出,
DeepSeek
-
R
1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。 目前,在国外大模型排名榜Chatbot Arena上,
DeepSeek
-
R
1的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。 可能是国运级别的科技成果 游戏科学创始人、黑神话悟空制作人冯骥深夜力推DeepSeek大模型,其认为DeepSeek可能是国运级别的科技成果。冯骥写到“太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。”冯骥甚至激动的表示“如果这都不值得欢呼,还有什么值得欢呼?” 中信建投证券发布研报称,24Q4基金对计算机重仓持股比例为2.76%,较2024Q3环比下降0.19pct,低于历史3年平均水平3.71%,低于计算机板块市值占申万一级行业分类总市值的比重4.07%,连续四季度低配。近期AI Agent密集发布,智谱GLM-PC v1.1更新、OpenAI Operator带来了更自然的AI交互体验,有望推动AI应用加速发展。中信建投看好AI应用作为新一代生产力工具在B端商业化落地;看多政府支持下,底层AI算力产业发展,推荐关注国内算力产业链相关标的。 DeepSeek概念股曝光 随着DeepSeek的爆火,相关概念股也随之曝光,其中包括参投股东、合作供应商和客户。浙江东方通过旗下杭州东方嘉富基金参与DeepSeek天使轮投资。 华金资本是珠海国资旗下投资平台,通过华金领越基金参与DeepSeek Pre-A轮融资,布局AI大模型赛道。 浪潮信息、中科曙光在算力基础设施方面为DeepSeek提供供应服务。浪潮信息为DeepSeek北京亦庄智算中心提供AI服务器集群,配套英伟达H800芯片及自研AIStation管理平台。中科曙光承建DeepSeek杭州训练中心的液冷系统。 另外,拓尔思与DeepSeek联合开发金融舆情大模型,已在中信证券等机构部署智能研报生成系统。科大讯飞的教育场景接入DeepSeek-Math模型,推出AI数学辅导应用“星火助学”。
金融界
01-27 00:30
国运级别的科技成果!黑神话悟空制作人冯骥深夜发声,力推DeepSeek大模型
go
ek正式开源R1推理模型。1月24日,
DeepSeek
-
R
1在Chatbot Arena综合榜单上排名第三,与OpenAI的顶尖推理模型o1并列。在高难度提示词、代码和数学等技术性极强的领域,
DeepSeek
-
R
1拔得头筹;在风格控制以及高难度提示词与风格控制结合的测试中,
DeepSeek
-
R
1均与o1 并列第一。 更重要的是,工作人员发现,在
DeepSeek
-
R
1-Zero自我学习的过程,随着时间的增加,该模型“涌现”出了复杂的行为,如自我反思、评估先前步骤、自发寻找替代方案的情况,还包括一次“尤里卡时刻”(“aha moment”)。“尤里卡时刻”指人类突然理解一个以前无法理解的问题或概念的某个时刻。 深度求索透露,这次“尤里卡”发生在
DeepSeek
-
R
1-Zero的的中间版本期间。当时工作人员惊奇地发现,在一道数学题中,该模型学会了使用拟人化的语气进行自我反思,并主动为问题分配了更多的时间进行重新思考。 26日下午,DeepSeek在美区苹果App Store免费榜升至第六位,超越Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。 在用户蜂拥而入后,DeepSeek出现了短时闪崩现象。不少网友反映,使用时遇到 “服务器繁忙” 的提示。对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。不过,官方状态页并未将这一事件标记为事故。 值得注意的是
DeepSeek
-
R
1 API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元,输出API价格只有OpenAI o1的3%。低价背后,显然仍是秀肌肉,价格实力展现了技术实力——从AIInfra 层面降本的技术能力。 以下为冯骥具体观点: 游戏科学创始人、黑神话悟空制作人冯骥: 年前还是认真推下DeepSeek吧。 V3已经用了一个月,但R1仅仅用了5天,不得不来发这条微博。 先讲一句暴论:DeepSeek,可能是个国运级别的科技成果。 为了讲清楚这个成果有多惊人,我打个比方:如果有一个AI大模型做到了以下的任何一条,都是超级了不起的突破—— 1、强大。比肩O1的推理能力,暂时没有之一 2、便宜。参数少,训练开销与使用费用小了一个数量级 3、开源。任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的mini模型。 4、免费。官方目前提供的服务完全免费,任何人随时随地可用 5、联网。暂时唯一支持联网搜索的推理模型(o1还不支持) 6、本土。深度求索是一家很小规模的年轻中国公司,由没有海外经历甚至没有资深从业经验的本土团队开发完成 上面的六条,DeepSeek全部、同时做到了。 实在太6了,6到不真实。 如果这都不值得欢呼,还有什么值得欢呼? 那么,现在看到这条微博的你应该去做什么呢? 1、请直接访问:网页链接 马上用起来,也有移动APP 2、使劲用,疯狂用,尝试用它基本取代传统搜索。请想象你已经认识每个领域的顶尖专家,而且他们都是你随时在线的好朋友,把所有可能需要“请教别人”的问题,都拿去先问它——无论是构建一个复杂函数,搞清楚附近哪个游泳池最好,检查合同里的法律陷阱,让新写的歌词再押韵点,或者帮父母确认某个保健品是否真的有效 3、去看看别人是怎么用的,去试试其他大模型,了解AI擅长什么,不擅长什么,如何调教,然后继续解锁与迭代属于自己的用法与更多工具 希望
DeepSeek
R1
会让你对当前最先进的AI祛魅,让AI逐渐变成你生活中的水和电。 太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。 知识与信息平权,至此又往前迈出了坚实的一步。
金融界
01-27 00:00
利空英伟达?国产DeepSeek大模型震动全球AI圈,周末疯狂刷屏,量化私募巨头成功跨界AI!网名调侃:中国股民做出贡献
go
eek公司宣布正式发布最新人工智能模型
DeepSeek
-
R
1,并同步开源模型权重。
DeepSeek
-
R
1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。
DeepSeek
-
R
1在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。数据显示,
DeepSeek
-
R
1在算法类代码场景(Codeforces)和知识类测试(GPQA、MMLU)中的得分略低于OpenAI o1,但在工程类代码场景(SWE-Bench Verified)、美国数学竞赛(AIME 2024, MATH)项目上,均超过了OpenAI o1 。 更重要的是,工作人员发现,在
DeepSeek
-
R
1-Zero自我学习的过程,随着时间的增加,该模型“涌现”出了复杂的行为,如自我反思、评估先前步骤、自发寻找替代方案的情况,还包括一次“尤里卡时刻”(“aha moment”)。“尤里卡时刻”指人类突然理解一个以前无法理解的问题或概念的某个时刻。 深度求索透露,这次“尤里卡”发生在
DeepSeek
-
R
1-Zero的的中间版本期间。当时工作人员惊奇地发现,在一道数学题中,该模型学会了使用拟人化的语气进行自我反思,并主动为问题分配了更多的时间进行重新思考。 震动全球AI圈 这一消息震动全球AI圈,美国AI公司研究人员对中国大模型技术感到吃惊。 在最近两天
DeepSeek
-
R
1引发海外广泛讨论后,目前DeepSeek在苹果App Store应用商店美区免费榜排行第六,超越Google Gemini、Microsoft Copilot等美国生成式AI产品。今日有网友反映,DeepSeek崩了,提示服务器繁忙。 一位Meta的工程师在美国科技公司员工社区Blind中这样写道,“Meta的生成式AI部门正处于恐慌中。这一切始于DeepSeek,它使得 Llama 4 在基准测试中已经落后。雪上加霜的是:那个不知名的中国公司,仅有550万美元的训练预算。工程师们正在疯狂地剖析DeepSeek,并试图从中复制一切可能的东西。” ”英伟达高级研究科学家Jim Fan表示,
DeepSeek
-
R
1可能是第一个展示了RL(强化学习)飞轮可发挥作用且能带来持续增长的OSS(开源软件)项目。加利福尼亚大学伯克利分校教授Alex Dimakis则称,DeepSeek似乎是奔赴OpenAI最初使命的“最佳人选”,其他公司需要迎头赶上。 硅谷风投A16Z创始人Marc Andreessen也发表评论称,
DeepSeek
-
R
1是他见过的最令人惊叹且令人印象深刻的一个突破,作为开源的模型,它的面世给世界带来了一份礼物。 不过,“深度学习”三巨头之一、图灵奖得主、Meta AI首席科学家杨立昆表示,
DeepSeek
-
R
1面世与其说意味着中国公司在AI领域正在超越美国公司,不如说意味着开源大模型正在超越闭源。 训练成本大降,利空英伟达? 此外,值得注意的是
DeepSeek
-
R
1 API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元,输出API价格只有OpenAI o1的3%。低价背后,显然仍是秀肌肉,价格实力展现了技术实力——从AIInfra 层面降本的技术能力。 而训练成本一直是DeepSeek的一大优势。 在其12月底发布的DeepSeek-V3中,参数量为671B,激活参数为37B,使用的预训练token量为14.8万亿。其多项评测成绩超越了阿里的Qwen2.5-72B和MetadeLlama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。 前OpenAI联创、知名AI科学家AndrejKarpathy在其个人社交平台上表示,DeepSeek-V3整个训练过程仅用了不到280万GPU小时,相比之下,Meta旗下顶尖的开源模型Llama-3405B的训练时长是3080万GPU小时。如果DeepSeekV3的优良表现能够得到广泛验证,那么这将是资源有限情况下对研究和工程的一次出色展示。若从成本上进行更直观的对比,假设H800的租金为每GPU小时2美元,DeepSeek-V3的总训练成本仅为600万美元不到,是Llama-3405B超6000万美元训练成本的十分之一不到。 对于深度求索强大的降本能力,“AI界的拼多多”呼声四起。 英伟达的竞争对手、知名半导体公司超微半导体(AMD)昨日发布消息称,已将DeepSeek-V3模型集成到AMD的芯片产品Instinct MI300X GPU上,该模型旨在与SGLang一起实现最佳性能。DeepSeek-V3针对Al推理进行了优化。业内人士分析称,AMD作为全球领先的芯片厂商,通过与DeepSeek合作将为AI推理带来新的想象空间,也有望动摇“英伟达+OpenAI”联合主导的行业格局,改变既有的游戏规则。 DeepSeek不仅将模型训练成本大幅降低,而且发布的新模型R1也同步开源模型权重,公开了完整训练细节,挑战了闭源系统的优势。随着DeepSeek将AI大模型技术及使用门槛降低,有市场人士担忧,DeepSeekR1的崛起可能会削弱市场对英伟达AI芯片需求的预期,对英伟达的市场地位和战略布局产生影响。 有观点认为,DeepSeek-V3极低的训练成本预示着AI大模型对算力投入的需求将大幅下降,这无疑将利空全球AI算力的核心供应商英伟达。 网名调侃:中国股民做出贡献 DeepSeek是国内量化巨头幻方量化的子公司。依靠DeepSeek的出色表现,量化巨头幻方量化创始人梁文锋也迅速奠定了在AI圈地位。 梁文锋本硕均就读于浙江大学信息与电子工程学专业。2015年,梁文锋与校友共同创立幻方量化。2021年,幻方量化成为国内首家突破千亿规模的的量化私募大厂,被称为国内量化私募“四大天王”之一。早年,幻方量化开始大规模布局 AI 算力,搭建起“萤火一号”集群。2021年,“萤火二号”落成,这给了DeepSeek快速奔跑的底层支撑。 对此,有人调侃,中国股民给世界AI最大的的贡献就是让幻方量化赚了那么多钱。然后幻方量化创始人有钱买最好的GPU,收纳一批中国最牛的精英,做出了不错的Deepseek。
金融界
01-26 09:13
一周复盘 | 太辰光本周累计上涨18.85%,通信设备板块上涨3.91%
go
版)全量开放;DeepSeek正式发布
DeepSeek
-
R
1,并同步开源模型权重。 太辰光:预计2024年净利同比增长48.3%-77.32% 太辰光(300570)1月20日晚间披露2024年度业绩预告,预计2024年归母净利润2.3亿元至2.75亿元,同比增长48.3%-77.32%;扣非净利润预计2.15亿元至2.6亿元,同比增长57.37%-90.31%。以1月20日收盘价计算,太辰光目前市盈率(TTM)约为87.79倍-104.97倍,市净率(LF)约17.08倍,市销率(TTM)约20.5倍。以本次披露业绩预告均值计算,公司近年市盈率(TTM)图如下所示:资料显示,公司主营产品包括各种光通信器件及其集成功能模块、光传感产品及解决方案。 太辰光预计2024年归母净利润2.3亿元至2.75亿元 太辰光(300570)发布公告,预计2024年度归母净利润将达到2.3亿元至2.75亿元,较上年同期的1.55亿元增长48.3%至77.32%。扣除非经常性损益后的净利润预计为2.15亿元至2.6亿元,较上年同期的1.37亿元增长57.37%至90.31%。公告指出,业绩增长的主要原因是AI技术的进步推动了全球数据中心建设,进而拉动了光器件产品的持续需求。公司在密集连接产品领域具备先进的制造工艺及交付品质保障能力,市场需求的提升显著推动了经营业绩的改善。此外,预计2024年度非经常性损益对归母净利润的影响约为1500万元。 【同行业公司股价表现——通信设备】 代码 名称 最新价 周涨跌幅 10日涨跌幅 月涨跌幅 000063 中兴通讯 42.92元 4.00% 13.82% 6.24% 300308 中际旭创 128.25元 9.71% 13.37% 3.84% 300638 广和通 30.35元 48.27% 59.99% 50.62% 300502 新易盛 134.49元 12.61% 24.23% 16.36% 300548 博创科技 60.19元 24.36% 37.26% 29.69%
金融界
01-26 01:55
上一页
1
•••
45
46
47
48
49
下一页
24小时热点
特朗普公布关税plus版 自称“手下留情”? 10%全球关税结束“解放日”悬念(内附详细清单)
中美重磅!白宫确认美国对华关税升至54% 特朗普称“中国大大利用了美国”
特朗普大规模关税行动细节来了!避险情绪急剧升温 金价暴涨32美元创新高
华尔街惊现美股崩盘警告:特朗普关税新政或引爆标普500雪崩式暴跌!
特朗普对中国实施史上最大幅度关税上调!中国央行大动作释人民币重要信号
最新话题
更多
#SFFE2030--FX168“可持续发展金融企业”评选#
32讨论
#链上风云#
76讨论
#VIP会员尊享#
1852讨论
#比特币最新消息#
1037讨论
#CES 2025国际消费电子展#
21讨论