全球数字财富领导者
CoNET
|
客户端
|
旧版
|
北美站
|
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
香港论坛
外汇开户
登录 / 注册
搜 索
综合
行情
速递
日历
话题
168人气号
文章
Deepseek
周末刷屏!引爆AI概念股,人工智能ETF科创(588760)开盘获资金大举加仓!
go
lg
...
跃。 1月20日,中国人工智能初创企业
DeepSeek
发布最新模型“
DeepSeek-R1
”(以下简称R1),这一举动引起了全球AI行业的广泛关注。R1的发布不仅表明中国AI企业在国际舞台崭露头角,还展示了中国在人工智能领域的巨大潜力。从性能上来看,R1与OpenAI、Meta以及Anthropic等硅谷知名企业的大模型不相上下,但其收费仅为OpenAI o1的约三十分之一。 有市场观点认为,
DeepSeek
通过优化算法和架构,降低了训练和推理成本,可能使部分企业减少对传统算力集群的依赖,从而对算力市场的短期需求结构产生一定冲击。然而,从长期来看,AI技术仍在快速发展,多模态、复杂推理等新兴应用对算力的需求持续增长,同时,AI的普及也将推动算力需求的进一步爆发。 中信证券研报指出,近日,
DeepSeek-V3
的正式发版引起AI业内广泛高度关注,其在保证了模型能力的前提下,训练效率和推理速度大幅提升。我们认为,
DeepSeek
新一代模型的发布意味着AI大模型的应用将逐步走向普惠,助力AI应用广泛落地;同时训练效率大幅提升,亦将助力推理算力需求高增。我们持续看好AI产业链的加速落地机遇。 人工智能 ETF 科创(588760)紧密跟踪科创AI指数,可一键投资科创板30家人工智能企业,可谓纯AI投资利器。 以上内容与数据,与界面有连云频道立场无关,不构成投资建议。据此操作,风险自担。
lg
...
有连云
01-27 10:20
“神秘的东方力量”
DeepSeek
一夜爆火,让对手恐慌!超越ChatGPT 登顶苹果美国区免费APP下载排行榜,多只概念股涨停
go
lg
...
末,由国产大模型公司杭州深度求索开发的
Deepseek
在中美科技圈受到广泛关注。1月27日,该应用更是登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。此前AMD还宣布了,已将新的
DeepSeek-V3
模型集成到Instinct MI300X GPU上,该模型旨在与SGLang一起实现最佳性能。 或受上述消息影响,1月27日早间,
Deepseek
概念股高开,每日互动、航锦科技、南威软件、美格智能竞价涨停,飞利信、卓创资讯、思特奇高开超10%。此外,AI概念股也同步走强,万国数据涨10%,第四范式涨近6%,金山云涨5%,百度集团涨近3%,商汤涨2%。 公开资料显示,
Deepseek
来自国产大模型公司深度求索,系量化巨头幻方量化旗下大模型公司。1月20日,该公司正式发布推理大模型
DeepSeek-R1
。一经推出,
DeepSeek-R1
便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。 作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。 值得一提的是,在2024年12月,
DeepSeek-V3
发布后,AI数据服务公司Scale AI创始人Alexander Wang就曾发贴称,
DeepSeek-V3
是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。” 今年1月24号,一条发布在匿名平台teamblind上的帖子疯传,让
Deepseek
的讨论度进一步提升。据报道,一名Meta员工称,现在Meta内部因为
DeepSeek
的模型,已经进入恐慌。其写道,“一切源于
DeepSeek-V3
的出现,它在基准测试中已经让Llama 4相形见绌。更让人难堪的是,一家‘仅用550万美元训练预算的中国公司’就做到了这一点。” 1月26日,有网友反映称,在使用
DeepSeek
时出现了短时闪崩的现象。对此,
DeepSeek
回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。 就在1月26日晚间,游戏科学创始人、黑神话悟空制作人冯骥甚至在社交媒体上发文力推
DeepSeek
大模型,其表示
DeepSeekV3
大模型已经用了一个月,
DeepSeekR1
大模型用了5天,
DeepSeek
在推理能力、训练开销与使用费用、开源、免费、联网、本土化都等六方面全部实现突破。 冯骥写到,希望
DeepSeek
R1会让你对当前最先进的AI祛魅,让AI逐渐变成你生活中的水和电。“太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步”,冯骥表示。
lg
...
金融界
01-27 10:19
“黑马”
DeepSeek
出圈!金融科技ETF(516860)跳空高开超1%
go
lg
...
指跌0.08%,创业板指跌0.69%。
DeepSeek
概念发酵,人工智能概念股涨幅居前。 金融科技指数高开,该指数覆盖金融科技各细分行业,兼顾金融与科技属性,包含多只“牛市旗手”券商股,而又不限于此,弹性较大。 成分股涨跌不一,上涨方面,拓尔思涨超15%,新致软件、楚天龙、信雅达、东华软件、格灵深瞳、指南针等股票跟涨;下跌方面,高伟达跌超6%,汇金科技、普元信息、科蓝软件、同花顺等股票跟跌。 相关ETF中,金融科技ETF(516860)跳空高开超1%,成交额超2100万元,交投活跃,盘中交易溢价。 此外,证券ETF、券商ETF,香港证券ETF均高开。 消息面上,中国AI大模型市场规模正处于快速发展阶段。近日,量化巨头幻方量化旗下大模型公司
DeepSeek
正式发布推理大模型
DeepSeek-R1
。 在5000亿美元的“星际之门”计划公布之际,
DeepSeek
以极低的价格建立了一个突破性的AI模型。1月20日,
DeepSeek
在官微上发布了
DeepSeek-R1
,性能对标OpenAI o1正式版。
DeepSeek-R1
的发布震动了美国科技界,不仅因其性能上比肩OpenAI o1,且完全开源,还以极低的成本实现了这一突破。 AI科技初创公司ScaleAI创始人Alexandr Wang称,过去十年来,美国可能一直在人工智能竞赛中领先于中国,但
DeepSeek
的AI大模型发布可能会“改变一切”。
DeepSeek
的AI大模型性能大致与美国最好的模型相当。 中信建投证券指出,展望2025年,我们看好AI应用的落地,随着智能眼镜、机器人以及各种可穿戴设备的涌现,新的应用与新的硬件终端结合有望打造出更多的爆款场景,也将进一步拉动基础设施的需求,持续看好AI板块,包括基础设施产业链和端侧AI应用相关产业链。 开源证券指出,
DeepSeek-R1
基于强化学习再次让“低成本+高性能”大模型成为可能,并有望引领模型往开源方向发展,强大的推理能力或助力其在教育、办公、科研领域应用加快落地;豆包、阶跃星辰大模型不断升级语音、情感、视觉理解及生成等多模态能力,在社交陪伴、影视、教育、电商、广告等领域商业化或加快;智谱、OpenAI不断推动Agent成为AI应用落地的重要工具。模型迭代、Agent升级、端侧AI推新三方共振下,AI应用商业化空间或不断打开,建议继续布局:(1)AI+陪伴;(2)多模态数据语料;(3)AI+影视;(4)AI+广告/电商;(5)AI+教育的相关标的。 长城证券指出,资本市场持续处在发展过程中,产品丰富度不断提高,行业风险控制及资产分配问题亟待解决。在信创政策出台、数字化中国发展目标的加持下,金融机构对金融科技的未来投入存在向好预期,其重点发展环节与未来潜在落地场景也将愈发明晰。随之而来的是资本市场的健康发展,与市场情绪乐观、交易活跃性增强。预计相关标的有望受益此次发展趋势。 以上内容与数据,与界面有连云频道立场无关,不构成投资建议。据此操作,风险自担。
lg
...
有连云
01-27 10:09
DeepSeek
刷屏,训练成本大降,“AI界的拼多多”呼声四起,
DeepSeek
干崩A股算力股
go
lg
...
金融界1月27日消息
DeepSeek
干崩A股算力股。 27日开盘,
DeepSeek
概念股每日互动、航锦科技、南威软件、美格智能竞价涨停,飞利信、卓创资讯、思特奇高开超10%。而算力硬件方向大幅走低,寒武纪、新易盛、中际旭创、天孚通信、沃尔核材、鼎通科技、神宇股份等均跌超5%。 1月20日,该公司正式发布推理大模型
DeepSeek-R1
。一经推出,
DeepSeek-R1
便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。 目前,在国外大模型排名榜Chatbot Arena上,
DeepSeek-R1
的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。 训练成本大降,利空英伟达? 值得注意的是
DeepSeek-R1
API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元,输出API价格只有OpenAI o1的3%。低价背后,显然仍是秀肌肉,价格实力展现了技术实力——从AIInfra 层面降本的技术能力。 而训练成本一直是
DeepSeek
的一大优势。 在其12月底发布的
DeepSeek-V3
中,参数量为671B,激活参数为37B,使用的预训练token量为14.8万亿。其多项评测成绩超越了阿里的Qwen2.5-72B和MetadeLlama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。 前OpenAI联创、知名AI科学家AndrejKarpathy在其个人社交平台上表示,
DeepSeek-V3
整个训练过程仅用了不到280万GPU小时,相比之下,Meta旗下顶尖的开源模型Llama-3405B的训练时长是3080万GPU小时。如果
DeepSeekV3
的优良表现能够得到广泛验证,那么这将是资源有限情况下对研究和工程的一次出色展示。若从成本上进行更直观的对比,假设H800的租金为每GPU小时2美元,
DeepSeek-V3
的总训练成本仅为600万美元不到,是Llama-3405B超6000万美元训练成本的十分之一不到。 对于深度求索强大的降本能力,“AI界的拼多多”呼声四起。 中信证券研报指出,
DeepSeek
模型相比GPT4模型更小的参数量也意味着更低的推理成本,推理成本的降低,将是AI应用普及的前奏。
lg
...
金融界
01-27 09:49
DeepSeek
超越ChatGPT!登顶苹果美国区免费APP下载排行榜,
DeepSeek
概念股全梳理
go
lg
...
DeepSeek
震动全球! 由国产大模型公司杭州深度求索开发的
Deepseek
应用27日登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。
Deepseek
来自国产大模型公司深度求索,系量化巨头幻方量化旗下大模型公司。 1月20日,该公司正式发布推理大模型
DeepSeek-R1
。一经推出,
DeepSeek-R1
便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。 目前,在国外大模型排名榜Chatbot Arena上,
DeepSeek-R1
的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。 可能是国运级别的科技成果 游戏科学创始人、黑神话悟空制作人冯骥深夜力推
DeepSeek
大模型,其认为
DeepSeek
可能是国运级别的科技成果。冯骥写到“太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。”冯骥甚至激动的表示“如果这都不值得欢呼,还有什么值得欢呼?” 中信建投证券发布研报称,24Q4基金对计算机重仓持股比例为2.76%,较2024Q3环比下降0.19pct,低于历史3年平均水平3.71%,低于计算机板块市值占申万一级行业分类总市值的比重4.07%,连续四季度低配。近期AI Agent密集发布,智谱GLM-PC v1.1更新、OpenAI Operator带来了更自然的AI交互体验,有望推动AI应用加速发展。中信建投看好AI应用作为新一代生产力工具在B端商业化落地;看多政府支持下,底层AI算力产业发展,推荐关注国内算力产业链相关标的。
DeepSeek
概念股曝光 随着
DeepSeek
的爆火,相关概念股也随之曝光,其中包括参投股东、合作供应商和客户。浙江东方通过旗下杭州东方嘉富基金参与
DeepSeek
天使轮投资。 华金资本是珠海国资旗下投资平台,通过华金领越基金参与
DeepSeek
Pre-A轮融资,布局AI大模型赛道。 浪潮信息、中科曙光在算力基础设施方面为
DeepSeek
提供供应服务。浪潮信息为
DeepSeek
北京亦庄智算中心提供AI服务器集群,配套英伟达H800芯片及自研AIStation管理平台。中科曙光承建
DeepSeek
杭州训练中心的液冷系统。 另外,拓尔思与
DeepSeek
联合开发金融舆情大模型,已在中信证券等机构部署智能研报生成系统。科大讯飞的教育场景接入
DeepSeek-Math
模型,推出AI数学辅导应用“星火助学”。
lg
...
金融界
01-27 08:30
国运级别的科技成果!黑神话悟空制作人冯骥深夜发声,力推
DeepSeek
大模型
go
lg
...
学创始人、黑神话悟空制作人冯骥深夜力推
DeepSeek
大模型,其认为
DeepSeek
可能是国运级别的科技成果。 26日深夜,冯骥在社交媒体发文表示
DeepSeekV3
大模型已经用了一个月,
DeepSeekR1
大模型用了5天,
DeepSeek
在推理能力、训练开销与使用费用、开源、免费、联网、本土化都等六方面全部实现突破,
DeepSeek
具有强大的推理能力;参数少,训练开销与使用费用小了一个数量级;任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的mini模型;提供的服务完全免费,任何人随时随地可用;唯一支持联网搜索的推理模型;由没有海外经历甚至没有资深从业经验的本土团队开发完成。 冯骥写到“太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。”冯骥甚至激动的表示“如果这都不值得欢呼,还有什么值得欢呼?” 近日,
DeepSeek
正式开源R1推理模型。1月24日,
DeepSeek-R1
在Chatbot Arena综合榜单上排名第三,与OpenAI的顶尖推理模型o1并列。在高难度提示词、代码和数学等技术性极强的领域,
DeepSeek-R1
拔得头筹;在风格控制以及高难度提示词与风格控制结合的测试中,
DeepSeek-R1
均与o1 并列第一。 更重要的是,工作人员发现,在
DeepSeek-R1-Zero
自我学习的过程,随着时间的增加,该模型“涌现”出了复杂的行为,如自我反思、评估先前步骤、自发寻找替代方案的情况,还包括一次“尤里卡时刻”(“aha moment”)。“尤里卡时刻”指人类突然理解一个以前无法理解的问题或概念的某个时刻。 深度求索透露,这次“尤里卡”发生在
DeepSeek-R1-Zero
的的中间版本期间。当时工作人员惊奇地发现,在一道数学题中,该模型学会了使用拟人化的语气进行自我反思,并主动为问题分配了更多的时间进行重新思考。 26日下午,
DeepSeek
在美区苹果App Store免费榜升至第六位,超越Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。 在用户蜂拥而入后,
DeepSeek
出现了短时闪崩现象。不少网友反映,使用时遇到 “服务器繁忙” 的提示。对此,
DeepSeek
回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。不过,官方状态页并未将这一事件标记为事故。 值得注意的是
DeepSeek-R1
API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元,输出API价格只有OpenAI o1的3%。低价背后,显然仍是秀肌肉,价格实力展现了技术实力——从AIInfra 层面降本的技术能力。 以下为冯骥具体观点: 游戏科学创始人、黑神话悟空制作人冯骥: 年前还是认真推下
DeepSeek
吧。 V3已经用了一个月,但R1仅仅用了5天,不得不来发这条微博。 先讲一句暴论:
DeepSeek
,可能是个国运级别的科技成果。 为了讲清楚这个成果有多惊人,我打个比方:如果有一个AI大模型做到了以下的任何一条,都是超级了不起的突破—— 1、强大。比肩O1的推理能力,暂时没有之一 2、便宜。参数少,训练开销与使用费用小了一个数量级 3、开源。任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的mini模型。 4、免费。官方目前提供的服务完全免费,任何人随时随地可用 5、联网。暂时唯一支持联网搜索的推理模型(o1还不支持) 6、本土。深度求索是一家很小规模的年轻中国公司,由没有海外经历甚至没有资深从业经验的本土团队开发完成 上面的六条,
DeepSeek
全部、同时做到了。 实在太6了,6到不真实。 如果这都不值得欢呼,还有什么值得欢呼? 那么,现在看到这条微博的你应该去做什么呢? 1、请直接访问:网页链接 马上用起来,也有移动APP 2、使劲用,疯狂用,尝试用它基本取代传统搜索。请想象你已经认识每个领域的顶尖专家,而且他们都是你随时在线的好朋友,把所有可能需要“请教别人”的问题,都拿去先问它——无论是构建一个复杂函数,搞清楚附近哪个游泳池最好,检查合同里的法律陷阱,让新写的歌词再押韵点,或者帮父母确认某个保健品是否真的有效 3、去看看别人是怎么用的,去试试其他大模型,了解AI擅长什么,不擅长什么,如何调教,然后继续解锁与迭代属于自己的用法与更多工具 希望
DeepSeek
R1会让你对当前最先进的AI祛魅,让AI逐渐变成你生活中的水和电。 太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。 知识与信息平权,至此又往前迈出了坚实的一步。
lg
...
金融界
01-27 08:00
【A股头条】周末A股重磅利好,证监会发声,积极发展股票ETF! 利空英伟达?国产
DeepSeek
大模型震动全球AI圈
go
lg
...
25年远比2024年更好。 题材掘金
DeepSeek
升至美区苹果应用榜第六 周末疯狂刷屏,来自国内量化私募巨头幻方量化的
DeepSeek
大模型的震动全球AI圈。截至1月26日下午,
DeepSeek
在美区苹果App Store免费榜升至第六位,超越Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。此外,因为用户蜂拥而至,
DeepSeek
出现了短时闪崩现象。不少网友反映,使用时遇到 “服务器繁忙” 的提示。 标的:每日互动(300766)卓创资讯(301299) 2025年春节档预售票房突破6亿元 2025年春节档(1月28日—2月4日)预售于1月19日上午9点正式开启。预售开启当天累计预售1.85亿元,刷新了影史春节档预售开启首日最高票房纪录,比去年同期的成绩高了一倍多。此后几天春节档票房预售不断传来新消息,截至1月26日上午11时左右,2025年春节档预售票房突破了6亿元。其中,《射雕英雄传:侠之大者》《哪吒之魔童闹海》《唐探1900》3部影片的预售票房均达到1亿元以上。 标的:中国电影(600997)北京文化(008002) 公告精选 【重大事项】 *ST美讯:公司股票将于2025年2月10日终止上市 博汇股份:筹划公司控制权变更事项股票停牌 上海石化:拟投资约31.96亿元建设大丝束碳纤维异地项目 万通发展:终止重大资产重组事项 富乐德:重大资产重组申请获受理 特锐德:预中标项目总金额约1.98亿元 浙江建投:子公司中标10.08亿项目 陕建股份:联合中标高新至鄠邑高速复合通道工程项目特许经营项目 沪光股份:向特定对象发行股票申请获同意注册批复 凯众股份:拟不超4000万元设立摩洛哥子公司 茂莱光学:拟发行可转债募资不超6亿元 华仁药业:喷他佐辛注射液中选京津冀赣化学药品集采 恒顺醋业:董事长杭祝鸿因个人原因辞职 杉杉股份:控股股东杉杉集团被申请重整 海通证券:2月5日为最后交易日将连续停牌至终止上市 【业绩】 金地集团:预计2024年净亏损56亿元到70亿元 思特威:预计2024年净利润同比增长2512%到2830% 辽宁能源:预计2024年度净利润同比增加469.51%-754.27% 杉杉股份:预计2024年度净利润亏损3.2亿元到4.8亿元 南京证券:2024年净利润9.99亿元,同比增长47.61% ST锦港:预计2024年净利润亏损64亿元至54亿元 彩虹股份:预计2024年净利润同比增加81.52%到99.67% 山东黄金:预计2024年净利润同比增加15.98%-37.46% 达仁堂:预计2024年净利润同比增加118%-142% 通用股份:预计2024年度净利润同比增加85.19%-131.48% 中国高科:预计2024年度净利润为4704万元到5645万元 绿地控股:2024年净利润预亏110亿元—130亿元 苏州龙杰:2024年净利润同比预增254.69%—331.19% 鲁抗医药:2024年净利润同比预增42%—69% 普冉股份:2024年预计净利润约2.7亿元,同比扭亏 维维股份:2024年净利润同比预增81.39%—129.13% 西部黄金:2024年预盈2.4亿元—3.2亿元,同比扭亏 南京证券:2024年净利润同比增长47.61% ST花王:2024年预亏5.78亿元-8.59亿元,公司股票将存在被实施退市风险警示的风险 *ST恒立:预计2024年净亏损3300万元至4300万元 公司股票可能被终止上市 神雾节能:2024年预亏1000万元至2000万元,可能被实施退市风险警示 【增减持】 酒钢宏兴:控股股东累计增持1.31%股份 奥翔药业:拟5000万元-1亿元回购公司股份 【回购】 奥翔药业:拟5000万元-1亿元回购公司股份 交易提示 【可转债交易提示】 【开始转股】合顺转债 【转债除息】上银转债 形程转债 天亲转债 姚记转债 【限售解禁】
lg
...
金融界
01-27 07:40
中国
DeepSeek
震撼全球:以560万美元训练6710亿参数AI模型,引发行业巨变
go
lg
...
中国
DeepSeek
震撼全球:以560万美元训练6710亿参数AI模型,引发行业巨变
DeepSeek
发布R1模型及其技术细节 创始人梁文峰的背景与团队建设 中美AI竞争加剧的现实与挑战
DeepSeek
模式的独特性与未来展望 编辑观点 名词解释 今年相关大事件
DeepSeek
发布R1模型及其技术细节 根据TodayUSstock.com报道,本周,中国人工智能实验室
DeepSeek
引发全球关注,其发布的R1模型展示了如何以有限预算构建一个可以自主学习的语言模型。
DeepSeek
利用2048块Nvidia H800芯片和560万美元资金,训练出了一个拥有6710亿参数的模型,这与美国公司如OpenAI和Google DeepMind所花费的资源相比显得尤为高效。
DeepSeek
的技术公开行动在硅谷引发激烈讨论,美国科技公司如Meta和Anthropic正试图捍卫其技术优势。这种开源方式也使得
DeepSeek
迅速成为全球AI领域的重要竞争者。 创始人梁文峰的背景与团队建设
DeepSeek
由对冲基金经理梁文峰创立,他曾通过运用AI和算法在量化交易领域积累财富。2021年,他购买了数千块Nvidia芯片,为其AI项目铺平了道路。当时,他的行为被认为是亿万富翁的“异想天开”。但梁的团队凭借对芯片性能的深入理解,成功建立了一支强大的AI工程团队。 梁文峰强调本土人才的重要性,
DeepSeek
的核心团队由北大、清华和北航的博士组成,而非海外归国学者。这种纯本土化的团队结构也为其赢得了国内的高度赞誉。 中美AI竞争加剧的现实与挑战 中美之间的人工智能竞争愈演愈烈。尽管美国限制Nvidia高端芯片对华出口,
DeepSeek
通过优化本地芯片性能取得了显著成果。然而,美国企业并未止步不前。OpenAI与日本软银宣布联合投资1000亿美元建立AI基础设施,埃隆·马斯克的xAI也计划将其超级计算机扩展至100万块GPU。 相较之下,
DeepSeek
的计算能力虽足以满足当前需求,但未来是否能继续保持竞争力仍是一个开放性问题。
DeepSeek
模式的独特性与未来展望
DeepSeek
以其专注于研究而非商业化的模式独树一帜。其核心目标是通过开源方式推动AI技术的普及。这种模式类似于早期的DeepMind,但也面临资金来源和持续创新的挑战。 与此同时,
DeepSeek
的创始人梁文峰通过自有对冲基金为AI研发提供资金支持,其团队的高薪水平使其在人才争夺战中占据优势。尽管如此,高飞基金在2024年的回报率下降,部分原因被归因于梁对
DeepSeek
的投入过多。 编辑观点
DeepSeek
的崛起不仅展示了中国在人工智能领域的技术潜力,也凸显了全球科技竞争的激烈程度。在资源受限的情况下,
DeepSeek
通过创新实现了技术突破,成为全球AI行业的重要玩家。然而,随着技术门槛的提升和国际竞争的加剧,
DeepSeek
能否持续创新和保持竞争力仍值得关注。未来,中国如何在技术和政策上协调发展,将直接影响AI产业的全球格局。 名词解释
DeepSeek
:一家中国人工智能实验室,专注于自主学习模型的研究与开发。 R1模型:
DeepSeek
开发的拥有6710亿参数的语言模型,强调高效计算和低成本训练。 OpenAI:美国人工智能研究公司,以其先进的语言模型技术闻名。 今年相关大事件 2025年1月:中国
DeepSeek
发布R1模型,并公开其技术细节。 2024年12月:OpenAI与软银合作宣布1000亿美元AI基础设施计划。 2024年11月:xAI扩展Colossus超级计算机,目标达到100万块GPU。 来源:今日美股网
lg
...
今日美股网
01-27 00:10
利空英伟达?国产
DeepSeek
大模型震动全球AI圈,周末疯狂刷屏,量化私募巨头成功跨界AI!网名调侃:中国股民做出贡献
go
lg
...
狂刷屏,来自国内量化私募巨头幻方量化的
DeepSeek
大模型的震动全球AI圈! 近日,
DeepSeek
公司宣布正式发布最新人工智能模型
DeepSeek-R1
,并同步开源模型权重。
DeepSeek-R1
在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。
DeepSeek-R1
在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。数据显示,
DeepSeek-R1
在算法类代码场景(Codeforces)和知识类测试(GPQA、MMLU)中的得分略低于OpenAI o1,但在工程类代码场景(SWE-Bench Verified)、美国数学竞赛(AIME 2024, MATH)项目上,均超过了OpenAI o1 。 更重要的是,工作人员发现,在
DeepSeek-R1-Zero
自我学习的过程,随着时间的增加,该模型“涌现”出了复杂的行为,如自我反思、评估先前步骤、自发寻找替代方案的情况,还包括一次“尤里卡时刻”(“aha moment”)。“尤里卡时刻”指人类突然理解一个以前无法理解的问题或概念的某个时刻。 深度求索透露,这次“尤里卡”发生在
DeepSeek-R1-Zero
的的中间版本期间。当时工作人员惊奇地发现,在一道数学题中,该模型学会了使用拟人化的语气进行自我反思,并主动为问题分配了更多的时间进行重新思考。 震动全球AI圈 这一消息震动全球AI圈,美国AI公司研究人员对中国大模型技术感到吃惊。 在最近两天
DeepSeek-R1
引发海外广泛讨论后,目前
DeepSeek
在苹果App Store应用商店美区免费榜排行第六,超越Google Gemini、Microsoft Copilot等美国生成式AI产品。今日有网友反映,
DeepSeek
崩了,提示服务器繁忙。 一位Meta的工程师在美国科技公司员工社区Blind中这样写道,“Meta的生成式AI部门正处于恐慌中。这一切始于
DeepSeek
,它使得 Llama 4 在基准测试中已经落后。雪上加霜的是:那个不知名的中国公司,仅有550万美元的训练预算。工程师们正在疯狂地剖析
DeepSeek
,并试图从中复制一切可能的东西。” ”英伟达高级研究科学家Jim Fan表示,
DeepSeek-R1
可能是第一个展示了RL(强化学习)飞轮可发挥作用且能带来持续增长的OSS(开源软件)项目。加利福尼亚大学伯克利分校教授Alex Dimakis则称,
DeepSeek
似乎是奔赴OpenAI最初使命的“最佳人选”,其他公司需要迎头赶上。 硅谷风投A16Z创始人Marc Andreessen也发表评论称,
DeepSeek-R1
是他见过的最令人惊叹且令人印象深刻的一个突破,作为开源的模型,它的面世给世界带来了一份礼物。 不过,“深度学习”三巨头之一、图灵奖得主、Meta AI首席科学家杨立昆表示,
DeepSeek-R1
面世与其说意味着中国公司在AI领域正在超越美国公司,不如说意味着开源大模型正在超越闭源。 训练成本大降,利空英伟达? 此外,值得注意的是
DeepSeek-R1
API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元,输出API价格只有OpenAI o1的3%。低价背后,显然仍是秀肌肉,价格实力展现了技术实力——从AIInfra 层面降本的技术能力。 而训练成本一直是
DeepSeek
的一大优势。 在其12月底发布的
DeepSeek-V3
中,参数量为671B,激活参数为37B,使用的预训练token量为14.8万亿。其多项评测成绩超越了阿里的Qwen2.5-72B和MetadeLlama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。 前OpenAI联创、知名AI科学家AndrejKarpathy在其个人社交平台上表示,
DeepSeek-V3
整个训练过程仅用了不到280万GPU小时,相比之下,Meta旗下顶尖的开源模型Llama-3405B的训练时长是3080万GPU小时。如果
DeepSeekV3
的优良表现能够得到广泛验证,那么这将是资源有限情况下对研究和工程的一次出色展示。若从成本上进行更直观的对比,假设H800的租金为每GPU小时2美元,
DeepSeek-V3
的总训练成本仅为600万美元不到,是Llama-3405B超6000万美元训练成本的十分之一不到。 对于深度求索强大的降本能力,“AI界的拼多多”呼声四起。 英伟达的竞争对手、知名半导体公司超微半导体(AMD)昨日发布消息称,已将
DeepSeek-V3
模型集成到AMD的芯片产品Instinct MI300X GPU上,该模型旨在与SGLang一起实现最佳性能。
DeepSeek-V3
针对Al推理进行了优化。业内人士分析称,AMD作为全球领先的芯片厂商,通过与
DeepSeek
合作将为AI推理带来新的想象空间,也有望动摇“英伟达+OpenAI”联合主导的行业格局,改变既有的游戏规则。
DeepSeek
不仅将模型训练成本大幅降低,而且发布的新模型R1也同步开源模型权重,公开了完整训练细节,挑战了闭源系统的优势。随着
DeepSeek
将AI大模型技术及使用门槛降低,有市场人士担忧,
DeepSeekR1
的崛起可能会削弱市场对英伟达AI芯片需求的预期,对英伟达的市场地位和战略布局产生影响。 有观点认为,
DeepSeek-V3
极低的训练成本预示着AI大模型对算力投入的需求将大幅下降,这无疑将利空全球AI算力的核心供应商英伟达。 网名调侃:中国股民做出贡献
DeepSeek
是国内量化巨头幻方量化的子公司。依靠
DeepSeek
的出色表现,量化巨头幻方量化创始人梁文锋也迅速奠定了在AI圈地位。 梁文锋本硕均就读于浙江大学信息与电子工程学专业。2015年,梁文锋与校友共同创立幻方量化。2021年,幻方量化成为国内首家突破千亿规模的的量化私募大厂,被称为国内量化私募“四大天王”之一。早年,幻方量化开始大规模布局 AI 算力,搭建起“萤火一号”集群。2021年,“萤火二号”落成,这给了
DeepSeek
快速奔跑的底层支撑。 对此,有人调侃,中国股民给世界AI最大的的贡献就是让幻方量化赚了那么多钱。然后幻方量化创始人有钱买最好的GPU,收纳一批中国最牛的精英,做出了不错的
Deepseek
。
lg
...
金融界
01-26 17:13
DeepSeek
引爆AI革命:题材核心企业全解析
go
lg
...
DeepSeek
引爆AI革命:题材核心企业全解析 ——从数据到算力,谁将搭上AI时代的“超级快车”? 随着中国AI公司
DeepSeek
发布其开源大模型R1,全球科技与资本市场的目光再次聚焦AI赛道。R1模型以成本仅为OpenAI的2%、性能全面超越GPT-4的震撼表现,不仅让硅谷巨头如临大敌,更在A股市场掀起一波“AI掘金潮”。本文从核心企业、业务关联、数据逻辑出发,深度解析与
DeepSeek
密切相关的企业。 一、核心概念股:数据与资本的深度绑定1. 每日互动(300766) 涨跌幅:上一交易日+8.5%,10日累计+32% 核心逻辑: 股东协同:第二大股东幻方量化是
DeepSeek
的直接投资人,形成“数据-算力-应用”全链条绑定。 数据资源:覆盖超4亿日活设备用户行为数据,为
DeepSeek
模型训练提供低成本数据支持。 商业化场景:智慧交通、品牌营销等领域已验证技术转化率提升,合作模型在中信证券等机构落地。 2. 浙江东方(600120) 核心逻辑: 创投布局:通过杭州东方嘉富基金参投
DeepSeek
天使轮,2023年创投利润贡献占比达18%。 稀缺性:A股少有的早期AI大模型投资标的,受益于
DeepSeek
估值跃升10。 二、算力基础设施:AI时代的“卖铲人” 1. 中科曙光(603019) 核心逻辑: 液冷技术壁垒:为
DeepSeek
杭州训练中心提供PUE<1.15的液冷系统,技术全球领先。 国产替代:自主可控算力需求激增,政策扶持明确。 2. 浪潮信息(000977) 核心逻辑: 服务器龙头:为
DeepSeek
北京亦庄智算中心提供H800 GPU集群,市占率持续领先。 生态协同:自研AIStation平台适配多模态大模型训练需求。 三、技术合作与硬件支持:AI落地的“隐形冠军” 1. 飞利信(300287) 核心逻辑: 架构创新:采用与
DeepSeek-V2
相似的MLA(多头潜在注意力机制),技术协同潜力大。 应用场景:政务、金融领域AI解决方案或受益于模型开源生态。 2. 航锦科技(000818) 核心逻辑: 硬件支持:子公司超擎数智为
DeepSeek
提供光模块与交换机,深度绑定NVIDIA生态。 算力网络:AI推理需求爆发带动高速通信设备订单增长。 四、数据与生态:AI繁荣的“底层燃料” 1. 拓尔思(300229) 核心逻辑: 垂直场景:与
DeepSeek
联合开发金融舆情大模型,已在中信证券部署。 政务优势:政府客户资源丰富,AI+政务赛道空间广阔2。 结语:AI革命下的“长坡厚雪”
DeepSeek
的崛起不仅是技术的胜利,更是中国AI产业从跟随到引领的转折点。投资者需抓住“数据-算力-应用”三大主线,优先布局确定性高的基础设施标的(如中科曙光、浪潮信息),同时关注商业化验证快的场景合作方(如每日互动、拓尔思)。长期来看,AI技术的普惠化将重塑全球产业格局,而今日的“题材”或将成为明日的“核心企业”。
lg
...
金融界
01-26 15:04
上一页
1
•••
14
15
16
17
18
•••
20
下一页
24小时热点
“18年来最大加息”黑天鹅将突袭?彭博社:日本央行将削减近5000亿资产负债表
lg
...
中美突传重磅消息!特朗普拟加强英伟达对中国AI芯片限制 DeepSeek恐慌蔓延美国市场
lg
...
市场突发剧烈震荡!特朗普公司宣布比特币投资计划 美股、加密交易员疯狂押注
lg
...
鲍威尔说了什么?!美指急挫近30点,黄金直拉超10美元 特朗普重返白宫对美联储降息影响比想象要大?
lg
...
特朗普、鲍威尔语出惊人!美联储“果然”维持利率不变 黄金2759反弹走高 比特币10.4万多头坚挺
lg
...
最新话题
更多
#SFFE2030--FX168“可持续发展金融企业”评选#
lg
...
19讨论
#链上风云#
lg
...
59讨论
#VIP会员尊享#
lg
...
1697讨论
#比特币最新消息#
lg
...
832讨论
#CES 2025国际消费电子展#
lg
...
21讨论