FX168财经网_全球视野外汇黄金加密货币NFT资讯网_关键字搜索-FX168

全球数字财富领导者

CoNET｜客户端｜旧版｜｜

FX168 全球视野中文财经

登录 / 注册

Deepseek周末刷屏！引爆AI概念股，人工智能ETF科创(588760)开盘获资金大举加仓！
go
跃。 1月20日，中国人工智能初创企业DeepSeek发布最新模型“DeepSeek-R1”（以下简称R1），这一举动引起了全球AI行业的广泛关注。R1的发布不仅表明中国AI企业在国际舞台崭露头角，还展示了中国在人工智能领域的巨大潜力。从性能上来看，R1与OpenAI、Meta以及Anthropic等硅谷知名企业的大模型不相上下，但其收费仅为OpenAI o1的约三十分之一。有市场观点认为，DeepSeek通过优化算法和架构，降低了训练和推理成本，可能使部分企业减少对传统算力集群的依赖，从而对算力市场的短期需求结构产生一定冲击。然而，从长期来看，AI技术仍在快速发展，多模态、复杂推理等新兴应用对算力的需求持续增长，同时，AI的普及也将推动算力需求的进一步爆发。中信证券研报指出，近日，DeepSeek-V3的正式发版引起AI业内广泛高度关注，其在保证了模型能力的前提下，训练效率和推理速度大幅提升。我们认为，DeepSeek新一代模型的发布意味着AI大模型的应用将逐步走向普惠，助力AI应用广泛落地；同时训练效率大幅提升，亦将助力推理算力需求高增。我们持续看好AI产业链的加速落地机遇。人工智能 ETF 科创(588760)紧密跟踪科创AI指数，可一键投资科创板30家人工智能企业，可谓纯AI投资利器。以上内容与数据，与界面有连云频道立场无关，不构成投资建议。据此操作，风险自担。
有连云01-27 10:20
“神秘的东方力量”DeepSeek一夜爆火，让对手恐慌！超越ChatGPT 登顶苹果美国区免费APP下载排行榜，多只概念股涨停
 go
末，由国产大模型公司杭州深度求索开发的Deepseek在中美科技圈受到广泛关注。1月27日，该应用更是登顶苹果中国地区和美国地区应用商店免费APP下载排行榜，在美区下载榜上超越了ChatGPT。此前AMD还宣布了，已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上，该模型旨在与SGLang一起实现最佳性能。或受上述消息影响，1月27日早间，Deepseek概念股高开，每日互动、航锦科技、南威软件、美格智能竞价涨停，飞利信、卓创资讯、思特奇高开超10%。此外，AI概念股也同步走强，万国数据涨10%，第四范式涨近6%，金山云涨5%，百度集团涨近3%，商汤涨2%。公开资料显示，Deepseek来自国产大模型公司深度求索，系量化巨头幻方量化旗下大模型公司。1月20日，该公司正式发布推理大模型DeepSeek-R1。一经推出，DeepSeek-R1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。作为一款开源模型，R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版，并采用MIT许可协议，支持免费商用、任意修改和衍生开发等。值得一提的是，在2024年12月，DeepSeek-V3发布后，AI数据服务公司Scale AI创始人Alexander Wang就曾发贴称，DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时，中国（科技界）在工作，以更低的成本、更快的速度和更强的实力赶上。” 今年1月24号，一条发布在匿名平台teamblind上的帖子疯传，让Deepseek的讨论度进一步提升。据报道，一名Meta员工称，现在Meta内部因为DeepSeek的模型，已经进入恐慌。其写道，“一切源于DeepSeek-V3的出现，它在基准测试中已经让Llama 4相形见绌。更让人难堪的是，一家‘仅用550万美元训练预算的中国公司’就做到了这一点。” 1月26日，有网友反映称，在使用DeepSeek时出现了短时闪崩的现象。对此，DeepSeek回应称，当天下午确实出现了局部服务波动，但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后，用户访问量激增，服务器一时无法满足大量用户的并发需求。就在1月26日晚间，游戏科学创始人、黑神话悟空制作人冯骥甚至在社交媒体上发文力推DeepSeek大模型，其表示DeepSeekV3大模型已经用了一个月，DeepSeekR1大模型用了5天，DeepSeek在推理能力、训练开销与使用费用、开源、免费、联网、本土化都等六方面全部实现突破。冯骥写到，希望DeepSeek R1会让你对当前最先进的AI祛魅，让AI逐渐变成你生活中的水和电。“太幸运了！太开心了！这样震撼的突破，来自一个纯粹的中国公司。知识与信息平权，至此又往前迈出了坚实的一步”，冯骥表示。
金融界01-27 10:19
“黑马”DeepSeek出圈！金融科技ETF(516860)跳空高开超1%
go
指跌0.08%，创业板指跌0.69%。DeepSeek概念发酵，人工智能概念股涨幅居前。金融科技指数高开，该指数覆盖金融科技各细分行业，兼顾金融与科技属性，包含多只“牛市旗手”券商股，而又不限于此，弹性较大。成分股涨跌不一，上涨方面，拓尔思涨超15%，新致软件、楚天龙、信雅达、东华软件、格灵深瞳、指南针等股票跟涨；下跌方面，高伟达跌超6%，汇金科技、普元信息、科蓝软件、同花顺等股票跟跌。相关ETF中，金融科技ETF（516860）跳空高开超1%，成交额超2100万元，交投活跃，盘中交易溢价。此外，证券ETF、券商ETF，香港证券ETF均高开。消息面上，中国AI大模型市场规模正处于快速发展阶段。近日，量化巨头幻方量化旗下大模型公司DeepSeek正式发布推理大模型DeepSeek-R1。在5000亿美元的“星际之门”计划公布之际，DeepSeek以极低的价格建立了一个突破性的AI模型。1月20日，DeepSeek在官微上发布了DeepSeek-R1，性能对标OpenAI o1正式版。DeepSeek-R1的发布震动了美国科技界，不仅因其性能上比肩OpenAI o1，且完全开源，还以极低的成本实现了这一突破。 AI科技初创公司ScaleAI创始人Alexandr Wang称，过去十年来，美国可能一直在人工智能竞赛中领先于中国，但DeepSeek的AI大模型发布可能会“改变一切”。DeepSeek的AI大模型性能大致与美国最好的模型相当。中信建投证券指出，展望2025年，我们看好AI应用的落地，随着智能眼镜、机器人以及各种可穿戴设备的涌现，新的应用与新的硬件终端结合有望打造出更多的爆款场景，也将进一步拉动基础设施的需求，持续看好AI板块，包括基础设施产业链和端侧AI应用相关产业链。开源证券指出，DeepSeek-R1基于强化学习再次让“低成本+高性能”大模型成为可能，并有望引领模型往开源方向发展，强大的推理能力或助力其在教育、办公、科研领域应用加快落地；豆包、阶跃星辰大模型不断升级语音、情感、视觉理解及生成等多模态能力，在社交陪伴、影视、教育、电商、广告等领域商业化或加快；智谱、OpenAI不断推动Agent成为AI应用落地的重要工具。模型迭代、Agent升级、端侧AI推新三方共振下，AI应用商业化空间或不断打开，建议继续布局：（1）AI+陪伴；（2）多模态数据语料；（3）AI+影视；（4）AI+广告/电商；（5）AI+教育的相关标的。长城证券指出，资本市场持续处在发展过程中，产品丰富度不断提高，行业风险控制及资产分配问题亟待解决。在信创政策出台、数字化中国发展目标的加持下，金融机构对金融科技的未来投入存在向好预期，其重点发展环节与未来潜在落地场景也将愈发明晰。随之而来的是资本市场的健康发展，与市场情绪乐观、交易活跃性增强。预计相关标的有望受益此次发展趋势。以上内容与数据，与界面有连云频道立场无关，不构成投资建议。据此操作，风险自担。
有连云01-27 10:09
DeepSeek刷屏，训练成本大降，“AI界的拼多多”呼声四起，DeepSeek干崩A股算力股
 go
金融界1月27日消息 DeepSeek干崩A股算力股。 27日开盘，DeepSeek概念股每日互动、航锦科技、南威软件、美格智能竞价涨停，飞利信、卓创资讯、思特奇高开超10%。而算力硬件方向大幅走低，寒武纪、新易盛、中际旭创、天孚通信、沃尔核材、鼎通科技、神宇股份等均跌超5%。 1月20日，该公司正式发布推理大模型DeepSeek-R1。一经推出，DeepSeek-R1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。作为一款开源模型，R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版，并采用MIT许可协议，支持免费商用、任意修改和衍生开发等。目前，在国外大模型排名榜Chatbot Arena上，DeepSeek-R1的基准测试排名已经升至全类别大模型第三，与OpenAI的ChatGPT-4o最新版并列，并在风格控制类模型（StyleCtrl）分类中与OpenAI的o1模型并列第一。训练成本大降，利空英伟达？值得注意的是DeepSeek-R1 API服务定价为每百万输入tokens 1元（缓存命中）/4元（缓存未命中），每百万输出tokens16元，输出API价格只有OpenAI o1的3%。低价背后，显然仍是秀肌肉，价格实力展现了技术实力——从AIInfra 层面降本的技术能力。而训练成本一直是DeepSeek的一大优势。在其12月底发布的DeepSeek-V3中，参数量为671B，激活参数为37B，使用的预训练token量为14.8万亿。其多项评测成绩超越了阿里的Qwen2.5-72B和MetadeLlama-3.1-405B等其他开源模型，并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。前OpenAI联创、知名AI科学家AndrejKarpathy在其个人社交平台上表示，DeepSeek-V3整个训练过程仅用了不到280万GPU小时，相比之下，Meta旗下顶尖的开源模型Llama-3405B的训练时长是3080万GPU小时。如果DeepSeekV3的优良表现能够得到广泛验证，那么这将是资源有限情况下对研究和工程的一次出色展示。若从成本上进行更直观的对比，假设H800的租金为每GPU小时2美元，DeepSeek-V3的总训练成本仅为600万美元不到，是Llama-3405B超6000万美元训练成本的十分之一不到。对于深度求索强大的降本能力，“AI界的拼多多”呼声四起。中信证券研报指出，DeepSeek模型相比GPT4模型更小的参数量也意味着更低的推理成本，推理成本的降低，将是AI应用普及的前奏。
金融界01-27 09:49
DeepSeek超越ChatGPT！登顶苹果美国区免费APP下载排行榜，DeepSeek概念股全梳理
 go
DeepSeek震动全球！由国产大模型公司杭州深度求索开发的Deepseek应用27日登顶苹果中国地区和美国地区应用商店免费APP下载排行榜，在美区下载榜上超越了ChatGPT。Deepseek来自国产大模型公司深度求索，系量化巨头幻方量化旗下大模型公司。 1月20日，该公司正式发布推理大模型DeepSeek-R1。一经推出，DeepSeek-R1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。作为一款开源模型，R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版，并采用MIT许可协议，支持免费商用、任意修改和衍生开发等。目前，在国外大模型排名榜Chatbot Arena上，DeepSeek-R1的基准测试排名已经升至全类别大模型第三，与OpenAI的ChatGPT-4o最新版并列，并在风格控制类模型（StyleCtrl）分类中与OpenAI的o1模型并列第一。可能是国运级别的科技成果游戏科学创始人、黑神话悟空制作人冯骥深夜力推DeepSeek大模型，其认为DeepSeek可能是国运级别的科技成果。冯骥写到“太幸运了！太开心了！这样震撼的突破，来自一个纯粹的中国公司。知识与信息平权，至此又往前迈出了坚实的一步。”冯骥甚至激动的表示“如果这都不值得欢呼，还有什么值得欢呼？” 中信建投证券发布研报称，24Q4基金对计算机重仓持股比例为2.76%，较2024Q3环比下降0.19pct，低于历史3年平均水平3.71%，低于计算机板块市值占申万一级行业分类总市值的比重4.07%，连续四季度低配。近期AI Agent密集发布，智谱GLM-PC v1.1更新、OpenAI Operator带来了更自然的AI交互体验，有望推动AI应用加速发展。中信建投看好AI应用作为新一代生产力工具在B端商业化落地；看多政府支持下，底层AI算力产业发展，推荐关注国内算力产业链相关标的。 DeepSeek概念股曝光随着DeepSeek的爆火，相关概念股也随之曝光，其中包括参投股东、合作供应商和客户。浙江东方通过旗下杭州东方嘉富基金参与DeepSeek天使轮投资。华金资本是珠海国资旗下投资平台，通过华金领越基金参与DeepSeek Pre-A轮融资，布局AI大模型赛道。浪潮信息、中科曙光在算力基础设施方面为DeepSeek提供供应服务。浪潮信息为DeepSeek北京亦庄智算中心提供AI服务器集群，配套英伟达H800芯片及自研AIStation管理平台。中科曙光承建DeepSeek杭州训练中心的液冷系统。另外，拓尔思与DeepSeek联合开发金融舆情大模型，已在中信证券等机构部署智能研报生成系统。科大讯飞的教育场景接入DeepSeek-Math模型，推出AI数学辅导应用“星火助学”。
金融界01-27 08:30
国运级别的科技成果！黑神话悟空制作人冯骥深夜发声，力推DeepSeek大模型
 go
学创始人、黑神话悟空制作人冯骥深夜力推DeepSeek大模型，其认为DeepSeek可能是国运级别的科技成果。 26日深夜，冯骥在社交媒体发文表示DeepSeekV3大模型已经用了一个月，DeepSeekR1大模型用了5天，DeepSeek在推理能力、训练开销与使用费用、开源、免费、联网、本土化都等六方面全部实现突破，DeepSeek具有强大的推理能力；参数少，训练开销与使用费用小了一个数量级；任何人均可自行下载与部署，提供论文详细说明训练步骤与窍门，甚至提供了可以运行在手机上的mini模型；提供的服务完全免费，任何人随时随地可用；唯一支持联网搜索的推理模型；由没有海外经历甚至没有资深从业经验的本土团队开发完成。冯骥写到“太幸运了！太开心了！这样震撼的突破，来自一个纯粹的中国公司。知识与信息平权，至此又往前迈出了坚实的一步。”冯骥甚至激动的表示“如果这都不值得欢呼，还有什么值得欢呼？” 近日，DeepSeek正式开源R1推理模型。1月24日，DeepSeek-R1在Chatbot Arena综合榜单上排名第三，与OpenAI的顶尖推理模型o1并列。在高难度提示词、代码和数学等技术性极强的领域，DeepSeek-R1拔得头筹；在风格控制以及高难度提示词与风格控制结合的测试中，DeepSeek-R1均与o1 并列第一。更重要的是，工作人员发现，在DeepSeek-R1-Zero自我学习的过程，随着时间的增加，该模型“涌现”出了复杂的行为，如自我反思、评估先前步骤、自发寻找替代方案的情况，还包括一次“尤里卡时刻”（“aha moment”）。“尤里卡时刻”指人类突然理解一个以前无法理解的问题或概念的某个时刻。深度求索透露，这次“尤里卡”发生在DeepSeek-R1-Zero的的中间版本期间。当时工作人员惊奇地发现，在一道数学题中，该模型学会了使用拟人化的语气进行自我反思，并主动为问题分配了更多的时间进行重新思考。 26日下午，DeepSeek在美区苹果App Store免费榜升至第六位，超越Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。在用户蜂拥而入后，DeepSeek出现了短时闪崩现象。不少网友反映，使用时遇到 “服务器繁忙” 的提示。对此，DeepSeek回应称，当天下午确实出现了局部服务波动，但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后，用户访问量激增，服务器一时无法满足大量用户的并发需求。不过，官方状态页并未将这一事件标记为事故。值得注意的是DeepSeek-R1 API服务定价为每百万输入tokens 1元（缓存命中）/4元（缓存未命中），每百万输出tokens16元，输出API价格只有OpenAI o1的3%。低价背后，显然仍是秀肌肉，价格实力展现了技术实力——从AIInfra 层面降本的技术能力。以下为冯骥具体观点：游戏科学创始人、黑神话悟空制作人冯骥：年前还是认真推下DeepSeek吧。 V3已经用了一个月，但R1仅仅用了5天，不得不来发这条微博。先讲一句暴论：DeepSeek，可能是个国运级别的科技成果。为了讲清楚这个成果有多惊人，我打个比方：如果有一个AI大模型做到了以下的任何一条，都是超级了不起的突破—— 1、强大。比肩O1的推理能力，暂时没有之一 2、便宜。参数少，训练开销与使用费用小了一个数量级 3、开源。任何人均可自行下载与部署，提供论文详细说明训练步骤与窍门，甚至提供了可以运行在手机上的mini模型。 4、免费。官方目前提供的服务完全免费，任何人随时随地可用 5、联网。暂时唯一支持联网搜索的推理模型（o1还不支持） 6、本土。深度求索是一家很小规模的年轻中国公司，由没有海外经历甚至没有资深从业经验的本土团队开发完成上面的六条，DeepSeek全部、同时做到了。实在太6了，6到不真实。如果这都不值得欢呼，还有什么值得欢呼？那么，现在看到这条微博的你应该去做什么呢？ 1、请直接访问：网页链接马上用起来，也有移动APP 2、使劲用，疯狂用，尝试用它基本取代传统搜索。请想象你已经认识每个领域的顶尖专家，而且他们都是你随时在线的好朋友，把所有可能需要“请教别人”的问题，都拿去先问它——无论是构建一个复杂函数，搞清楚附近哪个游泳池最好，检查合同里的法律陷阱，让新写的歌词再押韵点，或者帮父母确认某个保健品是否真的有效 3、去看看别人是怎么用的，去试试其他大模型，了解AI擅长什么，不擅长什么，如何调教，然后继续解锁与迭代属于自己的用法与更多工具希望DeepSeek R1会让你对当前最先进的AI祛魅，让AI逐渐变成你生活中的水和电。太幸运了！太开心了！这样震撼的突破，来自一个纯粹的中国公司。知识与信息平权，至此又往前迈出了坚实的一步。
金融界01-27 08:00
【A股头条】周末A股重磅利好，证监会发声，积极发展股票ETF！利空英伟达？国产DeepSeek大模型震动全球AI圈
 go
25年远比2024年更好。题材掘金 DeepSeek升至美区苹果应用榜第六周末疯狂刷屏，来自国内量化私募巨头幻方量化的DeepSeek大模型的震动全球AI圈。截至1月26日下午，DeepSeek在美区苹果App Store免费榜升至第六位，超越Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。此外，因为用户蜂拥而至，DeepSeek出现了短时闪崩现象。不少网友反映，使用时遇到 “服务器繁忙” 的提示。标的:每日互动（300766）卓创资讯(301299) 2025年春节档预售票房突破6亿元 2025年春节档（1月28日—2月4日）预售于1月19日上午9点正式开启。预售开启当天累计预售1.85亿元，刷新了影史春节档预售开启首日最高票房纪录，比去年同期的成绩高了一倍多。此后几天春节档票房预售不断传来新消息，截至1月26日上午11时左右，2025年春节档预售票房突破了6亿元。其中，《射雕英雄传：侠之大者》《哪吒之魔童闹海》《唐探1900》3部影片的预售票房均达到1亿元以上。标的:中国电影（600997）北京文化（008002）公告精选【重大事项】 *ST美讯：公司股票将于2025年2月10日终止上市博汇股份：筹划公司控制权变更事项股票停牌上海石化：拟投资约31.96亿元建设大丝束碳纤维异地项目万通发展：终止重大资产重组事项富乐德：重大资产重组申请获受理特锐德：预中标项目总金额约1.98亿元浙江建投：子公司中标10.08亿项目陕建股份：联合中标高新至鄠邑高速复合通道工程项目特许经营项目沪光股份：向特定对象发行股票申请获同意注册批复凯众股份：拟不超4000万元设立摩洛哥子公司茂莱光学：拟发行可转债募资不超6亿元华仁药业：喷他佐辛注射液中选京津冀赣化学药品集采恒顺醋业：董事长杭祝鸿因个人原因辞职杉杉股份：控股股东杉杉集团被申请重整海通证券：2月5日为最后交易日将连续停牌至终止上市【业绩】金地集团：预计2024年净亏损56亿元到70亿元思特威：预计2024年净利润同比增长2512%到2830% 辽宁能源：预计2024年度净利润同比增加469.51%-754.27% 杉杉股份：预计2024年度净利润亏损3.2亿元到4.8亿元南京证券：2024年净利润9.99亿元，同比增长47.61% ST锦港：预计2024年净利润亏损64亿元至54亿元彩虹股份：预计2024年净利润同比增加81.52%到99.67% 山东黄金：预计2024年净利润同比增加15.98%-37.46% 达仁堂：预计2024年净利润同比增加118%-142% 通用股份：预计2024年度净利润同比增加85.19%-131.48% 中国高科：预计2024年度净利润为4704万元到5645万元绿地控股：2024年净利润预亏110亿元—130亿元苏州龙杰：2024年净利润同比预增254.69%—331.19% 鲁抗医药：2024年净利润同比预增42%—69% 普冉股份：2024年预计净利润约2.7亿元，同比扭亏维维股份：2024年净利润同比预增81.39%—129.13% 西部黄金：2024年预盈2.4亿元—3.2亿元，同比扭亏南京证券：2024年净利润同比增长47.61% ST花王：2024年预亏5.78亿元-8.59亿元，公司股票将存在被实施退市风险警示的风险 *ST恒立：预计2024年净亏损3300万元至4300万元公司股票可能被终止上市神雾节能：2024年预亏1000万元至2000万元，可能被实施退市风险警示【增减持】酒钢宏兴：控股股东累计增持1.31%股份奥翔药业：拟5000万元-1亿元回购公司股份【回购】奥翔药业：拟5000万元-1亿元回购公司股份交易提示【可转债交易提示】【开始转股】合顺转债【转债除息】上银转债形程转债天亲转债姚记转债【限售解禁】
金融界01-27 07:40
中国DeepSeek震撼全球：以560万美元训练6710亿参数AI模型，引发行业巨变
 go
中国DeepSeek震撼全球：以560万美元训练6710亿参数AI模型，引发行业巨变 DeepSeek发布R1模型及其技术细节创始人梁文峰的背景与团队建设中美AI竞争加剧的现实与挑战 DeepSeek模式的独特性与未来展望编辑观点名词解释今年相关大事件 DeepSeek发布R1模型及其技术细节根据TodayUSstock.com报道，本周，中国人工智能实验室DeepSeek引发全球关注，其发布的R1模型展示了如何以有限预算构建一个可以自主学习的语言模型。DeepSeek利用2048块Nvidia H800芯片和560万美元资金，训练出了一个拥有6710亿参数的模型，这与美国公司如OpenAI和Google DeepMind所花费的资源相比显得尤为高效。 DeepSeek的技术公开行动在硅谷引发激烈讨论，美国科技公司如Meta和Anthropic正试图捍卫其技术优势。这种开源方式也使得DeepSeek迅速成为全球AI领域的重要竞争者。创始人梁文峰的背景与团队建设 DeepSeek由对冲基金经理梁文峰创立，他曾通过运用AI和算法在量化交易领域积累财富。2021年，他购买了数千块Nvidia芯片，为其AI项目铺平了道路。当时，他的行为被认为是亿万富翁的“异想天开”。但梁的团队凭借对芯片性能的深入理解，成功建立了一支强大的AI工程团队。梁文峰强调本土人才的重要性，DeepSeek的核心团队由北大、清华和北航的博士组成，而非海外归国学者。这种纯本土化的团队结构也为其赢得了国内的高度赞誉。中美AI竞争加剧的现实与挑战中美之间的人工智能竞争愈演愈烈。尽管美国限制Nvidia高端芯片对华出口，DeepSeek通过优化本地芯片性能取得了显著成果。然而，美国企业并未止步不前。OpenAI与日本软银宣布联合投资1000亿美元建立AI基础设施，埃隆·马斯克的xAI也计划将其超级计算机扩展至100万块GPU。相较之下，DeepSeek的计算能力虽足以满足当前需求，但未来是否能继续保持竞争力仍是一个开放性问题。 DeepSeek模式的独特性与未来展望 DeepSeek以其专注于研究而非商业化的模式独树一帜。其核心目标是通过开源方式推动AI技术的普及。这种模式类似于早期的DeepMind，但也面临资金来源和持续创新的挑战。与此同时，DeepSeek的创始人梁文峰通过自有对冲基金为AI研发提供资金支持，其团队的高薪水平使其在人才争夺战中占据优势。尽管如此，高飞基金在2024年的回报率下降，部分原因被归因于梁对DeepSeek的投入过多。编辑观点 DeepSeek的崛起不仅展示了中国在人工智能领域的技术潜力，也凸显了全球科技竞争的激烈程度。在资源受限的情况下，DeepSeek通过创新实现了技术突破，成为全球AI行业的重要玩家。然而，随着技术门槛的提升和国际竞争的加剧，DeepSeek能否持续创新和保持竞争力仍值得关注。未来，中国如何在技术和政策上协调发展，将直接影响AI产业的全球格局。名词解释 DeepSeek：一家中国人工智能实验室，专注于自主学习模型的研究与开发。 R1模型：DeepSeek开发的拥有6710亿参数的语言模型，强调高效计算和低成本训练。 OpenAI：美国人工智能研究公司，以其先进的语言模型技术闻名。今年相关大事件 2025年1月：中国DeepSeek发布R1模型，并公开其技术细节。 2024年12月：OpenAI与软银合作宣布1000亿美元AI基础设施计划。 2024年11月：xAI扩展Colossus超级计算机，目标达到100万块GPU。来源：今日美股网
今日美股网01-27 00:10
利空英伟达？国产DeepSeek大模型震动全球AI圈，周末疯狂刷屏，量化私募巨头成功跨界AI！网名调侃：中国股民做出贡献
 go
狂刷屏，来自国内量化私募巨头幻方量化的DeepSeek大模型的震动全球AI圈！近日，DeepSeek公司宣布正式发布最新人工智能模型DeepSeek-R1，并同步开源模型权重。DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。 DeepSeek-R1在数学、代码、自然语言推理等任务上，性能比肩OpenAI o1正式版。数据显示，DeepSeek-R1在算法类代码场景（Codeforces）和知识类测试（GPQA、MMLU）中的得分略低于OpenAI o1，但在工程类代码场景（SWE-Bench Verified）、美国数学竞赛（AIME 2024, MATH）项目上，均超过了OpenAI o1 。更重要的是，工作人员发现，在DeepSeek-R1-Zero自我学习的过程，随着时间的增加，该模型“涌现”出了复杂的行为，如自我反思、评估先前步骤、自发寻找替代方案的情况，还包括一次“尤里卡时刻”（“aha moment”）。“尤里卡时刻”指人类突然理解一个以前无法理解的问题或概念的某个时刻。深度求索透露，这次“尤里卡”发生在DeepSeek-R1-Zero的的中间版本期间。当时工作人员惊奇地发现，在一道数学题中，该模型学会了使用拟人化的语气进行自我反思，并主动为问题分配了更多的时间进行重新思考。震动全球AI圈这一消息震动全球AI圈，美国AI公司研究人员对中国大模型技术感到吃惊。在最近两天DeepSeek-R1引发海外广泛讨论后，目前DeepSeek在苹果App Store应用商店美区免费榜排行第六，超越Google Gemini、Microsoft Copilot等美国生成式AI产品。今日有网友反映，DeepSeek崩了，提示服务器繁忙。一位Meta的工程师在美国科技公司员工社区Blind中这样写道，“Meta的生成式AI部门正处于恐慌中。这一切始于DeepSeek，它使得 Llama 4 在基准测试中已经落后。雪上加霜的是：那个不知名的中国公司，仅有550万美元的训练预算。工程师们正在疯狂地剖析DeepSeek，并试图从中复制一切可能的东西。” ”英伟达高级研究科学家Jim Fan表示，DeepSeek-R1可能是第一个展示了RL（强化学习）飞轮可发挥作用且能带来持续增长的OSS（开源软件）项目。加利福尼亚大学伯克利分校教授Alex Dimakis则称，DeepSeek似乎是奔赴OpenAI最初使命的“最佳人选”，其他公司需要迎头赶上。硅谷风投A16Z创始人Marc Andreessen也发表评论称，DeepSeek-R1是他见过的最令人惊叹且令人印象深刻的一个突破，作为开源的模型，它的面世给世界带来了一份礼物。不过，“深度学习”三巨头之一、图灵奖得主、Meta AI首席科学家杨立昆表示，DeepSeek-R1面世与其说意味着中国公司在AI领域正在超越美国公司，不如说意味着开源大模型正在超越闭源。训练成本大降，利空英伟达？此外，值得注意的是DeepSeek-R1 API服务定价为每百万输入tokens 1元（缓存命中）/4元（缓存未命中），每百万输出tokens16元，输出API价格只有OpenAI o1的3%。低价背后，显然仍是秀肌肉，价格实力展现了技术实力——从AIInfra 层面降本的技术能力。而训练成本一直是DeepSeek的一大优势。在其12月底发布的DeepSeek-V3中，参数量为671B，激活参数为37B，使用的预训练token量为14.8万亿。其多项评测成绩超越了阿里的Qwen2.5-72B和MetadeLlama-3.1-405B等其他开源模型，并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。前OpenAI联创、知名AI科学家AndrejKarpathy在其个人社交平台上表示，DeepSeek-V3整个训练过程仅用了不到280万GPU小时，相比之下，Meta旗下顶尖的开源模型Llama-3405B的训练时长是3080万GPU小时。如果DeepSeekV3的优良表现能够得到广泛验证，那么这将是资源有限情况下对研究和工程的一次出色展示。若从成本上进行更直观的对比，假设H800的租金为每GPU小时2美元，DeepSeek-V3的总训练成本仅为600万美元不到，是Llama-3405B超6000万美元训练成本的十分之一不到。对于深度求索强大的降本能力，“AI界的拼多多”呼声四起。英伟达的竞争对手、知名半导体公司超微半导体（AMD）昨日发布消息称，已将DeepSeek-V3模型集成到AMD的芯片产品Instinct MI300X GPU上，该模型旨在与SGLang一起实现最佳性能。DeepSeek-V3针对Al推理进行了优化。业内人士分析称，AMD作为全球领先的芯片厂商，通过与DeepSeek合作将为AI推理带来新的想象空间，也有望动摇“英伟达+OpenAI”联合主导的行业格局，改变既有的游戏规则。 DeepSeek不仅将模型训练成本大幅降低，而且发布的新模型R1也同步开源模型权重，公开了完整训练细节，挑战了闭源系统的优势。随着DeepSeek将AI大模型技术及使用门槛降低，有市场人士担忧，DeepSeekR1的崛起可能会削弱市场对英伟达AI芯片需求的预期，对英伟达的市场地位和战略布局产生影响。有观点认为，DeepSeek-V3极低的训练成本预示着AI大模型对算力投入的需求将大幅下降，这无疑将利空全球AI算力的核心供应商英伟达。网名调侃：中国股民做出贡献 DeepSeek是国内量化巨头幻方量化的子公司。依靠DeepSeek的出色表现，量化巨头幻方量化创始人梁文锋也迅速奠定了在AI圈地位。梁文锋本硕均就读于浙江大学信息与电子工程学专业。2015年，梁文锋与校友共同创立幻方量化。2021年，幻方量化成为国内首家突破千亿规模的的量化私募大厂，被称为国内量化私募“四大天王”之一。早年，幻方量化开始大规模布局 AI 算力，搭建起“萤火一号”集群。2021年，“萤火二号”落成，这给了DeepSeek快速奔跑的底层支撑。对此，有人调侃，中国股民给世界AI最大的的贡献就是让幻方量化赚了那么多钱。然后幻方量化创始人有钱买最好的GPU，收纳一批中国最牛的精英，做出了不错的Deepseek。
金融界01-26 17:13
DeepSeek引爆AI革命：题材核心企业全解析
 go
DeepSeek引爆AI革命：题材核心企业全解析 ——从数据到算力，谁将搭上AI时代的“超级快车”？随着中国AI公司DeepSeek发布其开源大模型R1，全球科技与资本市场的目光再次聚焦AI赛道。R1模型以成本仅为OpenAI的2%、性能全面超越GPT-4的震撼表现，不仅让硅谷巨头如临大敌，更在A股市场掀起一波“AI掘金潮”。本文从核心企业、业务关联、数据逻辑出发，深度解析与DeepSeek密切相关的企业。一、核心概念股：数据与资本的深度绑定1. 每日互动（300766）涨跌幅：上一交易日+8.5%，10日累计+32% 核心逻辑：股东协同：第二大股东幻方量化是DeepSeek的直接投资人，形成“数据-算力-应用”全链条绑定。数据资源：覆盖超4亿日活设备用户行为数据，为DeepSeek模型训练提供低成本数据支持。商业化场景：智慧交通、品牌营销等领域已验证技术转化率提升，合作模型在中信证券等机构落地。 2. 浙江东方（600120）核心逻辑：创投布局：通过杭州东方嘉富基金参投DeepSeek天使轮，2023年创投利润贡献占比达18%。稀缺性：A股少有的早期AI大模型投资标的，受益于DeepSeek估值跃升10。二、算力基础设施：AI时代的“卖铲人” 1. 中科曙光（603019）核心逻辑：液冷技术壁垒：为DeepSeek杭州训练中心提供PUE<1.15的液冷系统，技术全球领先。国产替代：自主可控算力需求激增，政策扶持明确。 2. 浪潮信息（000977）核心逻辑：服务器龙头：为DeepSeek北京亦庄智算中心提供H800 GPU集群，市占率持续领先。生态协同：自研AIStation平台适配多模态大模型训练需求。三、技术合作与硬件支持：AI落地的“隐形冠军” 1. 飞利信（300287）核心逻辑：架构创新：采用与DeepSeek-V2相似的MLA（多头潜在注意力机制），技术协同潜力大。应用场景：政务、金融领域AI解决方案或受益于模型开源生态。 2. 航锦科技（000818）核心逻辑：硬件支持：子公司超擎数智为DeepSeek提供光模块与交换机，深度绑定NVIDIA生态。算力网络：AI推理需求爆发带动高速通信设备订单增长。四、数据与生态：AI繁荣的“底层燃料” 1. 拓尔思（300229）核心逻辑：垂直场景：与DeepSeek联合开发金融舆情大模型，已在中信证券部署。政务优势：政府客户资源丰富，AI+政务赛道空间广阔2。结语：AI革命下的“长坡厚雪” DeepSeek的崛起不仅是技术的胜利，更是中国AI产业从跟随到引领的转折点。投资者需抓住“数据-算力-应用”三大主线，优先布局确定性高的基础设施标的（如中科曙光、浪潮信息），同时关注商业化验证快的场景合作方（如每日互动、拓尔思）。长期来看，AI技术的普惠化将重塑全球产业格局，而今日的“题材”或将成为明日的“核心企业”。
金融界01-26 15:04

上一页
1
•••
14
15
16
17
18
•••
20
下一页

24小时热点

最新话题更多