全球数字财富领导者
财富汇
|
美股投研
|
客户端
|
旧版
|
北美站
|
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
SFFE2030
外汇开户
登录 / 注册
搜 索
综合
行情
速递
日历
话题
168人气号
文章
估值2000亿!荣耀IPO进程渐近
go
lg
...
ek v3是最强的开源大语言型,并在非
推理模型
中,排名第二。 来源:DeepSeek公众号 官方介绍,通过在算法、框架和硬件方面的协同优化,DeepSeek V3的训练成本变得非常经济。 值得注意的是,根据其技术报告,作为一个超过700B参数的大模型,他的GPU用量、GPU小时数都远远低于Meta的Llama-3-405B:GPU数量大约是1/8,GPU小时数量大约是1/11。 简单来说,相对于其它前沿大模型,DeepSeek-V3 消耗的训练计算量较少,但其性能却能够比肩乃至更优;这一度引发了市场对算力需求的担忧,周五A股下午一点半中科曙光、澜起科技、龙芯中科、景嘉微等算力相关个股出现跳水。 广发证券报告表示,DeepSeek-V3算力成本降低的原因有两点。第一,DeepSeek-V3采用的DeepSeek MoE是通过参考了各类训练方法后优化得到的,避开了行业内AI大模型训练过程中的各类问题。第二,DeepSeek-V3采用的MLA架构可以降低推理过程中的kv缓存开销,其训练方法在特定方向的选择也使得其算力成本有所降低。 不过,有业内人士表示,DeepSeek-V3本身是一个垂类的模型,并不是OpenAl、Gemini、豆包等通用大模型。是针对特定任务和设计进行的,旨在提高效率的同时保持高性能。 除此之外,它的训练时间减少和算力需求降低,主要得益于算法优化、硬件适配和模型架构改进。然而,这并不意味着 AI训练对算力的要求普遍降低,因为 AI领域的整体趋势仍然是模型规模和复杂性不断增加。 DeepSeek-V3体验地址:chat.deepseek.com 论文链接:https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdf 03 上海:到2025年底,建成世界级人工智能产业生态 12月27日,上海市印发《关于人工智能“模塑申城”的实施方案》。《实施方案》提出,到2025年底,建成世界级人工智能产业生态,力争全市智能算力规模突破100EFLOPS,形成50个左右具有显著成效的行业开放语料库示范应用成果,建设3-5个大模型创新加速孵化器,建成一批上下游协同的赋能中心和垂直模型训练场。 其中提到,打造超大规模自主智算集群。建设自主可控智算支撑底座,支撑全市人工智能创新应用的算力需求。加快通用图形处理器、专用集成电路、可编程门阵列等自主智算芯片攻关,强化分布式计算框架、并行训练框架等自主软件研发。建设自主智算软硬件适配中心,推进自主智算芯片测试和集群验证。培育智算云服务商,探索训推一体的服务模式。优化市级智能算力公共服务平台,提升算力资源统筹调度能力。提升绿电供给能力,降低全市各类智算中心用电成本。 其中还提到,依托头部企业和科研机构,打造虚实融合的超大型实训场,建设支撑实训场的高性能计算集群、高精度三维建模和高质量训练数据集,创建与物理实体对应的高精度仿真环境和仿真训练系统,搭建超大规模城市级的模拟应用场景,率先赋能具身智能、自动驾驶等大模型实训。
lg
...
格隆汇
2024-12-29
微软继续受益于OpenAI的合作
go
lg
...
OpenAI的研究人员仍然没有找到这些
推理模型
在达到平台期之前从事“扩展推理”的时间限制。这在直觉上是有意义的,因为它类似于人类在“思考”很长时间后通常会提出更好的答案,或者在模型的情况下,执行“扩展推理”。在实践中,让模型执行一秒钟的扩展推理比让模型思考一分钟的结果更差。同样地,让模型思考一分钟会比让模型思考一小时产生更糟糕的结果。这种“扩展推理”实际上可以被视为文本输出,所以一个“思考”一个小时的模型可以从字面上喷出长篇小说的“思考数据”,类似于一个人在纸上草草写下想法,直到他们确信自己是正确的。这个事实在后面会很重要。 因此,OpenAI已经破解了如何“扩展推理”的代码,即找到一种方法,使模型花在“推理”或“思考”上的时间越多,答案就越准确。这与传统的LLM模型不同,在传统的LLM模型中,它给出准确答案的能力与你要求模型“思考”多长时间并没有太大的关联。OpenAI现在用“o”系列模型进行“规模化推理”的能力是真正的突破。OpenAI的研究科学家Noam Brown领导了这项工作,他认为这还需要10年的时间,因为缩放推理的问题已经解决了。相反,OpenAI只花了几年时间,现在我们有了革命性的“o3”模型。这具有巨大的意义,因为它现在为基础模型公司提供了两个向量,一个是传统的预训练,另一个是测试时间计算,即在模型已经预训练的推理时间。 这是一个“o”模型在给出“公主的年龄是...”这个问题的答案之前开始“思考”的例子。如你所见,模型开始分解问题,使其对自身更清晰。 来源:OpenAI 强化学习以迭代改进 为了掌握“扩展推理”,或简单地说“思考”,OpenAI增加了一个额外的强化学习层来训练其“o”系列
推理模型
。在广泛的文本预训练之后,这些模型经历了一个额外的强化学习阶段,在那里它们被训练以优化它们的思维过程。在这个阶段,模型为给定的提示生成多个潜在的推理路径。奖励机制,无论是基于AI的评估器还是人类反馈,都根据其正确性对每条路径进行评分。正面的奖励通过调整模型权重来加强有效的推理模式,以便在未来更有可能产生这样的推理路径。 作为一个非常简单的例子,假设给一个模型出了一个非常困难的数学问题,解决方案是1049。假设模型被提示了1000次这个确切的数学问题。结果,模型随后创建了1000个推理链,每个推理链对应于它被提示的确切相同的数学问题。然后假设这1000个推理链中只有10个得出了正确的答案1049。然后模型将调整其权重,以便在未来更有可能产生这10个“正确”的推理链。 现在,将数百万计的这类问题投向模型,从数学题到编程题,其中答案是客观的,并允许这些模型通过持续的权重/参数调整不断提炼其内部推理逻辑,很容易看出这样的模型将能够随着时间的推移提高其一般推理能力,以至于模型能够解决甚至超出其数据集的问题。这基本上通过其在ARC-AGI-PUB测试中的出色成绩得到了证明,该测试测试模型回答其数据集之外的问题的能力,被视为测试模型“一般智能”的圣杯。 进一步使用合成数据:超越“垃圾进垃圾出” 这些
推理模型
的一个好处是,“正确”推理路径现在可以作为合成训练数据反馈给模型。这些推理路径是高质量的、自我策划的训练示例,它们增强了模型的性能,而不仅仅依赖于人类标记的数据。由正确推理路径创建的合成数据之所以如此高质量,是因为这样的推理更有可能是正确的。毕竟,它们是产生正确答案的推理路径! 早期的合成数据方法常常与“垃圾进垃圾出”的问题作斗争,合成生成的数据要么微不足道,要么无关紧要,导致模型性能不佳甚至模型崩溃,就像蛇吃自己的尾巴一样。相比之下,“o”系列使用验证步骤来保持其合成数据的质量高。用更简洁的术语重申,当模型在训练中解决一个具有挑战性的问题时,它生成多个推理路径,并识别那些成功导致正确解决方案的路径。 这些经过验证的推理路径随后被存储为新的训练示例,有效地创建了一个高保真数据库,捕捉了解决问题技术的细微差别。与随机或简单的数据不同,这种自生成的合成数据既高度相关又有价值,显著增强了模型在不同领域泛化的能力。这就是所谓的“微调”,与强化学习相结合,很可能导致了“o”
推理模型
的突破。 想象在预训练过程中,下图中的每一条线都是一个推理链。错误答案的链被修剪,好的推理链可以反馈回模型进行微调。 来源:State Tech Magazine 对微软的影响 这意味着什么?自从“o”推理范式诞生以来,进展的速度令人震惊,没有明确的迹象表明其扩展有限制。此外,ARC基准分数呈指数增长,表明真正的推理智能可能以指数速度增长。我们可能正在见证一个不可阻挡的飞轮效应,OpenAI现在能够比竞争对手生成更多的合成数据,从而以更快的速度改进其模型,这反过来可以以更快的速度生成更有用的数据。 这一切因OpenAI的模型迄今为止使用最广泛而变得更加复杂,每周拥有约3亿用户,这意味着OpenAI将能够通过巧妙地使用客户查询产生的推理,以比竞争对手高得多的速率进一步微调其未来模型。这是一种来自OpenAI庞大客户基础的额外网络效应。当然,正如下面将讨论的,所有这些都将对微软产生非常积极的影响。 现在广为讨论的“AI墙”现在看起来更像是未来学家所流行的“AI起飞”概念,进步的线条增长如此之快,以至于看起来像一堵“墙”。这与许多AI怀疑论者预测的情况完全相反。 来源:arcprize Azure的AI驱动扩张 OpenAI模型智能的加速起飞对微软有着巨大的影响,微软基本上可以首先使用OpenAI的模型,这是由于它与该公司的合作关系。微软与OpenAI的战略合作关系使其处于这个飞轮的核心。通过将这些模型整合到其Azure平台中,微软可以为企业提供最先进的云AI模型和工具,极大地提高生产力。 Azure的智能云部门在2025财年第一季度单独增长了20%,达到241亿美元。AI服务单独贡献了Azure增长的约12个百分点。然而,Azure不仅仅是OpenAI技术的被动受益者。鉴于企业之间的竞争如此激烈,能够访问最新模型可能具有巨大的优势,这将使微软在吸引客户使用其云服务方面拥有巨大的优势。事实上,能够访问最尖端模型可能是企业客户的差异化因素,特别是鉴于与亚马逊或谷歌的竞争如此接近。 云霸权之战正变得越来越紧张,使任何区分自己与竞争对手的手段成为Azure成功的关键。 来源:Synergy Research Group Microsoft 365和企业AI集成 微软还能够将“o”系列能力整合到其无数的软件产品中,如Microsoft 365 Copilot和GitHub Copilot。微软产品性能的提升几乎肯定会吸引更多用户,并培养更大的客户忠诚度。此外,如果客户看到真正的生产力提升,企业级采用这些AI工具可能特别粘性。 如果企业能够通过使用OpenAI最先进的模型节省员工每周几个小时的生产力,它们很可能愿意支付高昂的溢价。无论溢价有多昂贵,人类几乎总是比运行推理更昂贵,即使是最大和最复杂的模型。毫不奇怪,微软认识到这一潜力,并正在向其AI基础设施投入巨额资金。 仅在2025财年第一季度,微软就在AI和云基础设施上投资了2000亿美元,并预计在2025财年将花费超过8000亿美元。这种积极的投资确保了微软能够充分利用高性能计算的增长需求和扩展推理所需的资源。虽然这些投资将对利润率产生短期压力,但它将使微软在AI领域长期增长和领导地位。 仍然存在巨大风险 微软仍面临来自其他超大规模企业的若干重大风险。激烈的竞争是主要关注点,因为其他主要科技巨头如亚马逊和谷歌也在投资数十亿美元与竞争的基础模型制造商竞争。鉴于由Anthropic或谷歌创建的模型通常最多落后于OpenAI几个季度,OpenAI的任何小失误都将给竞争模型制造商足够的时间迎头赶上。事实上,许多行业专家已经推测,这种情况一直持续到OpenAI宣布其开创性的“o3”模型。 微软面临的另一个主要风险是OpenAI实际上实现了AGI,在这一点上,他们协议中的一个条款规定微软将无法再访问其模型。然而,即使是OpenAI也希望移除这一条款以吸引微软的更多投资。此外,所谓的AGI是非常主观的。如果OpenAI和微软都希望继续他们的交易,他们几乎肯定会找到绕过这一条款或完全移除它的方法。 总结 如果这些“o”
推理模型
确实是AI起飞到真正的AGI的开始,微软的股价可能会因为首先访问这些模型而爆炸。一旦竞争基础模型制造商赶上OpenAI的当前迭代,OpenAI可能会再次领先,这最终意味着微软领先。即使在其市值达到3.3万亿美元的情况下,该公司的前瞻性市盈率为33,如果OpenAI的“o”
推理模型
像看起来那样革命性,那么仍有更大的上升空间。 $微软(MSFT)$
lg
...
老虎证券
2024-12-27
中美重磅!华尔街日报:中国人工智能公司已找到变通途径 正快速追赶美国同行
go
lg
...
司表示,该程序的能力优于OpenAI的
推理模型
01,后者于9月以预览版形式推出。 最近几周,其他中国公司也发表了类似的声明。由中国互联网巨头阿里巴巴(Alibaba)和腾讯(Tencent)支持的初创公司Moonshot AI表示,它开发了一个专门研究数学的模型,其能力接近OpenAI 的 o1,而阿里巴巴表示,他们自己的一个实验研究模型在数学上优于OpenAI的o1预览版本。 这些公司还没有发表描述他们模型的论文,而且难以评估这些说法,因为对人工智能模型的能力没有一个公认的测试。不过,一些美国专家表示,他们对对这些模型“印象深刻”。 OpenAI前研究员、现任人工智能企业家Andrew Carr表示,中国正在“更快地追赶”。他说,DeepSeek的研究人员试图复制OpenAI的
推理模型
,“在几个月内就弄清楚了,坦率地说,我的许多同事对此感到惊讶。” 一个用来做比较的测试是美国国际数学邀请赛(AIME),它是为了挑战最聪明的高中数学学生而设计的。 DeepSeek表示,其模型在AIME上击败了OpenAI。但《华尔街日报》利用今年AIME的15个问题进行的一项实验发现,OpenAI的o1预览模型比 DeepSeek、Moonshot和阿里巴巴的实验模型更快找到了答案。在一个假设的双人游戏中涉及策略的字谜中,OpenAI程序在10秒内给出了答案,而DeepSeek花了两分钟多时间。 在第一次尝试中获得正确答案仍然是一项壮举,因为文字问题经常难倒人工智能程序。 自2022年以来,中国人工智能开发人员一直面临美国对世界上最先进的人工智能芯片的限制,包括芯片领导者英伟达(Nvidia)的芯片。在12月,拜登政府再次收紧出口管制规定。 但《华尔街日报》称,开发人员已经找到了变通途径。在由阿里巴巴和腾讯支持的初创公司Moonshot,创始人杨植麟表示,该公司专注于强化学习,模仿人类的试错过程。这种方法可能在提高性能方面较少地使用计算能力。 自去年年底以来,人工智能开发人员越来越多使用一种名为“混合专家模型”(Mixture of Experts, MoE)的技术,这种技术能降低对芯片的需求。 腾讯表示,11月发布的MoE模型的性能堪比Facebook母公司Meta Platforms今年7月推出的Llama 3.1模型。审阅了两家公司发表的论文的研究人员表示,腾讯的模型可能是用Meta使用的大约十分之一的计算能力训练的。 DeepSeek最初是High-Flyer的人工智能研究部门。High-Flyer是一家拥有80亿美元资产的量化对冲基金管理公司,以利用人工智能进行交易而闻名。2021年,DeepSeek将大约1万块英伟达的A100芯片连接起来,形成了一个用于人工智能训练的集群,该集群被称为Fire-Flyer 2。 在今年8月发表的一篇论文中,DeepSeek表示,Fire-Flyer 2的性能接近英伟达包含类似芯片的系统,但中国的系统成本更低,能耗更低。DeepSeek在5月份发表的关于其MoE模型的论文在业界引起了广泛关注,该模型采用了一种更有效地处理数据的技术。 人工智能初创公司Anthropic的联合创始人Jack Clark在他的博客中写道:“中国绕过出口管制的一种方法是,利用它可以访问的硬件建立非常好的软件和硬件培训。” Clark称:“‘中国制造’将成为人工智能模型的一部分,就像电动车、无人机和其他技术一样。” 《华尔街日报》指出,许多中国人工智能开发人员已经找到获取受限制的英伟达芯片的方法,包括通过与中间商和海外数据中心的交易。尽管如此,据中国高管称,缺乏尖端芯片对中国初创企业来说是痛苦的,而且差距还会扩大。英伟达的客户正准备大规模部署其最新的人工智能数据中心芯片Blackwell。 马斯克(Elon Musk)的xAI公司已经用10万块英伟达芯片建造了一个数据中心,最近还筹集了50亿美元来做更多的事情。亚马逊网络服务公司(Amazon Web Services)计划用数十万块本土芯片打造一台大型人工智能超级计算机。 专注于开源模型的DeepSeek强调数学和编码。Moonshot凭借其类似ChatGPT的聊天机器人Kimi在中国消费者中广受欢迎,并以其处理长文本的能力而闻名。
lg
...
tqttier
2024-12-27
24小时环球政经要闻全览 | 12月25日
go
lg
...
AI的诸多其他技术与产品,如备受赞誉的
推理模型
和助力自动化各类软件工程与分析任务的智能体,任何潜在的类人机器人项目似乎优先级较低。 美国钢铁公司与日本新日铁交易命运取决于拜登 据CNN报道,两位知情人士透露,由高级政府机构官员组成的委员会已告知总统乔・拜登,他们尚未就日本新日铁收购美国钢铁公司一事是否危及国家安全达成共识。如今,新日铁收购美国钢铁的命运掌握在拜登手中,拜登数月来一直主张新日铁应继续由美国掌控,以保护国内钢铁业就业,预计他将阻止该交易。
lg
...
格隆汇
2024-12-25
隔夜美股全复盘(12.25) | 特斯拉大涨逾7%,马斯克旗下xAI公布60亿美元融资部分投资者名单,含贝莱德、英伟达等
go
lg
...
其许多其他技术和产品,例如其备受赞誉的
推理模型
和能帮助自动化各种软件工程和分析任务的代理人。然而,OpenAI 甚至考虑开发类人机器人这一事实,突显了其日益增长的雄心,旨在涉足从搜索和网络浏览器到服务器芯片和数据中心规划的各个领域。 4、腾讯最大股东Prosus的一则收购案引爆美股市场 12.24 腾讯最大股东Prosus的一则收购案引爆美股市场。昨晚美股开盘后,Despegar(DESP)股价一度涨超33%,最新总市值报16.3亿美元。Prosus投资团队正开启“买买买”模式,试图在全球范围内寻找那些颇具潜力的公司。Prosus将斥资17亿美元收购Despegar,后者是一家位于拉美的在线旅游公司,是该地区规模最大、历史最悠久的线上旅游平台之一。 24年11 月,Temu 在全托管模式下新增了 3 个国家。根据 Sensor Tower 的数据,11 月 Temu 的全球月下载量 / 月活跃用户数 / 日活跃用户数环比分别为 -28%/+3%/+3%,其中美国为 -36%/+1%/+4%,欧盟为 -20%/+4%/+3%,拉丁美洲为 -33%/+3%/+2%。 消息称中国数据中心有孚拟赴美上市 12.24 彭博引述知情人士称,中国新型云计算数据中心服务商有孚(Yovole)据报寻求美国招股上市,该集团计划集资约1亿美元,最快明年1月向美国证交会秘密递交表格登记申请上市。该集团曾计划于2020年申请A股上市,但最终未能成事。 有孚2001年在上海成立,现分别在北京、上海、广州、深圳等建有大型云计算数据中心,为大型互联网、人工智能、金融、教育、能源等政企行业提供云计算及数据中心服务。资料显示,阿里巴巴、腾讯控股及中国银联等为其客户,自2018年起,有孚已先后获中金、华泰证券、鼎晖投资等投资,其中鼎晖投资持股超过5%。 5、美股异动|Rumble昨日暴涨超81%后续涨超10% 与泰达币达成战略投资协议 12.24 Rumble(RUM.US)续涨超10%,报14.34美元。该股昨日已暴涨超81%,盘中最高触及14.628美元创逾两年新高。消息面上,Rumble宣布已与泰达币达成7.75亿美元的战略投资的最终协议。泰达币是数字资产行业最大的公司,也是全球使用最广泛的美元稳定币,拥有超过35000万用户。 04 今日前瞻 今日重点关注的财经数据 (1)12.25圣诞节休市
lg
...
格隆汇
2024-12-25
12月23日财经早餐:美国政府关门危机结束!巴菲特又有大动作
go
lg
...
0万美元的VeriSign股票。 超级
推理模型
正面对垒:谷歌版o1发布次日,OpenAI o1下一代o3登场 谷歌和OpenAI正面对垒,谷歌刚发布自家的先进
推理模型
挑战OpenAI的o1,第二天,OpenAI就推出了升级版的最强
推理模型
o3,OpenAI计划明年初发布o3系列模型。周五谷歌(GOOG)涨1.72%。 大众德国工厂保住了,但报道称将裁员超1万人 上周五大众汽车与工会达成协议,减少汽车产能,保留德国工厂。另外,德国《经理人》杂志消息称,大众计划在未来几年内裁超1万名员工。周五大众汽车ADR(VWAGY)涨超6%后涨幅砍半。 今日要闻前瞻 英国三季度GDP。 加拿大10月GDP。 中国十四届全国人大常委会第十三次会议。 原文链接
lg
...
投资慧眼
2024-12-23
音频 | 格隆汇12.23盘前要点—港A美股你需要关注的大事都在这
go
lg
...
00人以上; 9、OpenAI发布高级
推理模型
o3; 10、苹果AI合作方生变猜想:需加快敲定合作,百度或需重新审视策略; 11、日本流感个案急增 总感染人数达逾71万人; 12、诺和诺德新一代减肥药CagriSema实验结果不及预期; 13、圣诞假期休市提醒; 14、特朗普要求巴拿马降低通行费 否则收回巴拿马运河; 15、特朗普:欧盟必须通过大规模购买美国石油和天然气来弥补与美国的巨大赤字; 16、乌总理:乌克兰将于2025年1月1日停止转运俄罗斯天然气; 17、普京:俄罗斯准备在不损害自身利益的情况下与美国恢复关系; 18、特朗普:对TikTok在美国继续运营持开放态度; 大中华区要闻: 1、李强:加强算力等新型基础设施布局建设; 2、证监会:将香港互认基金客地销售比例限制由50%放宽至80%; 3、证监会:支持更多投资者拿起包括民事诉讼等在内的法律武器 追究违法违规者的民事损害赔偿责任; 4、拒绝哗众取宠、低俗庸俗 广电总局要求加强微短剧片名审核; 5、香港互认基金松绑多项限制,北上基金年内规模翻倍有望扩容提速; 6、北京11月社会消费品零售总额同比-14.1%; 7、上海11月社会消费品零售总额同比-13.5%; 8、2024年3季度末金融业机构总资产489.15万亿元; 9、中国生猪养殖扭亏为盈 预计全年头均盈利约200元; 10、多地白羽鸡养殖场爆发鸭疫 业内:死淘率增加 部分大厂尚未受到影响; 11、多地疾控提示关注流感 美团相关看病买药需求周增超1倍; 12、报告:小游戏市场收入暴涨99%; 13、多家银行下调美元存款利率; 14、国家医保局:高度关注个别药企虚开发票制造“两套价格”问题; 15、深圳证监局对中信证券出具警示函; 16、港元短存突爆年化16.8%超高息 中小行猛抢年结资金; 17、今日港股越疆上市,A股黄山谷捷申购; 18、南下资金大肆加仓腾讯和中芯国际; 19、公告精选︱光环新网:拟22.95亿元投资建设算力基地项目;莫高股份:董事长杜广真因涉嫌内幕交易被证监会立案; 20、公告精选(港股)︱复宏汉霖(02696.HK)就E-602及联合疗法与PALLEON订立合作及许可协议; 21、A股投资避雷针︱中英科技:拟终止重大资产重组事项;莫高股份:董事长杜广真因涉嫌内幕交易被证监会立案。
lg
...
格隆汇
2024-12-23
AI进化遇阻:ChatGPT的下一次重大飞跃,落后于计划且成本高得离谱
go
lg
...
苹果的研究人员最近发表了一篇论文,提出
推理模型
(包括o1的某些版本),很可能只是模仿它们在训练中见过的数据,而不是实际解决新问题。 苹果研究人员指出,如果问题稍作修改,比如在一个关于猕猴桃的数学问题中加入无关细节(例如说明一些水果比其他的更小),模型的表现会出现“灾难性下滑”。 今年9月,OpenAI推出了o1
推理模型
的预览版,并在本月初发布了o1的完整版本。 但这些增强的推理能力代价高昂。与仅生成单一答案相比,OpenAI现在需要为每个查询生成多个答案,从而增加了运行成本。 在最近的一次TED演讲中,OpenAI的一位高级研究科学家重点介绍了推理能力的优势。 “事实证明,在一局扑克游戏中,让机器人思考20秒所带来的性能提升,相当于将模型扩展10万倍并训练10万倍更长时间所达到的效果,”OpenAI科学家诺亚姆·布朗说。 更高级、更高效的
推理模型
可能会成为Orion的基础。OpenAI的研究人员正在追求这种方法,并希望将其与以往的大量数据训练方法相结合,这些数据部分可能来自OpenAI的其他AI模型。随后,OpenAI可以使用人类生成的材料对结果进行精细化处理。 上周五,奥特曼宣布了一个新的
推理模型
计划,这款模型将比公司之前发布的任何模型都更智能。但他并未透露关于何时或者是否会推出一个足以被称为GPT-5的模型的信息。 来源:加美财经
lg
...
加美财经
2024-12-23
干翻英伟达,明年将是转折吗?
go
lg
...
学习和思考,以做出准确的操作,这恰恰是
推理模型
接下来精进和延申的方向。 而数据飞轮得以转动的关键在于,开发合适的软硬件来满足用户的需求。 今年下半年“AI+应用”的商业化赛道再次瞩目,Applovin、Shopify、Palantir等不同赛道的美股公司,受益于AI带来的业务爆发,股价持续走强。 国内也重点着力于AI应用的发展,字节大模型虽然起步晚,但后来居上,目前豆包DAU接近900万,增速超过15%,位居全球第二。不仅打出了多款应用组合,还投入到了AI硬件中,积极寻找C端场景。其他互联网巨头如百度、小米也开始投入到AR眼镜的开发里。 (Ola Friend;官网) 03 AI渗透率即将跨越鸿沟? 机构预测,英伟达GPU目前在推理市场中市占率约80%,但随着大型科技公司定制化ASIC芯片不断涌现,这一比例有望在2028年下降至50%左右。 但,ASIC的崛起并不意味着GPU的衰退。这两种技术可能将长期共存,为不同需求场景提供最佳解决方案。 可以肯定的说,AI目前还没有达到我们期待的样子,但推理技术的进步开始支持其走向终端,未来类似的“英伟达时刻”将会更多出现在推理端。 不过,欲戴王冠必承其重。譬如Arm,在2月份给出了乐观的预测,并表示这“只是人工智能繁荣的开始”。股价在接下来的三个交易日内飙升93%,但此后股价经历了较大的波动,目前已较7月份的高点下跌逾20%。 而过去一周,博通2025财年每股净收益的预期上涨了12%。并非每一个“英伟达时刻”都能带来持续增长。(全文完)
lg
...
格隆汇
2024-12-21
估值200亿!“AI独角兽”智谱又融了30亿
go
lg
...
,之后多模态模型竞相出现,再到如今深度
推理模型
成顶流,端侧大模型和Agent技术成新风向。 而基础层的AI芯片领域,近期市场也见证了博通和英伟达的跷跷板游戏。12月12日,博通发布了截至11月3日的第四财季财报,AI收入同比增长220%达到122亿美元,超出市场预期。 业绩发出后,博通的股价两天大涨38.38%,而英伟达自高点已经下跌了约10%,博通也因此成为美国第9家、全球第12家市值达到1万亿美元的上市公司。 博通的财报也让大家意识到,目前虽然是英伟达通用GPU的天下,但是,在降本的诉求下,定制芯片ASIC已经成为了众多公司的新选择。 博通认为,3年后或“希望实现”ASIC与GPU至少平分天下。 博通股价走势,来源:东方财富 03 国内AI公司融资火热 除智谱外,12月以来国内还有多家AI产业链的企业获得融资。 面壁智能:AI公司面壁智能完成新一轮数亿元融资,由龙芯创投、鼎晖百孚、中关村科学城基金和赛富基金联合领投。 据悉,本轮融资完成后,公司将进一步提速以端侧AI为代表的高效大模型商业化布局,以同等参数、更高性能、更低能耗、更快速度的AI大模型技术深度服务行业,为用户创造具体可感知的价值。 hohem浩瀚:成立于2014年的智能影像先锋品牌“hohem浩瀚”近日完成超亿元B轮融资,由顺为资本、君联资本联合领投,小米战投、云启资本、同创伟业、云沐资本跟投。 作为AI跟拍稳定器首创者,hohem浩瀚以用户思维为导向,通过将智能科技融入影像拍摄,致力于为用户带来更多轻松、高效的智能拍摄体验。本轮融资后,公司将加大对 AI 技术、影像技术、高精度自动控制技术的研发投入,持续提升产品创新,落地更丰富的应用场景,用创新的产品体验及过硬的产品品质,推动智能影像科技的全球化发展。 云鲸智能:扫地机器人独角兽企业云鲸智能已完成数亿元新一轮融资,投资方为深圳和无锡两大国资。在本轮融资之前,云鲸智能已密集完成多轮融资,投资者包括李泽湘管理的清水湾基金、字节跳动、红杉资本、明势创投、源码资本等知名机构。 据悉,云鲸智能此轮资金将用于加大海外投入,覆盖更多的国家和地区市场,预计明年仍有三到四倍的增长空间。 未来,中国AI产业链的发展前景非常广阔,预计将在2025年迎来AI应用的主升段。
lg
...
格隆汇
2024-12-17
上一页
1
•••
17
18
19
20
21
•••
23
下一页
24小时热点
【直击亚市】北京将被迫坐到谈判桌前!市场等中国进一步刺激,黄金又大跌了
lg
...
黑天鹅事件可能爆发!特朗普突传将被国会“弹劾”,究竟怎么回事?
lg
...
中美关税突传重大消息!特朗普语出惊人 比特币9.35万多头受阻、黄金3310避险回落
lg
...
突然向社群发话!昔日华人首富曝光“中本聪”真实身份……
lg
...
中国国家主席习近平重大发声!事关在与美国竞争中的人工智能发展和监管
lg
...
最新话题
更多
#Web3项目情报站#
lg
...
6讨论
#SFFE2030--FX168“可持续发展金融企业”评选#
lg
...
32讨论
#链上风云#
lg
...
82讨论
#VIP会员尊享#
lg
...
1917讨论
#CES 2025国际消费电子展#
lg
...
21讨论