全球数字财富领导者

星环科技(688031.SH)发布DeepSeek"三位一体"方案,加速“算力平权”落地

2025-02-24 14:59:40
格隆汇
格隆汇
关注
0
0
获赞
粉丝
喜欢 0 0收藏举报
— 分享 —
摘要:人与智能世界的互动模式正经历着翻天覆地的变化,算力平权的理想正逐步从理想照进现实,开启了一个全新的智能时代篇章。

中国AI正掀起全球"算力平权"革命。

当中国AI初创公司DeepSeek以557.6万美元的训练成本,在数学推理、代码生成等核心指标上追平硅谷巨头耗资数亿美元打造的模型时,这场由算法创新与开源生态共同驱动的技术革命,正在将科技巨头垄断的算力资源转化为普惠化基础设施。

在这场由中国企业主导的变革中,本土生态的构建正在提速。尽管与国际先进水平仍存差距,但政策支持与市场倒逼的双重驱动下,从国产硬件到端侧应用的自主化链条逐步成型。同时,随着推理侧算力成本的降低,“算力平权”将有望加速端侧AI和Agent应用的落地,同时落地应用也将带来信创建设需求,相关板块将迎来新的投资布局机会。

在这一背景下,AI技术的普惠化和应用场景的拓展成为行业关注的焦点。2025年2月23日,以“模塑全球 无限可能”为主题的全球开发者先锋大会(GDC)圆满落幕。在这场汇聚全球开发者与创新者的大会上,星环科技(688031.SH)正式发布"三位一体"的DeepSeek全场景解决方案,涵盖省力版、高阶版和端侧版,全面覆盖个人用户、企业客户及行业场景需求,为用户提供从个人到企业、从云端到本地的全方位AI应用支持。

这种覆盖个人用户到企业级场景的全栈能力,正在为这场算力平权运动提供关键基础设施。

一、云端协同新范式

在AI技术快速普及的当下,星环科技通过云端协同与端侧智能的结合,为用户提供了即开即用的高效体验。针对轻量化需求场景,星环科技推出了网页版及小程序服务,用户无需下载或配置,即可直接调用DeepSeek 671B满血版模型的AI搜索能力。这种“打开即AI”的模式,让普通用户能够快速体验大模型的语义理解、信息检索等核心功能。

然而,纯在线模式存在一些局限性。首先,在线模式需要将用户数据上传至云端处理,高度依赖网络稳定性。弱网环境可能导致响应延迟或服务中断,影响对实时性要求较高的场景,如实时翻译和AR交互。其次,用户原始数据(如照片、语音)需传输至云端,存在被截获或滥用的风险,尤其在金融、医疗等敏感领域难以满足合规要求。此外,部分场景因政策或物理限制无法联网,纯在线模式无法提供服务。

为解决这些问题,星环科技推出了“无涯问知 AI PC”版,并接入DeepSeek,实现大模型在个人电脑端的本地化流畅运行。通过分层知识蒸馏技术,星环科技将参数量高达6710亿的原始大模型压缩至轻量级版本。这一技术并非简单缩小模型,而是通过保留核心能力,攻克了终端部署的三大瓶颈——存储空间、算力消耗与推理延迟,使端侧AI从“能用”进阶为“好用”。

星环科技的解决方案不仅让端侧AI“好用”,更在隐私与效能之间找到了完美的平衡。数据全程封闭处理,结合本地RAG(检索增强生成)技术,用户可以离线分析敏感文件。某律所的实测结果显示,法律案例解析效率提升了50%,且数据零出网,充分保障了用户隐私。同时,通过Intel Ultra处理器的专项优化,性能提升了30%,彻底打破了“AI必须依赖高端硬件”的固有认知,仅需8GB内存即可运行大模型。此外,星环科技还实现了云端协同的“双模智能”。这种动态调度能力,让一台普通笔记本电脑同时具备了安全性与高阶智能,兼顾了实时体验与功能深度。

星环科技的这一布局,填补了国产AI本地化部署的空白,为金融、法律等数据敏感行业提供了安全可控的解决方案。

市场分析人士指出,端侧AI的“iPhone 4时刻”已经到来。未来,随着分布式计算与Agent技术的深化,终端设备将逐步具备自主任务处理能力,推动AI从工具向智能化基石的质变,背后可能是万亿级的市场空间。

星环科技正与硬件厂商深度合作,未来将有更多预装AI模型的终端设备面世。

2025年,星环科技与宏碁合作开发了宏碁专属的AI助手——A星人专业版,并定制推出了全新的AIPC产品——宏碁优跃PRO。该产品预装了无涯问知AI系统和单机版向量数据库。此前,星环科技已与惠普合作,推出了预装无涯问知AI系统的AI PC套装,旨在为个人电脑用户提供本地化AI服务。目前,内置星环科技AI PC服务的AI PC电脑已在各大电商平台上线,标志着星环科技在端侧AI领域的布局已初见成效。

二、全栈技术与场景化服务融合

AI浪潮席卷全球,企业智能化转型已成大势所趋。在这场变革中,星环科技凭借“全栈技术+国产化生态”的双重壁垒,构建了企业级AI部署的核心竞争力。其战略布局围绕全栈技术闭环与场景化服务能力两大支点,成功打破传统AI在企业级部署时的碎片化困局。

1. 技术壁垒:全链路能力构建护城河

星环科技的核心武器,是其自主研发的Sophon LLMOps平台。与仅聚焦模型训练或推理的竞品不同,该平台覆盖了从语料处理、提示工程、模型训练调优到应用落地的全生命周期管理。例如,在语料处理环节,平台支持多模态数据从多源接入,通过转换、过滤、去重及安全隐私处理,解决企业数据分散、质量参差的痛点。

国产化适配能力,则是另一道护城河。星环科技的解决方案支持国内外GPU/NPU的混合调度,为企业提供了灵活的算力选择。此外,平台针对国产GPU(如寒武纪、海光、昇腾等)进行底层优化,充分发挥硬件性能,支持FP8等混合精度计算。这不仅提升了资源利用效率,还使得企业能够在国产化硬件平台上实现高性能计算。这一自主可控的算力底座,可以满足了不同行业对数据安全与合规的要求。

凭借这些技术优势,Sophon LLMOps平台实现了全栈能力覆盖,支持开源、商业化及自研模型的统一管理。它已成功帮助客户搭建大模型管理平台,纳管超过30种开闭源的生成式大模型及70余个大模型服务。平台提供基于671B参数规模大模型(R1版本)的训练、推理及应用开发服务,支持FP8混合精度计算,显著提升训练效率并降低显存占用,实现了“满血”性能释放。这种从底层硬件到上层应用的全方位优化,不仅提升了技术的实用性,更为企业级AI部署提供了高效、安全、可控的解决方案。

2、场景化服务能力:垂直场景的“外科手术式”适配

技术优势向商业价值的转化,则依托于场景化服务能力的精耕细作。

然而,下游应用场景日益碎片化与纵深化,技术提供商需要对垂直场景进行深度解构,以实现技术与业务的深度融合。这意味着他们不仅要具备通用化的技术能力,更需要深入理解各行业的Know-How,从而为客户提供真正贴合业务需求的解决方案。

星环科技的Sophon LLMOps平台正是基于这一理念而构建,以打造"技术解耦+知识融合"的双轮驱动模式。

平台内置高效的分布式训练框架、微调工具链及模型压缩技术,能够支持企业快速适配业务数据,显著降低大模型的应用门槛。这种场景化开发支持能力,使得企业能够在短时间内将AI技术落地到实际业务中,提升运营效率。

此外,Sophon LLMOps平台还结合金融、政务、医疗等行业知识库,打造领域专属的大模型。这些模型针对特定行业的需求进行了优化,能够在业务场景中提供更高的准确性和实用性。例如,在金融领域,专属模型可以精准识别风险并辅助投资决策;在医疗领域,模型能够支持辅助诊断,提高诊断效率和准确性。

展望未来,Sophon LLMOps平台将继续拓展其应用场景,面向研发、采购、生产、HSE、营销、综合办公等多个领域提供集约化的平台服务。通过这种一站式的服务模式,平台将助力企业核心业务实现智能化转型升级,为企业带来更高效、更智能的运营体验。

在技术优势与场景化服务能力的双重加持下,企业智能化转型似乎已步入快车道。然而,当AI技术真正触及数据主权与成本效益的深水区时,一个更为复杂的挑战浮出水面——如何破解企业级AI部署中的"不可能三角"?

三、破解企业级AI部署中的“不可能三角”

在AI技术加速普及的浪潮中,企业级AI部署正面临一场前所未有的挑战。政府机构、央国企以及金融、医疗等数据敏感型行业,需要在保障数据主权安全的同时,实现AI应用的高效落地,并有效控制成本。这一难题被形象地称为企业级AI部署的“不可能三角”。

据第三方测试数据显示,传统云端AI方案的平均响应延迟高达1.2秒,难以满足实时风控、智能客服等对时效性要求极高的业务场景。与此同时,政府、央国企以及金融、医疗等行业涉及大量公民隐私、国家安全和商业机密数据。随着《关键信息基础设施安全保护条例》等法规的落地,私有化部署的合规性需求愈发凸显。在此背景下,浙商证券预估,随着DeepSeek等大模型带动的快速部署需求增长,约80%的央国企大模型使用场景将转向私有化部署。然而,自建算力中心的高昂显性成本——动辄千万级的投入,以及私有化部署的隐性成本——高筑的技术门槛与时间投入,让众多中小机构乃至大机构望而却步。因此,第三方服务商的支持成为破局的关键。

46万家央国企的存量需求正在引爆一个千亿级市场,吸引众多企业入局。星环科技就是其中的范例。

星环科技如何破解这一“不可能三角”?

星环科技通过其Sophon LLMOps平台,为企业提供了一站式的私有化部署解决方案。企业可以利用该平台快速部署DeepSeek R1模型,实现具备深度思考能力的服务和应用开发。通过将知识库和工具调用集成到企业内部,星环科技加速了基于大模型的企业级应用落地,满足了数据安全与合规的严格要求。

此外,星环科技还提供全栈私有化交付服务,支持将R1大模型及其配套工具链部署到企业本地数据中心或专属云环境中。这种定制化服务可根据企业需求提供硬件选型指导、性能调优以及模型轻量化适配,确保在私有环境下实现高效运行。

以某头部券商为例:通过应用Sophon LLMOps建设自有大模型管理平台,该券商成功纳管了超过30种开闭源的生成式大模型及70余个大模型服务。平台的易用性和系统稳定性极高,恢复时间目标(RTO)不超过4小时,恢复点目标(RPO)不超过5分钟。基于分布式和容器化的部署架构,该平台持续稳定地为招商证券创意中心、研报助手、托管助手和金投客户智能询价等场景提供服务,并通过建设国产算力池,实现了国产NPU算力与GPU的统一管理。

据悉,该项目是国内较早完成国产化推理引擎、国产化GPU、国内外GPU混合部署统一管理、卡切分及多级多卡、大/小模型统一纳管监控等前沿技术的案例。

星环科技在金融场景的深度突破,得益于其在金融、政企等场景的深厚的Know-How积累。

截至2024年6月,星环科技已拥有约1600家终端用户,覆盖金融、政府、能源、交通、制造等众多国民经济支柱领域;其中公司服务超过300家金融机构。2024年上半年,金融行业客户收入占公司主营业务收入的39.69%。

而金融领域是企业私有化部署的先行场景。截至2024年2月12日,已有近20家券商完成DeepSeek的本地化部署,多家券商正积极推进部署工作。国泰君安、国金证券、广发证券等券商均已接入DeepSeek系列模型,加速企业智能化转型。

随着大模型技术的渗透率提升,其应用场景将更加广泛。

券商接入DeepSeek大模型后,可应用于智能客服、智能系统运维、行业研究、风险管理、智能办公和智能投顾等多个场景。同时,DeepSeek还能深入行业研究、投资分析和软件开发等业务部门,助力业务部门实现智能化转型。在银行领域,本地化部署的DeepSeek大模型,可应用于智能合同管理、智能风控、资产托管与估值对账、客服助手和智库等多个场景。在保险行业,智能客服、销售赋能、日程管理、产品培训和智能核保等多个AI应用场景将显著提升了保险从业者的工作效率。

随着大模型私有化部署需求的增加,星环科技凭借其技术优势和丰富的客户资源,有望进一步扩大市场份额。

结语

星环科技的实践只是冰山一角。

它生动地展示了AI技术如何跨越云端与端侧的界限,深入企业级应用与个人生活的每一个角落。在这场由算法创新与开源生态共同推动的技术革命中,越来越多的企业仿佛智能革命的神经元节点,正以前所未有的速度和规模生长,并推动AI的触角延伸至社会的各个层面。

人与智能世界的互动模式正经历着翻天覆地的变化,算力平权的理想正逐步从理想照进现实,开启了一个全新的智能时代篇章。

敬告读者:本文为转载发布,不代表本网站赞同其观点和对其真实性负责。FX168财经仅提供信息发布平台,文章或有细微删改。
go