全球数字财富领导者
CoNET
|
客户端
|
旧版
|
北美站
|
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
香港论坛
外汇开户
登录 / 注册
搜 索
综合
行情
速递
日历
话题
168人气号
文章
OpenAI与AIGC:改变人类生产范式 通往“万物的摩尔定律”
go
lg
...
,因为这幅画不是由人动手绘制,而是来自
生成
式
AI
(Generative AI) 产品 Midjourney。 当时艺术正统和机器亵渎引发了争议,其实早在摄影技术兴起时就有过类似的争议,并不妨碍摄影技术革新并,成为了现代艺术的有机组成部分。 因此本文不对此问题做太多探讨,而是旨在对
生成
式
AI
发展与突破的历史进行复盘,并梳理
生成
式
AI
会在自然语言、代码、图片、视频、3D 模型等领域带来什么样的下游应用。 回顾历史,人类艺术的发展速度是对数式的,而技术的进步速度是指数式的。
生成
式
AI
学习了人类艺术对数进化史上的海量画作,实现了创作质量上的指数式进步,并在生产效率上实现了”弯道超车“。模型生成的作品便是今天热议的AIGC (AI Generated Content)。 而本文聚焦的公司 OpenAI ,在这场
生成
式
AI
的突破中起到了关键性的作用,通过堆叠海量算力的大模型(Foundation Model)使 AIGC 进化。 在 2022 年上半年,OpenAI 旗下三个大模型 GPT-3、GitHub Copilot 和 DALL·E2 的注册人数均突破了 100 万人,其中 GPT-3 花了 2 年,GitHub Copilot 花了半年,而 DALL·E2 只用了2个半月达到了这一里程碑,足见这一领域热度的提升。 研究型企业引领的大模型发展,也给了下游应用领域很大的想象空间,语言生成领域已经在文案生成、新闻撰写、代码生成等领域诞生了多家百万级用户、千万级美金收入的公司。 而最出圈的图片生成领域两大产品 MidJourney 和 Stable Diffusion 都已经有相当大的用户群体,微软也已经布局在设计软件中为视觉设计师提供 AIGC 内容,作为设计灵感和素材的来源。同时 3D 和视频生成领域的大模型也在飞速突破的过程中,未来很可能会在游戏原画、影视特效、文物修复等领域发挥作用。 从神经网络的角度看,当前的大模型 GPT-3 有 1750 亿参数,人类大脑有约 100 万亿神经元,约 100 个神经元会组成一个皮质柱,类似于一个小的黑盒神经网络模块,数量级上的差异决定了算力进步可以发展的空间还很大。与此同时,今天训练 1750 亿参数的 GPT-3 的成本大概在 450 万美元左右,根据成本每年降低约 60% 的水平,供大模型提升计算复杂度的空间还很多。 OpenAI CEO、YC 前主席 Sam Altman 的图景中,AI 大模型发展的最终目标是 AGI(通用人工智能,Artificial General Intelligence),当这一目标实现的时候,人类经济社会将实现”万物的摩尔定律“,即万物的智能成本无限降低,人类的生产力与创造力得到解放。 归纳并演绎
生成
式
AI
是什么 AI 模型大致可以分为两类:决策式 AI 与
生成
式
AI
。 根据机器学习教科书,决策式模型 (Discriminant Model)学习数据中的条件概率分布;生成式模型 (Generative Model)学习数据中的联合概率分布,两者的区别在于擅长解决问题的方式不同: 决策式 AI 擅长的是基于历史预估当下,有两大类主要的模型应用,一类是辅助决策,常用在推荐系统和风控系统中;第二类是决策智能体,常用于自动驾驶和机器人领域。
生成
式
AI
擅长的是归纳后演绎创造,基于历史进行缝合式创作、模仿式创新——成为创作者飞船的大副。所谓 AIGC(AI Generated Content),便是使用
生成
式
AI
主导/辅助创作的艺术作品。 不过在10年代的机器学习教科书中,早已就有了这两类AI。为何 AIGC 在20年代初有了显著突破呢?答案是大模型的突破。 The Bitter Lesson大模型助 AIGC 进化 时间倒回到 19 年 3 月,强化学习之父 Richard Sutton 发布了名为 The Bitter Lesson(苦涩的教训)的博客,其中提到:”短期内要使AI能力有所进步,研究者应寻求在模型中利用人类先验知识;但之于AI的发展,唯一的关键点是对算力资源的充分利用。“ Seeking an improvement that makes a difference in the shorter term, researchers seek to leverage their human knowledge of the domain, but the only thing that matters in the long run is the leveraging of computation. 该文章在当时被不少 AI 研究者视为对自己工作的否定,极力辩护。但如果拉长时间线回看,会发现这位泰斗所言不虚: 机器学习模型可以从参数量级上分为两类:统计学习模型,如 SVM(支持向量机)、决策树等数学理论完备,算力运用克制的模型;和深度学习模型,以多层神经网络的深度堆叠为结构,来达到高维度暴力逼近似然解的效果,理论上不优雅但能高效的运用算力进行并行计算。 神经网络模型在上世纪 90 年代出现,但在 2010 年前,统计学习模型仍是主流;后来得益于 GPU 算力的高速进步,基于神经网络的深度学习模型逐渐成为主流。 深度学习充分利用了 GPU 擅长并行计算的能力,基于庞大的数据集、复杂的参数结构一次次实现出惊人的效果,刷新预期。大模型便是深度学习模型参数量达到一定量级,只有大型科技公司才能部署的深度学习模型。 2019年,OpenAI 从非营利组织变为营利性公司,接受微软 10 亿美金注资。这一合作奠定了他们有更多算力资源,并能依仗微软的云基础建设随时将大模型(Foundation Model)发布为商用 api。 与此同时,还有第三件事值得关注,大模型 AI 的研究方向出现了转变,从智能决策式 AI 转变为内容
生成
式
AI
:原本主要大模型集中于游戏的智能决策体,如 DeepMind 开发的打败围棋冠军的 AlphaGo、OpenAI 开发的打败 Dota 职业选手的 OpenAI Five。 Transformer 模型(后文将详细介绍)的发布让 OpenAI 嗅到了更适合他们的机会——预训练语言模型。在那之后,他们开始在 AIGC 的方向上开枝散叶:沿着 2018 年时低调发布的 GPT 模型轨迹发布了一系列模型族,一次次刷新文本生成大模型的效果,印证 Sutton 提出的宗旨:充分运用海量算力让模型自由的进行探索和学习。 OpenAI的大模型发展之路 2019年2月:GPT-2 初版发布,1.2 亿参数量 2019年3月:OpenAI LP 成立 2019年7月:微软注资 10 亿美金 2019年11月:GPT-2 最终版发布,15 亿参数量,宣布暂时不开放使用为避免假信息伪造 2020年6月:GPT-3 发布,1750 亿参数量,后续开放 OpenAI API 作为商用 2021年1月:DALL·E 与 CLIP 发布 2021年10月:OpenAI Codex 发布,为 GPT-3 为 coding 场景的特化模型、Github Copilot 的上游模型 2022年4月:DALL·E2 发布 1、GPT-3,AI文本生成巅峰之作 深度学习兴起于计算机视觉领域的应用,而大模型的发展开始于 NLP 领域。在数据、算力充分发展的过程中,Transformer 模型以 attention 机制高度并行化的结构充分利用算力,成为 NLP 领域预训练模型的标杆。 著名的独角兽 Hugging Face 也是从对该模型的复现和开源起家。除了 attention 机制的高效之外,它还有两个重要特点:迁移学习(transfer learning)和自监督学习(self-supervised learning)。 顾名思义,迁移学习指在一个极庞大的数据集上充分学习历史上的各类文本,把经验迁移到其他文本上。 算法工程师会将第一步训练完成的模型存储下来,称为预训练模型。需要执行具体任务时,基于预训练版本,进行定制化微调(fine-tune)、或展示少许范例(few-shot/zero-shot)。 而自监督学习,得从机器学习中的监督学习讲起。前面提到若需要学习一匹马是否在奔跑,需要有一个完整标注好的大数据集。 自监督学习不需要,当 AI 拿到一个语料库,可以通过遮住一句话中的某个单词、遮住某句话的下一句话的方式,来模拟一个标注数据集,帮模型理解每个词的上下文语境,找到长文本之间的关联。该方案大幅提高了对数据集的使用效率。 谷歌发布的 BERT 是 Transformer 时代的先驱,OpenAI 发布的 GPT-2 以相似的结构、更胜一筹的算力后来居上。直到2020年6月,OpenAI 发布了 GPT-3,成为该模型族,甚至整个文本生成领域的标杆。 GPT-3 的成功在于量变产生质变:参数比 GPT-2 多了两个数量级(1750亿vs 15亿个参数),它用的最大数据集在处理前容量达到 45TB。 如此巨大的模型量级,效果也是史无前例的。给 GPT-3 输入新闻标题”联合卫理公会同意这一历史性分裂“和副标题”反对同性恋婚姻的人将创建自己的教派“,生成了一则以假乱真的新闻,评估人员判断出其为AI生成的准确率仅为 12%。以下是这则新闻的节选: 据《华盛顿邮报》报道,经过两天的激烈辩论,联合卫理公会同意了一次历史性的分裂:要么创立新教派,要么”保持神学和社会意义上的保守“。大部分参加五月教会年度会议的代表投票赞成进一步禁止 LGBTQ 神职人员的任命,并制定新的规则”规范“主持同性婚礼的神职人员。但是反对这些措施的人有一个新计划:于2020 年组成一个新教派”基督教卫理公会“。 要达到上述效果,成本不容小觑:从公开数据看,训练一个 BERT 模型租用云算力要花约 1.2 万美元,训练 GPT-2 每小时要花费 256 美元,但 OpenAI 并未公布总计时间成本。考虑到 GPT-3 需要的算力是 BERT 的 2000 多倍,预估发布当时的训练成本肯定是千万美元级别,以至于研究者在论文第九页说:我们发现了一个 bug,但没钱再去重新训练模型,就先这么算了吧。 2、背后DALL·E 2,从文本到图片 GPT-3杀青后,OpenAI 把大模型的思路迁移到了图片多模态(multimodal)生成领域,从文本到图片主要有两步:多模态匹配:将 AI 对文本的理解迁移至对图片的理解;图片生成:生成出最符合要求的高质量图片。 对于多模态学习模块,OpenAI 在 2021 年推出了 CLIP 模型,该模型以人类的方式浏览图像并总结为文本内容,也可以转置为浏览文本并总结为图像内容(DALL·E 2中的使用方式)。 CLIP (Contrastive Language-Image Pre-Training) 最初的核心思想比较简单:在一个图像-文本对数据集上训练一个比对模型,对来自同一样本对的图像和文本产生高相似性得分,而对不匹配的文本和图像产生低相似性分(用当前图像和训练集中的其他对的文本构成不匹配的样本对)。 对于内容生成模块,前面探讨了文本领域:10 年代末 NLP 领域生成模型的发展,是 GPT-3 暴力出奇迹的温床。而计算机视觉 CV 领域 10 年代最重要的生成模型是 2014 年发布的生成对抗网络(GAN),红极一时的 DeepFake 便是基于这个模型。GAN的全称是 Generative Adversarial Networks——生成对抗网络,显然”对抗“是其核心精神。 注:受博弈论启发,GAN 在训练一个子模型A的同时,训练另一个子模型B来判断它的同僚A生成的是真实图像还是伪造图像,两者在一个极小极大的博弈中不断变强。 当A生成足以”骗“过B的图像时,模型认为它比较好地拟合出了真实图像的数据分布,进而用于生成逼真的图像。当然,GAN方法也存在一个问题,博弈均衡点的不稳定性加上深度学习的黑盒特性使其生成。 不过 OpenAI 大模型生成图片使用的已不是 GAN 了,而是扩散模型。2021年,生成扩散模型(Diffusion Model)在学界开始受到关注,成为图片生成领域新贵。 它在发表之初其实并没有收到太多的关注,主要有两点原因: 其一灵感来自于热力学领域,理解成本稍高; 其二计算成本更高,对于大多高校学术实验室的显卡配置而言,训练时间比 GAN 更长更难接受。 该模型借鉴了热力学中扩散过程的条件概率传递方式,通过主动增加图片中的噪音破坏训练数据,然后模型反复训练找出如何逆转这种噪音过程恢复原始图像,训练完成后。扩散模型就可以应用去噪方法从随机输入中合成新颖的”干净“数据。该方法的生成效果和图片分辨率上都有显著提升。 不过,算力正是大模型研发公司的强项,很快扩散模型就在大公司的调试下成为生成模型新标杆,当前最先进的两个文本生成图像模型——OpenAI 的 DALL·E 2 和 Google 的 Imagen,都基于扩散模型。DALL·E 2 生成的图像分辨率达到了 1024 × 1024 像素。例如下图”生成一幅莫奈风格的日出时坐在田野里的狐狸的图像“: 除了图像生成质量高,DALL·E 2 最引以为傲的是 inpainting 功能:基于文本引导进行图像编辑,在考虑阴影、反射和纹理的同时添加和删除元素,其随机性很适合为画师基于现有画作提供创作的灵感。比如下图中加入一只符合该油画风格的柯基: DALL·E 2 发布才五个月,尚没有 OpenAI 的商业化api开放,但有 Stable Diffusion、MidJourney 等下游公司进行了复现乃至商业化,将在后文应用部分介绍。 3、OpenAI的使命——开拓通往 AGI 之路 AIGC 大模型取得突破,OpenAI 只开放了api和模型思路供大家借鉴和使用,没去做下游使用场景的商业产品,是为什么呢?因为 OpenAI 的目标从来不是商业产品,而是通用人工智能 AGI。 OpenAI 的创始人 Sam Altman 是 YC 前总裁,投出过 Airbnb、Stripe、Reddit 等明星独角兽(另一位创始人 Elon Musk 在 18 年因为特斯拉与 OpenAI ”利益相关“离开)。 他在 21 年发布过一篇著名的博客《万物的摩尔定律》,其中提到 OpenAI,乃至整个 AI 行业的使命是通过实现 AGI 来降低所有人经济生活中的智能成本。这里所谓 AGI,指的是能完成平均水准人类各类任务的智能体。 因此,OpenAI 始终保持着学术型企业的姿态处于行业上游,成为学界与业界的桥梁。当学界涌现出最新的 state-of-art 模型,他们能抓住机会通过海量算力和数据集的堆叠扩大模型的规模,达到模型意义上的规模经济。 在此之后克制地开放商业化 api,一方面是为了打平能源成本,更主要是通过数据飞轮效应带来的模型进化收益:积累更富裕的数据优化迭代下一代大模型,在通往 AGI 的路上走得更坚实。 定位相似的另一家公司是 Deepmind——2010年成立,2014 年被谷歌收购。同样背靠科技巨头,也同样从强化学习智能决策领域起家,麾下的 AlphaGo 名声在外,Elon Musk 和 Sam Altman 刚开始组局创办 OpenAI,首要的研究领域就是步 AlphaGo 后尘的游戏决策 AI。 不过 19 年后,两者的研究重心出现了分叉。DeepMind 转向使用 AI 解决基础科学如生物、数学等问题:AlphaFold 在预测蛋白质结构上取得了突破性的进展,另一个 AI 模型 AlphaTensor 自己探索出了一个 50 年悬而未决的数学问题:找到两个矩阵相乘的最快方法,两个研究都登上了 Nature 杂志的封面。而 OpenAI 则转向了日常应用的内容生成 AIGC 领域。 AIGC大模型是通往 AGI 路上极为重要、也有些出乎意料的一站。其重要性体现在 AI 对人类传达信息的载体有了更好的学习,在此基础上各个媒介之间的互通成为可能。 例如从自然语言生成编程语言,可以产生新的人机交互方式;从自然语言生成图片和视频,可以革新内容行业的生产范式。意外性则是,最先可能被替代的不是蓝领,而是创作者,DeepMind 甚至在协助科学家一起探索科研的边界。 OpenAI 的模式也给了下游创业者更多空间。可以类比当年预训练语言模型发展初期,Hugging Face把握机会成为大模型下游的模型开源平台,补足了模型规模膨胀下机器学习民主化的市场空间。 而对 AIGC 模型,未来会有一类基于大模型的创业公司,把预训练完成的 AIGC 模型针对每个子领域进行调优。不只需要模型参数优化,更要基于行业落地场景、产品交互方式、后续服务等,帮助某个行业真正用上大模型。 正如 AI 的 bitter lesson 一样矛盾,投资者需要短期投资回报率、研究者需要短期投稿成功率,尽管OpenAI 走在通往 AGI 正确的路上,这条路道阻且长,短期很难看到极大的突破。而 Sam Altman 展望的大模型应用层公司很有可能有更高的高投资回报,让我们来介绍下主要的分类与创业者。 百家争鸣的 AIGC 大模型应用层 对应 OpenAI 大模型发布的顺序,模型应用层相对最成熟的是文本生成领域,其次是图片生成领域,其他领域由于还未出现统治级的大模型相对落后。 文本领域天然应用场景丰富,且 GPT-3 开放 api 很久,细分赛道很多。大致可以根据生成内容不同分为两类:机器编程语言生成、人类自然语言生成。前者主要有代码和软件行为的生成等,后者主要有新闻撰写、文案创作、聊天机器人等。 而图片领域当前还专注于图片自身内容的生成,预期随着未来3D、视频相关内容生成能力的增强,会有更多结合不同业务场景如游戏、影视这样细分领域的创业公司。 以下是海外各子领域创业公司的梳理,接下来将针对几个领域的重要公司进行介绍。 1、编程语言 文本领域最成熟的应用暂时不在人类自然语言,而是在代码等机器语言的生成领域。因为机器语言相对更结构化,易学习;比如鲜有长文本的上下文关系、基于语境的不同含义等情况。 (1)代码生成:Github Copilot 代表公司是微软出品的 Github Copilot,编程中的副驾驶。该产品基于 OpenAI 专门用 GPT-3 为编程场景定制的AI模型 Codex。使用者文字输入代码逻辑,它能快速理解,根据海量开源代码生成造好的轮子供开发者使用。提高一家科技公司 10% 的 coding 效率能带来很大收益,微软内部已进行推广使用。 相比低代码工具,Copilot 的目标群体是代码工作者。未来的低代码可能是两者结合:低代码 UI 界面实现代码框架搭建,代码子模块通过 Copilot 自动生成。 正如 Copilot 的 slogan:Don’t fly solo,没有 Copilot 的帮助 coder 的工作会变得繁冗,没有 coder 的指引 Copilot 生成的内容可能会出现纰漏。也有用户报告了一些侵犯代码版权、或代码泄露的案例,当前技术进步快于版权法规产生了一定的空白。 (2)软件行为生成:Adept.ai Adept.ai 是一家明星创业公司。创始团队中有两人是Transformer 模型论文作者,CEO 是谷歌大脑中大模型的技术负责人,已经获得 Greylock 等公司 6500 万美元的 A 轮融资。 他们的主要产品是大模型 ACT-1,让算法理解人类语言并使机器自动执行任务。目前产品形态是个 chrome 插件,用户输入一句话,能实现单击、输入、滚动屏幕行文。在展示 demo中,一位客服让浏览器中自动记录下与某位顾客的电话,正在考虑买 100 个产品。这个任务需要点击 10 次以上,但通过 ACT-1 一句话就能完成。 软件行为生成颠覆的是当下的人机交互形式,使用文字或语音的自然语言形式来代替当下人与机器的图形交互模式(GUI)。大模型成熟后,人们使用搜索引擎、生产力工具的方式都将变得截然不同。 2、自然语言 自然语言下还有多个应用型文本生成领域值得关注:新闻撰写、文案创作、对话机器人等。 (1)新闻撰写 最著名的是 Automated Inights。他们的结构化数据新闻撰写工具叫做 wordsmith,通过输入相应数据和优先级排序,能产出一篇基于数据的新闻报道。该工具已在为美联社每季度自动化产出 300 余篇财报相关报道,在雅虎体育新闻中也已经崭露头角。据分析师评价,由 AI 完成的新闻初稿已接近人类记者在 30 分钟内完成的报道水准。 Narrative Science是另一家新闻撰写生成公司,其创始人甚至曾预测,到 2030 年,90%以上的新闻将由机器人完成。 (2)文案创作 该领域竞争较为激烈,有copy.ai、Jasper、copysmith 等公司。他们基于 GPT-3 的能力加入了文案领域的人工模板与结构,为商家和个人创作者提供了快速为自己的商品、内容进行宣传的能力。以copysmith 为例: (3)对话机器人 前面提到的 Adept.ai 由Transformer 模型的一作和三作联合创立;而二作也创业了,他创办的 Character.ai 是当前对话机器人中使用效果最逼真的。 该对话机器人可以自定义或使用模板来定义角色的家庭、职业、年龄等,在此基础上保持一贯的设定和符合设定的对话风格。经常能体现出一定的共情对话能力带给人惊喜,并且支持多语言互通。 比如他们有已训练好的马斯克等名人和一些动漫角色,与他们对话会有很棒的代入感。 而商业化的对话机器人,在客服、销售等行业有巨大的市场空间,但如今还为成熟。 主要出现的问题有二: 其一,客服、销售行业遇到的客户往往情绪状态不稳定,AI 难以对情绪进行适应并调整对话内容; 其二,AI 的多轮对话能力较弱,无法保证持续有效的跟进问题。 (4)创作性文本 AI 对于长文本创作有一定困难,难以保持1000字以上的文本创作后仍能进行上下文的联系。 但基于短文本创作仍有一些有趣的应用,例如基于GPT-3的 AI Dungeon,可以引导 AI 创造一个虚拟游戏世界观。该领域进一步的成长需要期待未来 3-5 年,有成熟的能产出千字内容的 AI 出现。 3、多模态图片 DALL·E2 是极具突破性的 AIGC 大模型,但距离丰富生产力和创造力的成熟产品还有差距。因此有研究者顺着 DALL·E 和 CLIP 的思路开发了开源版本的扩散模型,就像当年的 Hugging Face 那样,并将其根据创作者社区的反馈转变为更成熟易用的商业产品。接下来就介绍几个主要出圈的模型: (1)Disco Diffusion 最早出圈的 AI 绘图工具是开源模型Disco Diffusion。发布时间比 DALL·E 2 稍晚,同样也是 CLIP + Diffusion Model 的结构,生成效果让许多插画师担心起了失业。 尽管很多插画师和 AI 工具爱好者的推荐都认可了该工具的易用性和生成效果的出众,但其生成时间略长有待优化,可以认为是大家对图片生成大模型的初体验。 (2)MidJourney 该模型发布后不久,Disco Diffusion 的开发者 Somnai 加入了 MidJourney,和团队一起打造了一款产品化的 Disco Diffusion。 Midjourney 的创始人 David Holz 并不是以CV(计算机视觉)研究为主,更关注人机交互。产品公测和主要交流平台都基于Discord,使用 Discord Bot 进行交互,打造了相当良好的社区讨论环境。 使用中印象深刻的有几个重要功能:MidJourney 画廊中可以看到每时每刻创作者们用 MJ 创作出的作品,用户可以对作品进行打分,每周排名靠前的作品将得到额外的 fast GPU 时间奖励。 同时,MJ官方还为用户贴心的提供了引导语 prompt 集合和 AI 擅长的风格指南,指导用户如何最高效的生成出他们想要的图片。 基于良好的产品和社区体验,MidJourney 的付费用户量也是目前最大的。 目前收费模式采用了订阅制,个人用户有两个档位,每月最多 200 张图片(超额另收费)的 10 美元/月,以及”不限量“图片的 30 美元/月;对企业客户,单人一年收费仅有 600 美元,且生成的作品可以商用(当前法规尚不完善,仍可能存在一定版权问题)。 (3)Stable Diffusion 如果说 MidJourney 是一个勤勤恳恳的绩优生,那么 Stability.ai 则是天赋异禀技术力强、诞生之初就备受 VC 追捧的富二代,公司估值已达到十亿美元。产品 Stable Diffusion 首要目标是一个开源共创模型,与当年的 Hugging Face 神似。 创始人 Emad 之前是对冲基金经理,用自己充裕的资金联合 LMU 和 Runaway ML开发了开源的 Stable Diffusion,在 Twitter 上使用扎克伯格在 Oculus 发布会上的照片作为背景,号召SD会成为”人类图像知识的基础设施“,通过开源让所有人都能够使用和改进它,并让所有人更好地合作。 Stable Diffusion 可以认为是一个开源版本的DALL·E2,甚至不少使用者认为是当前生成模型可以使用的最佳选择。官方版本部署在官网 Dream Studio 上,开放给所有用户注册。 相比其他模型,有很多可以定制化的点。不过官网只有 200 张免费额度,超过需要付费使用,也可以自行使用开源 Colab 代码版无限次使用。此外,Stable Diffusion 在压缩模型容量,希望使该模型成为唯一能在本地而非云端部署使用的 AIGC 大模型。 05 AIGC大模型的未来展望 1、应用层:多模态内容生成更加智能,深入各行业应用场景 上述的多模态图片生成产品当前主要局限于创作画作的草图和提供灵感。在未来待版权问题完备后, AIGC 内容能进入商用后,必然会更深入地与业界的实际应用进行结合: 以游戏行业为例, AI 作画给了非美术专业工作者,如游戏策划快速通过视觉图像表达自己需求和想法的机会;而对美术画师来说,它能够在前期协助更高效、直接地尝试灵感方案草图,在后期节省画面细节补全等人力。 此外,在影视动画行业、视频特效领域,甚至是文物修复专业,AI 图片生成的能力都有很大想象空间。当然,这个领域 AI 的能力也有着不小的进步空间,在下面的未来展望部分进行阐发。 目前 AIGC 存在 Prompt Engineering 的现象,即输入某一些魔法词后生成效果更好。这是目前大模型对文本理解的一些缺陷,被用户通过反向工程进行优化的结果。未来随着语言模型和多模态匹配的不断优化,不会是常态,但中短期内预期Prompt Engineering 还是得到好的生成内容的必备流程之一。 2、模态层:3D生成、视频生成 AIGC 未来3-5年内有明显进步 多模态(multimodal)指不同信息媒介之间的转换。 当前 AI 作图过程中暴露的问题会成为视频生成模型的阿喀琉斯之踵。 例如:AI 作画的空间感和物理规则往往是缺失的,镜面反射、透视这类视觉规则时常有所扭曲;AI 对同一实体的刻画缺少连续性。根本原因可能是目前深度学习还难以基于样本实现一些客观规则泛化,需要等待模型结构的优化进行更新。 3D生成领域也有很大价值:3D 图纸草图、影视行业模拟运镜、体育赛场现场还原,都是 3D 内容生成的用武之地。这一技术突破也渐渐成为可能。 2020年,神经辐射场(NeRF)模型发布,可以很好的完成三维重建任务:一个场景下的不同视角图像提供给模型作为输入,然后优化 NeRF 以恢复该特定场景的几何形状。 基于该技术,谷歌在2022年发布了 Dream Fusion 模型,能根据一段话生成 360 度三维图片。这一领域当前的实现效果还有优化空间,预期在未来3-5年内会取得突破性进展,推动视频生成的进步。 3、模型层:大模型参数规模将逼近人脑神经元数量 近年的大模型并未对技术框架做颠覆性创新,文本和图像生成领域在大模型出现前,已有较成熟方案。但大模型以量变产生质变。 从神经网络角度看,大脑有约 100 万亿神经元, GPT-3 有 1750 亿参数,还相差了 1000 倍的数量级,随着算力进步可以发展的空间还很大。 神经网络本质是对高维数据进行复杂的非线性组合,从而逼近所观测数据分布的最优解,未来一定会有更强的算力、更精妙的参数堆叠结构,来刷新人们对AI生成能力的认知。 4、成本结构决定大模型市场的马太效应 大模型最直接的成本便是能源成本(energy cost),GPT-3 发布时的训练成本在千万美元级别。难以在短期内衡量 ROI ,大科技公司才能训练大模型。 但随着近年模型压缩、硬件应用的进步,GPT-3 量级的模型成本很可能已降至百万美元量级,Stable Diffusion 作为一个刚发布一个月的产品,已经把原本 7GB 的预训练模型优化压缩至 2GB 左右。 在这样的背景下,算力成本在未来必然会逐渐变得更合理,但 AIGC 领域的另一个成本项让笔者对市场结构的预测还是寡头垄断式的。 大模型有明显的先发优势,来自巨大的隐形成本:智能成本。前期快速积累用户反馈数据能帮助模型持续追新优化,甩开后发的竞争者,达到模型性能的规模效应。 AI 的进化来自于数据的积累和充分吸收。深度学习,乃至当前的所有机器学习都是基于历史预估未来,基于已有的数据给到最接近真实的可能。 正如前文讨论的,OpenAI 的目标从来不是留恋于某个局部行业的商业产品,而是通过模型规模经济,不断地降低人类社会全局的智能成本,逼近通用人工智能 AGI。规模经济正体现在智能成本上。 5、虚拟世界的 AGI 会先于现实世界诞生 从更宏观的视角上,虚拟世界 AI 技术的智能成本比现实世界中来得低得多。现实里 AI 应用最普遍的是无人驾驶、机器人等场景,都对 Corner Case 要求极高。 对于AI模型而言,一件事超过他们的经验范畴(统计上out of distribution),模型将立马化身人工智障,不具备推演能力。现实世界中 corner case 带来的生命威胁、商业资损,造成数据积累过程中极大的试错成本。 虚拟世界则不同,绘图时遇到错位扭曲的图片,大家会在 Discord 中交流一笑了之;游戏 AI 产生奇怪行为,还可能被玩家开发出搞怪玩法、造成病毒传播。 因此虚拟世界,尤其是泛娱乐场景下的 AIGC 积累数据成本低会成为优势。这个领域的 AI 如果节省人力、生成内容产生的商业价值能大于算力成本,能很顺畅地形成低成本的正向循环。 伴随着另一个重要的革新——长期 Web3.0元宇宙场景下新内容经济生态的形成,虚拟世界内容场景下的 AI 很可能更早触及到 AGI。 来源:金色财经
lg
...
金色财经
2023-02-21
元宇宙热退潮 XR产业回归理性
go
lg
...
eta罕见地将AI作为讨论重点,新业务
生成
式
AI
将成为Meta今年唯二的主题之一。目前,Meta的Make-A-Video、Make-A-Scene、Cicero智能体等AI业务也已经取得了不错的成果,这些都将成为Meta元宇宙核心业务的巨大助力。 Meta也在不断挖掘XR的商业化可能性。今年1月底,Meta宣布和NBA合作,将借助VR技术转播NBA现场比赛,通过Meta Quest 2及Horizon Worlds中180度的单镜面技术打造沉浸式体验。 无独有偶,微软在裁撤XR项目的同时,也将重心放在了AI领域。前不久,微软就向OpenAI投资了100亿美元。纳德拉表示,微软计划将ChatGPT等AI工具纳入到其所有产品中。 在放弃做属于自己的元宇宙之后,微软更是安心做起了元宇宙的“卖铲人”,就像当初做Office、Azure一样。事实上,微软老早就抱起了Meta的大腿,在Meta Connect 2022上,纳德拉就现身为Quest Pro站台,并宣布双方将在工作、游戏等领域开展合作,将Teams、Office、Windows以及Xbox云游戏全家桶引入Quest VR头显。一旦Meta大获成功,微软自然也能分一杯羹了。 这就不由地让人想到了腾讯。既然手握重金的VR硬件一哥,一时半会都打不下江山,不如先将收购XR硬件厂商的事往后放一放,集中精力把软件做好,后者也是腾讯一直以来的强项。就像是如今,即便不做智能手机,但几乎每台智能手机上都有腾讯的影子。 参考微软和Meta,硬件厂商大概很难拒绝和有钱有技术,更有用户的腾讯强强联合,实现多赢,毕竟XR不局限于VR头显这一条路,未来手机、电脑等硬件也可能成为XR的入口。此前的案例更是证明,XR行业是很难一家独大的,想要软硬件齐头并进,唯有死命烧钱。 去年10月,Meta股东,投资公司Altimeter Capital董事长兼首席执行官Brad Gerstner就在公开信中提到,如果Meta每年向元宇宙业务投入100亿-159亿美元,可能需要十年才能收获成果。他直言:“向一个未知领域投入千亿美元的资金实在是太过巨大且恐怖了。” 腾讯在此时选择放手,或许才是明智之举。 但腾讯怎么可能会放过在下一场产业和生态变革中抢占先机的机会,专注自身强项,布局自研游戏,建设游戏生态,探索划时代的游戏产品,才是关键。毕竟游戏仍是XR行业极为重要的落地场景之一,在硬件技术取得突破后,势必要有与之配套的产品。 结合腾讯的投资布局可以发现,继2021年疯狂扫货、瓜分CP之后,腾讯虽然克制了许多,2022年仅投资11家游戏公司,但该出手时就出手,From Software、Studio MayDay、Inflexion Games、1C Entertainment等游戏厂商均被收入麾下,可以看出腾讯对于独立游戏、3A大作,以及海外市场的高度重视。 纵观腾讯的投资版图,从国内到国外,从端游到手游,试图覆盖游戏行业的每一个细分赛道,因为在游戏行业的下一个时代到来之前,腾讯必须要手握筹码,赶上下一个红利期。事实上,不只是腾讯,放眼全球市场,已经有越来越多的科技公司押注游戏行业。 此外,腾讯近年来在B端势头正劲,云服务等业务发展迅猛,在此基础上钻研XR相关技术或许还能增强原有业务的壁垒,衍生出更广阔的商业空间。当然这只是猜测,腾讯具体将如何布局仍有待观望。 在快手全景视频不断失宠后,其音视频团队的工作重心就已经向视频云业务StreamLake转移,推出面向各行业的音视频+AI产品与解决方案,进军B端赛道。今年快手更是成立了独立业务部门“溪流湖”,负责研发toB相关业务。这是不是也代表,B端赛道将成为快手逐鹿XR的下一个重要战场? 经历了野蛮生长和大刀阔斧的裁撤后,XR行业终于回归理性,但距离成熟的XR生态还有很长的路要走,在此之前行业仍需沉淀。在未来十年,甚至数十年的赛跑中,谁能拔得头筹,还尚未见分晓。 来源:元宇宙之心 来源:金色财经
lg
...
金色财经
2023-02-19
元宇宙周刊|韩国政府拟投入2233亿韩元扶持元宇宙
go
lg
...
加密初创公司Solvo将允许用户使用
生成
式
AI
创建NFT。 NFT基础设施协议CapsuleNFT推出Ordinary Oranges,比特币NFT可在以太坊主网访问。 勒布朗·詹姆斯“LeBron1/1Unique Card”以近7万美元成交价被拍卖,创Sorare NBA第三高交易记录。 迪拜在Decentraland推出首个虚拟购物中心Majid Al Futtaim。 《最终幻想》开发商Square Enix将在Polygon上推出NFT游戏。 华纳音乐集团前首席执行官Stepher Cooper加入NFT平台OneOf董事会。 Cosmos Hub第四个公开激励测试网Interchain NFTs开放注册。 Fox Entertainment及其Web3部门Blockchain Creative Labs正在为该网络的热门歌唱比赛节目“蒙面歌手”推出一种新的令牌门控粉丝体验。 Blur发布版税更新政策,包括推荐不使用OpenSea。 兰博基尼将于2月20日在NFT市场VeVe发布Huracán STO车型NFT。 “无聊猿”BAYC完成Dookey Dash游戏分数审查和验证:仅2%玩家分数被重置。 英国知名电竞选手Mongraal在MINT游戏Dookey Dash中获胜。 NFT项目mfers创始人表示16999个eos NFT持有者可参与新项目的免费铸造。 时尚杂志GQ将推出其首个NFT系列,持有者拥有多种权限。 软银将作为验证者参与日本游戏区块链Oasys。 电竞选手Mongraal已将“吉米钥匙”上架OpenSea,售价2222ETH。 “无聊猿”BAYC交易额突破27亿美元。 DigiDaigaku Free NFT Factory即将上线,Digi Genesis收藏者将获得Bitcoin NFT。 Cosmos推出第四次公共激励测试网活动Game of NFTS(GoN),第一阶段已开放注册。 Solana生态NFT项目DeGods基于Ordinals在比特币链上铸造。 NFT市场KnownOrigin将于2月24日上线创作者合约,允许创作者分享收益和版税。 社交NFT市场NFT.com发布公测版,初始测试期间不收取交易费用。 NFT开源协议Unlock Protocol推出通过电子邮件空投NFT功能。 其他 MakerDAO集成Chainlink Oracle以帮助维护DAI稳定性。 Meta已恢复特朗普的Facebook和Instagram账号。 京东正式推出产业版ChatGPT,命名“ChatJD”。 欧盟委员会发布了用于实施“数字身份钱包计划”(EUDI Wallet)的首个欧盟通用工具箱版本。 加密友好的电子商务巨头Shopify推出了一套区块链商务工具,以增强其平台托管的Web3商店的用户体验。 Web3浏览器Opera宣布将集成人工智能生成内容(AIGC)服务,并计划将现有AI程序扩展到该服务中以支持浏览器、新闻和游戏等产品。 天地在线表示目前分别在数字人、XR直播等领域进行业务布局。 Meta将改造Horizon Worlds元宇宙应用,计划最快3月份向青少年开放。 美、中、韩分列“元宇宙”相关专利申请数量全球前三,以2011年至2020年为准,美国最多,为17293件(35.9%),其次是中国14291件(29.7%)、韩国7808件(16.2%)。 天津市统计局表示区块链在天津市企业中的使用比例5.3%。 第五届CCF中国区块链技术大会在无锡举行。大会以“新应用新赋能新生态”为主题,邀请到超过50位演讲嘉宾,其中既有区块链学术领域的高校教授,也有业界应用领域的权威专家,共同探讨区块链技术新进展、区块链安全与Web3、区块链隐私保护与监管、区块链数字资产交易、区块链与密码学以及区块链领域人才培养等热点话题。 Web3时尚平台Syky聘请前Meta产品负责人担任产品总监。 美国政府合作伙伴Mitre正在招聘一名Web3经济学家。 社交媒体巨头Reddit于Polygon网络发行的NFT系列Reddit Collectible Avatar总量已突破1000万。 京东方第6代新型半导体显示器件生产线在北京经济技术开发区正式开工建设。 微软已取消Industrial Metaverse项目,约100名员工已被解雇。 原美团联合创始人王慧文在社交平台发文宣布进军人工智能领域,称将打造中国的OpenAI。 Web3基础设施提供商Ankr近日宣布成为隐私公链Secret Network首批企业级RPC提供商之一。 浙江玉环经济开发区成立漩门湾元宇宙赋能创新中心 北京君正表示,公司有多种AI算法且已被客户批量采用。 元宇宙产业大会2023年春季会将于明日召开,重点聚焦ChatGPT与元宇宙的关系。 迪拜虚拟资产监管局(VARA)发布了《2023年虚拟资产及相关活动条例》,制定了全面的虚拟资产框架,以支持经济可持续性和跨境金融安全。 yearn针对其文档内容推出类ChatGPT产品yGenius。 《合肥高新区元宇宙产业发展规划(2023-2028)》(下称“《规划》”)在中安创谷科技园全球路演中心正式发布。 欧盟委员会正式启动欧洲区块链监管沙盒。 数字支付公司Wirex宣布已成为Visa的全球合作伙伴,以允许该公司将其卡服务带到全球更多市场。 报告指出银行业监管机构将数字资产视为对银行业和传统金融业安全构成威胁。 好莱坞娱乐巨头派拉蒙将在Roblox元宇宙中推出《海绵宝宝》和《忍者神龟》两大IP内容,Roblox表示元宇宙玩家2022年总游戏时长达到500亿小时。 欧易Web3钱包支持通过iCloud和GoogleDrive备份钱包。 区块链技术平台Blockedge与Suvik将成立合资公司加速Web3采用。 Web3社交网络DeSo现已推出开源聊天协议DeSo Chat Protocol(DCP)协议。 Google Cloud Web3技术负责人加入Alchemy Pay管理顾问委员会。 欧盟或将在数字身份框架中包含零知识证明。 Web3电子邮件平台Mailchain集成Web3TLD和域名平台Freename。 投融资新闻 Algorand NFT市场Rand Gallery收购数据聚合器NFTExplorer。 独立游戏工作室Hardball Games完成430万英镑种子轮融资。 OpenAI创始人旗下加密公司Worldcoin正在进行新一轮融资。 Web3孵化器ManesLAB完成180万美元种子轮融资,YZB Investment领投。 Negentropy Capital向元宇宙项目MetaGPT.AI投资200万美元。 Web3实物收藏平台Collector Crypt完成种子轮融资。 去中心化游戏平台Ajuna Network在以区块链为重点的风险投资公司CMCC Global领投的新一轮私募融资中筹集了500万美元。 游戏公司Tower Pop为其Web3大逃杀和塔防游戏Omega Royale完成210万美元融资。 区块链支付技术公司Partior此前完成的A轮融资规模为3100万美元。 Gym Streets收购日本元宇宙公司Kabutocho Metaverse。 Web3支付公司Slash去年完成150万美元种子轮融资,现已启动A轮融资。 区块链游戏化社交媒体应用TOKHIT完成1亿美元融资。 游戏工作室Empires Not Vampires完成100万美元融资。 专注于投资、运营和提供游戏解决方案的数字游戏孵化器Ludus收购NFT游戏开发商LookLabs,具体金额暂未披露。 Web3全球开发者社区ScalingX推出2000万美元加速器项目。 数字资产公司Taurus完成6500万美元B轮融资。 珠宝品牌Chupi完成375万欧元融资,将投资区块链技术追踪钻石。 EVM兼容区块链项目Monad Labs完成1900万美元种子轮融资。 区块链互操作性协议Orb Labs完成450万美元融资。 Mercury Fund任命Samantha Lewis为合伙人负责Web3和金融科技基金。 工业元宇宙公司Prevu3D宣布完成1000万美元A轮融资,Cycle Capital领投,此前投资过该公司的Brightspark Ventures和Desjardins Capital参投。 数字资产量化算法交易投资公司Hilbert Group就2220万瑞典克朗贷款融资达成协议。 分布式云游戏平台Now.gg宣布已获得NTT DoCoMo Ventures投资,具体投资金额暂未公开。 NFT Gaming获准在纳斯达克上市,拟通过IPO筹集700万美元资金。 拥有20亿美元的阿布扎比科技生态中心Hub71发起“Hub71+数字资产”计划。 NFT衍生品DEX NFEX完成300万美元融资。 区块链安全平台Ironblocks宣布完成700万美元种子轮融资。 流媒体服务Napster收购Mint Songs以扩大Web3业务。 Cosmos生态NFT区块链Aura Network完成400万美元Pre-A轮融资,本轮融资由Hashed和Coin98领投,GuildFi、Istari Ventures、K300Ventures参投。 3D角色工作室Superplastic完成2000万美元融资。 Web3基础设施初创公司Kolibrio完成200万美元种子轮融资。 Algorand NFT市场Rand Gallery收购数据聚合器NFT Explorer。 去中心化社交平台Zion完成600万美元融资。 区块链工具提供商Modular Cloud已于去年完成170万美元Pre-Seed轮融资,Maven11和Blockchain Capital共同领投。 Virtual Arts宣布完成新一轮融资,Animoca Brands战略子公司Animoca Brands Japan参投,具体投资金额暂未公开。 2022年全球金融科技对加密货币和区块链的投资下降到231亿美元。 Web3流动性基础设施Solv Protocol宣布推出基金Solv Seahorse Fund,这是一系列投资基金SFT,用户在Solv协议上购买并在未来赎回股份以获得收入。 尼日利亚加密支付初创公司Fluidcoins已被阿联酋加密交易平台Blockfinex100%收购,收购金额不详。 Web3通信项目Sending Labs宣布完成1250万美元的种子轮融资。 web3基础设施初创公司Nefta宣布以3250万美元的估值完成500万美元种子轮融资。 Web3消息传递平台Salsa完成200万美元Pre-Seed轮融资。 观点 经济日报表示,元宇宙、人工智能尚在萌芽阶段,谨防新概念圈钱骗局。 华为表示,在与ChatGPT相关的大模型领域早有布局,正通过建立联合体推动产业化。 比尔·盖茨表示ChatGPT的重要性不亚于互联网的发明。 摩根大通表示,ChatGPT等生成式人工智能模式短期内可能成为传统服务的负担。 谷歌员工批CEO应战ChatGPT仓促、拙劣。 工信部重点实验室主任表示,加强研究监管友好的区块链技术架构和链上治理协议。 Cathie Wood表示美国监管机构对中心化质押的攻击损害美国在Web3领域的竞争力。 万向区块链肖风表示,数字经济中使用权比所有权更重要,Token或是互联网平台反垄断的最佳解决方案。 崔东树谈ChatGPT表示,电动化是新能源车的始终核心,智能化是机上添花。 中宣部出版局副局长杨芳表示,推动元宇宙、数字孪生、云游戏等新业态拓展应用。 马斯克称,人工智能是我们需要非常关切的问题,需要监管人工智能安全。ChatGPT展示了AI有多先进,需立法保障人类安全。 爱奇艺副总裁表示,相信元宇宙未来会成为下一代的互联网。 FSB表示全球标准制定者将联手应对DeFi监管。 更多新闻详情关注我们: https://www.metaversehub.net 来源:金色财经
lg
...
金色财经
2023-02-17
市场跳水?请不要慌
go
lg
...
推升模拟芯片需求。此外近期受市场热议的
生成
式
AI
、ChatGPT若得到大规模推广应用,其“训练数据+模型算法+算力”需要在基础模型上进行大规模预训练,其带来的算力需求有望拉动国内GPU(具备并行计算能力,可兼容训练和推理,目前GPU被广泛应用于加速芯片)、CPU、FPGA、AI芯片及光模块产业链的增长。 图 人工智能与芯片实现 芯片行业受到产业趋势与政策导向双重利好,当前估值较为合理,处于历史较低水平。未来景气度较高叠加国内经济修复,芯片板块具有一定的投资价值,感兴趣的小伙伴可以关注芯片ETF(512760),可考虑逢低布局以减缓短期波动风险。 (来源:界面AI) 声明:本条内容由界面AI生成并授权使用,内容仅供参考,不构成投资建议。AI技术战略支持为有连云。
lg
...
有连云
2023-02-17
游戏板块涨1.43%,冰川网络(300533)上涨14.29%
go
lg
...
预计会是所有内容形态最受益于AIGC(
生成
式
AI
)的领域。随着AI技术在创意生产领域的应用愈发成熟,进入游戏产业后,预计AIGC的广泛应用将极大提升生产效率与促进玩法创新。游戏行业一直在谋求研发效率的提升,而AIGC将带来真正的生产力大解放。 (来源:界面AI) 声明:本条内容由界面AI生成并授权使用,内容仅供参考,不构成投资建议。AI技术战略支持为有连云。
lg
...
有连云
2023-02-16
从
生成
式
AI
到元宇宙,Caduceus正在通过AR/VR+AI让Web3应用落地
go
lg
...
从而优化AR/VR的沉浸式体验。
生成
式
AI
可使用现有多模內容(如音讯、图像或文字)来建立新內容。 相比于过去的AI产品,“
生成
式
AI
”(GenerativeAI)正在快速崛起。
生成
式
AI
(Generative AI)是指能够生成新颖内容的人工智慧软体,可以产出文章、程式码、歌曲和艺术画作。近期OpenAI的ChatGPT,就是
生成
式
AI
应用的主要代表。 微软Azure为OpenAI开发的超级计算机是一个单一系统,具有超过28.5万个CPU核心、1万个GPU和400GB/s的GPU服务器网络传输带宽。但从需求端来看,Chat-GPT大模型训练带来高算力需求,必然会伴随着算力成本的上升。 从ChatGPT模型结构来看,其加载模型和文本的速度,生成一个单词的费用约为0.0003美元。而ChatGPT的回复通常至少有30个单词,因此ChatGPT每回复一次,至少花Open AI 1美分,随着其后续不断地投入和发展,成本之高可见一斑。 边缘计算和边缘渲染节点部署效率高,与云端相比,边缘计算和边缘渲染具备时延低、带宽系数少、安全性高、传输效率高、传播路径更可控等优势,可以为元宇宙开发者节省云端资源开销。 Caduceus作为一个全新的Layer 1协议,致力于将去中心化解决方案同边缘计算、实时渲染、3D技术以及XR软硬件结合起来,为元宇宙应用层场景提供强力基础设施支撑。 Caduceus通过去中心化边缘实时渲染的元宇宙协议,实现了区块链与实时渲染的完美结合。其将计算、渲染和存储在云端GPU上完成边缘渲染,通过流化过程传送到显示终端,凭借海量计算和弹性使用的特性,为渲染周期的缩短提供了最优解,而且成本也会大大减少,使其可以适用于各类使用场景。 通过AR/VR+AI的优化建设,使得Caduceus去中心化边缘实时渲染的体验得到进一步提升。例如,利用深度学习技术,进行开发者行动的智能预测,利用预测得到的开发者接下来的动作提前进行下一步的渲染工作。这样一来可以降低渲染延迟,也可以利用神经网络进行注视点预测,以减少渲染计算量,提升计算资源的利用率。从发展动作来看,Caduceus后续主要从以下四个方面进行布局。 一、底层基础设施 发展以“AR/VR+AI+区块链AI框架&算法库+应用场景”为核心的技术体系,构建元宇宙底层基础设施。 二、应用 布局分布式边缘实时渲染和双向挖矿机制,让每一个开发者都能低门槛、高效率地开发出自己的元宇宙应用和场景。 三、场景开发 打造元宇宙式“App store”平台,创造元宇宙场景开发工具。 四、元宇宙衍生服务 NFT生态孵化、数据引擎支持、业务战略合作等。 Caduceus已逐步通过AR相关技术的迭代与能力的升级开发,成为AR与产业融合的重要参与者。在AR底层技术的研发,包括核心部件、核心技术、核心交互、核心应用,开发者和用户可以一站式感受AR技术赋能各领域的最新发展成果,具体概括如下。 购物 当购物者在商店中穿行时,出现数字环境中的弹出式优惠券;虚拟陈列室,展示根据购物者兴趣或需求定制的产品;虚拟试衣间,让顾客在家中舒适地试穿衣服;通过AR向客户展示放置在他们自己家中的家具等。 通讯 AR/VR可能会出现在我们身边的虚拟会议中。AI可以添加摄像头跟踪功能,使大家的注意力集中在正在说话的人身上,让用户感觉就像在办公室里和同事们一起开会,而不是在家里的电脑前。 安全 安全部门可以利用AI驱动的VR来进行身份检测和标记可疑人物的图像。系统数据通过传感器、产品图片、社交网络等途径采集,并根据不同的应用场景对关键特征进行标注以便模型识别。 航空 利用图像识别深度学习技术,可以通过确定飞机的哪些部件需要改进,协助工程师处理航空维修问题。 目前Caduceus正在推动更多企业入局虚拟世界的建设,全球AR/VR生态圈也在逐渐完善,应用场景也拓展至to B、to C等多个领域。2023年AR/VR将会迎来更大的发展空间和更好的发展前景。 “元宇宙”中描绘的虚拟世界是复杂的,同时构建虚拟世界并不是一项简单的任务。其中AR、VR、AI等技术将重新定义互联网连接和交互方式,使得用户感官体验发生质的变化,并为行业发展做出更多贡献。 长期来看,AR/VR的成熟应用期来临之时,元宇宙市场也将带来更多的颠覆。Caduceus作为底层技术的关键力量,已逐渐成为推动元宇宙行业向前发展的引擎,其高效率、低成本的基础设施是引擎发展的动力,将会给我们的生活营造更多的便捷。 来源:金色财经
lg
...
金色财经
2023-02-16
ChatGPT带来的冲击和思考
go
lg
...
内容创作领域有着不可忽略的优势。 作为
生成
式
AI
的ChatGPT,将加速数字藏品等元宇宙内容的开发,推动元宇宙空间基础设施建设生产力提升。 图片来源网络 ChatGPT带来的冲击和思考 图片来源网络 很多元粉在使用了ChatGPT之后,被它的技能和智能所震撼,也开始有了担忧,ChatGPT在未来是否会取代大部分人的工作呢? 这个担忧不无道理,但从积极的角度看,ChatGPT只是一个提高工作效率的工具,它的出现将极大地解放生产力。就如第二次工业革命开始之初,担心失业的工人们破坏机器以此缓解焦虑,却依旧无法抵挡工业化的步伐。而事实也证明了,第二次工业革命后,大多数人并没有失业,反而因学了更多的技能而提升自己的工作效率。可见科技的进步给世界带来的好处要远远多于坏处。 所以,降低焦虑最好的办法是拥抱新技术,多多学习,让最新的工具为自己所用。正如《流浪地球2》中所说的:“没有人类的文明毫无意义”。因为人类独有的创造力,才是真正使人类不断进步的根源所在。 来源:金色财经
lg
...
金色财经
2023-02-16
人工智能带来新风口,昔日游戏芯片巨头又要大显身手
go
lg
...
解的数据创建新的输出。ChatGPT是
生成
式
AI
最著名的例子之一。 Arya在周二给客户的一份报告中表示:NVDA在加速芯片/系统/软件/开发人员的全方位优势使其有望独特地在全球云和企业客户中引领新生的生成式人工智能军备竞赛。 在这份报告发布后,Nvidia的股价上涨了1%。今年到目前为止,该股上涨了逾49%,收复了2022年的50.3%跌幅的相当一部分。 Arya表示,随着生成式人工智能应用的增加,Nvidia的销售额和收益可能会以25%至34%的复合年增长率增长。到2027年,生成式人工智能将使其加速芯片业务的总市场规模增加到620亿美元。 这位分析师说,Nvidia在经历了近期反弹后可能出现波动,但这种波动应该是短暂的。 诚然,Arya表示生成式人工智能正处于一个必要的炒作周期,因此预测其普及速度意味着要做很多假设。但他说,尽管存在潜在的变数,但向加速计算的转变应该会对Nvidia有所帮助。
lg
...
金融界
2023-02-16
游戏板块走强,游戏沪港深ETF(517500)涨幅超1.9%,神州泰岳涨超8%
go
lg
...
场关注,AI基建之外,从投资逻辑来看,
生成
式
AI
最终仍需要场景落地,包括AIGC的数字人、游戏等应用方向。AIGC使虚拟数字人真正有生命力,同时有望赋能游戏的研发、交互和创意。此外,2月份国产网络游戏审批共87款获得版号,游戏行业逐步步入新成长周期,持续看好2023年游戏板块的业绩、估值共振。 (来源:界面AI) 声明:本条内容由界面AI生成并授权使用,内容仅供参考,不构成投资建议。AI技术战略支持为有连云。
lg
...
有连云
2023-02-15
ChatGPT带动AI应用场景大发展,计算机新一轮创新浪潮来临?
go
lg
...
数字还在增长。 更关键的是,GPT属于
生成
式
AI
,也就是不仅能“复制粘贴”,还能“创作”出以前根本不存在的信息。还记得去年火过一阵的AI绘画吗?目前来看,
生成
式
AI
在生成内容的质量、逻辑性和安全性方面都已经有了极大提升,而且能应用在多种领域,包括但不限于文本、图像、代码、视频、3D建模和游戏。 照此推理,未来,ChatGPT或完全可能具有作家、画家、音乐家、程序员甚至是律师、翻译和老师的能力。这就是前面说的,从人力到机器,从简单计算到海量计算,从单一领域到全面开花。凡此种种,大抵实在算得上“划时代”。 有哪些投资机会值得关注? ChatGPT爆火之前,AI这个话题已经在投资圈沉寂了一段时间,主因是不够智能、能应用的场景也不够多,落地困难。 那么抛开热点,站在当下,我们更务实一点,落到产业上,ChatGPT的商业空间究竟怎么样? 我们能看到的是,ChatGPT已经实现从辅助索引到内容呈现,极大提高了内容创作者阅读和搜集材料的效率,也能为创作者的思考与创作提供灵感。因此,ChatGPT完全适用于一些重复度强、机械性强的工作,可以直接为创作者服务,也能运用在搜索引擎里。事实是,微软已经在这么干了,不仅ChatGPT已经开始收费,还官宣了Bing搜索将会集成 ChatGPT。这或是其真正走向应用的重要拐点。 对应到国内,百度正在开发与ChatGPT对标的“文心一言”,将在3月份完成内测,面向公众开放。360也发布公告:目前公司的类 ChatGPT 技术的各项指标已实现强于GPT 2的水平。另外,集成了海量数据的社区如知乎,也有利于AIGC模型的训练和开发,毕竟,在2月8日微软公布的新版Bing搜索,在其中文网页回答的问题中,就有不少答案来自知乎。 延伸一点来看,在搜索引擎之外,如认知智能领域,计算机ETF(159998)前三大重仓股之一——科大讯飞是国产厂商里拥有独特优势的存在。其多年来始终保持自然语言处理等核心技术处于世界前沿水平,并在去年获得 CommonsenseQA2.0 、OpenBookQA 等 12 项认知智能领域权威评测的第一。更关键的或许是,科大讯飞拥有长期建立起来的核心应用场景:包括教育、数字政府、政法、汽车等等,这些都是从模型走向应用的关键入口,用过讯飞快传这一类产品的朋友,对人工智能的应用场景会有更切身的感受 另外,譬如聊天机器人、办公软件、AIGC等领域,都可能会是中国的类ChatGPT产品率先落地的产业。 客观事实是,作为新生事物,ChatGPT还存在准确度、专业度和及时度不够的问题,开发和运营成本目前也还比较高。不过可以预见,未来算法迭代和提升后这些问题有望解决,开发ChatGPT的OpenAI就曾指出,“高级人工智能所需的计算能力每三个半月就会翻一番”。 另一方面,国内厂商的技术也还存在一些差距,例如单颗芯片的算力无法达到欧美水准。不过国内厂商有本土的海量数据优势,加上通过组建多个算力集群叠加多员工迭代的加持,进一步抹平算力上的差距,仍然是值得期待的。 值得一提的是,去年11月以来,ChatGPT已经带火了一批计算机/人工智能板块投资品种。但我们可以看得远一点,以计算机为例,作为整个科技板块的估值洼地,它已经沉寂了两年之久,并且中长期逻辑本身具有更丰富的意涵:智能汽车高速增长带来增长空间,行业利润受公共卫生防控影响减弱、增速回升,也为这个板块带来了更高景气度。更何况,还有一个具有万亿空间的细分赛道——信创,正在蓄势待发。这部分,我们留到下篇消息细聊。 短期有热点,长期有机会,整体估值不高,大抵正是目前计算机和人工智能板块的写照。 看好AI相关技术在国内落地应用的投资者,不妨关注天弘中证人工智能(A:011839;C:011840),其囊括了国内人工智能龙头如科大讯飞、德赛西威、四维图新、科沃斯等;若青睐计算机板块投资机会,场内投资者可关注计算机ETF(159998),场外投资者可关注天弘中证计算机主题ETF联接(A:001629;C:001630),目前其为深交所规模头部的计算机指数基金,且简单清晰、费率较低,或是投资者捕捉计算机市场行情的优质品种。 (来源:界面AI) 声明:本条内容由界面AI生成并授权使用,内容仅供参考,不构成投资建议。AI技术战略支持为有连云。
lg
...
有连云
2023-02-15
上一页
1
•••
204
205
206
207
208
•••
210
下一页
24小时热点
美国突发“出口”中国移民!特朗普签署新命令:即刻停止移民儿童法律援助
lg
...
中美重磅!纽约时报:特朗普希望与习近平达成一项更大更好的贸易协议 中美在讨论让领导人互访
lg
...
特朗普、马斯克突传“罕见”行动!《富爸爸》作者:美国经济将崩溃 万物泡沫坚定持仓比特币
lg
...
【直击亚市】特朗普对中国最新攻击!美元热度减弱,德国选举结果出炉了
lg
...
俄乌战争突传两则大消息!泽连斯基透露辞职条件 俄罗斯发动开战以来最大规模无人机袭击
lg
...
最新话题
更多
#SFFE2030--FX168“可持续发展金融企业”评选#
lg
...
19讨论
#链上风云#
lg
...
60讨论
#VIP会员尊享#
lg
...
1753讨论
#比特币最新消息#
lg
...
905讨论
#CES 2025国际消费电子展#
lg
...
21讨论