全球数字财富领导者

亚马逊云解决方案架构师汪其香:AIGC在不同领域的落地与应用场景

2023-08-10 21:46:12
金色财经
金色财经
关注
0
0
获赞
粉丝
喜欢 0 0收藏举报
— 分享 —
摘要:亚马逊云解决方案架构师汪其香进行了以《AIGC概述与应用场景》为题的演讲。

8月8日,由金色财经主办的线下Web3行业交流活动——金色沙龙拉开帷幕。本期金色沙龙以《Crypto新周期 叙事新动向》为主题。亚马逊云解决方案架构师汪其香进行了以《AIGC概述与应用场景》为题的演讲。以下是演讲内容:

金色财经与老牌龙头不同,今年有个火爆的概念疯狂抢夺人们的注意力,这个概念就是AIGC。从ChatGPT风靡全球到Midjourney重塑许多行业。人们可能有疑惑,AIGC到底是个啥,到底怎么用?接下来欢迎亚马逊云解决方案架构师汪其香带来演讲《AIGC概述与应用场景》。

DC29UxdxzhZw5GooD8r84wXPMHbV0xDqEs2sXh77.png

汪其香:大家好,我是亚马逊云解决方案架构师汪其香。今天我将会为大家介绍一下AIGC,AIGC是除了币圈之外,最近比较火热的话题。我会向大家介绍它是什么,它在哪些行业和场景中得到了应用,以及与AIGC相关的一些技术现状。最后,我还会探讨一下AWS在这个领域能够提供的能力。

首先,AIGC是从人工智能(AI)发展起来的概念。起初,我们将这个领域称为人工智能,随后随着机器学习的发展,尤其是英伟达等公司算力的提升,我们进入了深度学习时代,神经网络变得越来越庞大、复杂。随着Transformer等技术的出现,大型模型开始兴起,我们把它称之为AIGC。AIGC的核心意义在于改变了创作生产力的方式。传统的AI主要用于推荐和搜索等任务,改变的是内容传播的方式,但创作的源头仍然是人类。然而,AIGC改变了创作的源头,将创作的过程由人类转变为由人工智能生成,因此AIGC在未来的发展潜力越来越大,能够承担的任务也越来越多。

据预测,到2025年,由生成式人工智能产生的数据将占据全部数据的10%,而目前这个比例不到1%。这意味着在未来一到两年内,我们在生活中接触到的由人工智能生成的素材,例如广告、海报等,其比例将迅速增加10倍。市场对AIGC的反应也表明,目前已经有许多行业开始应用AIGC技术。AIGC将在各个行业中发挥作用,不仅局限于图片生成,还包括视频生成、语音生成以及文本创作等各个方面。

从技术角度来看:

1. 生成图片:AIGC在游戏、电商等领域能够生成各种类型的图片,包括电商产品图片等。

2. 文字生成:除了邮件、广告等场景,AIGC还可以在办公和代码编写领域生成文字内容。

3. 生成音频:AIGC可以用于音乐作曲、生成虚拟数字人等音频创作。

4. 视频生成:虽然之前不够成熟,但现在AIGC已经可以通过输入文字生成相应的视频,例如产品宣传片等。

5. AIGC在典型行业中的应用:在广告媒体领域,AIGC技术可以应用于视频制作,同时也可以用于生成文字内容。

在游戏领域中,AIGC的应用也十分引人注目。以前,一个人要创造一个游戏可能需要花费几个月的时间,但有了AIGC技术,现在仅需一个小时就可以创造出多个游戏。这使得游戏开发者的角色从创作者转变为选择者。其中,图片生成的技术成熟度最高,行业中的应用程度也最广泛。不过,在音频和视频方面,目前的技术还没有像图片生成那样成熟。

AIGC技术可以分为两个主要方向:

1. 多模态转化:AIGC能够处理多种不同的输入模态,如文字、图片和代码,然后将其转化为多模态的输出。例如,你可以给AIGC一个描述,它可以生成相应的图片、文字和代码等多种形式的输出。

2. 语言交互:AIGC还可以用于语言交互,比如对话机器人。你提供一段输入,它能够与你进行交互,而不仅仅是单向地创作内容。在这个领域中,常见的应用是客服。随着AIGC技术的普及,人们很难分辨出某个回复是由人还是机器生成的。像ChatGPT这样的大型语言模型,它的回复方式与人类非常相似。

在AIGC技术中,可以将其分为不同的技术层次:

1. 基础设施层:基础设施层是整个技术栈的基础。英伟达和云服务提供商为AIGC提供了必要的硬件设施,因为应用于垂直领域和各种训练和推理任务的大型模型需要底层的计算能力。

2. 模型层:模型层是构建在基础设施之上的,当前有一些大公司和科研机构推出了开源的大型模型。这些模型提供了基础能力,可以根据具体行业的需求进行进一步的训练和应用。例如,对于Web3.0中的链游领域,可以利用开源模型进行特定训练,以满足该行业的需求。现在许多公司在这一层面主要是应用模型,根据自身领域的问题引入大型模型的能力,构建SaaS工具,提高内部生产力。

3. 细分应用层:在模型层之上,还可以进一步构建细分的应用。例如,绘画领域中的模型,最初可能会比较受欢迎,但随着时间的推移,针对实际场景的应用将变得更加重要。例如,商品展示和设计等领域,除了绘画外,还可以应用AIGC来生成特定的设计元素。

除了图片生成,另一个重要的应用场景是大型语言模型。这些模型在语义理解方面取得了巨大进展。与以往只能进行简单文本提取和分类不同,现在的大语言模型能够理解你的意图。无论是要在互联网上搜索信息,从数据库中查询数据,还是撰写文章,它都能够理解语义,并将其转化为相应的指令。

这些大语言模型的语言表达也更加流畅,不再像以前那样与人类表达方式相悖。它们还能够进行闲聊对话。然而,大型语言模型可能会出现编造和虚构的情况,有时候会编造不实信息。另外,由于它们的知识来源于已学习的数据,可能会出现过时的信息。如果要应用这些模型,可能需要在其基础上加入其他组件来提高其准确性和可靠性。

模型的规模、成本和质量之间存在一定的关系。模型越大,效果往往会更好,但同时需要更大的计算能力支持。参数量的减少可能会导致回答质量的下降。

以图片生成为例,如果要将AIGC用于实际应用,比如在设计领域,就需要对模型进行一定的控制,以生成符合实际需求的内容。例如,在营销活动中,设计师或运营人员可能需要根据需要生成大量图片。AIGC可以在几分钟内生成大量图片,然后运营人员可以从中挑选。在服装行业中,AIGC还可以帮助设计人员找到创意并生成图片和设计风格。

此外,AIGC还可以用于活动海报的生成,帮助拓展创意思路。例如,有一个广告客户卖眼镜和假发,以前需要找模特并在各个国家拍摄照片,成本很高。但现在借助AIGC和开源模型,可以生成各种肤色和国籍的模特照片,降低了全球投放的营销成本。

在游戏策划和素材创意方面,AIGC也能发挥作用。游戏设计的原画师可以通过AIGC提高工作效率,生成原画和策划灵感。同样,填色领域也非常适合AIGC,特别是在二次元动漫场景中。

在文字生成方面的应用,主要集中在对话、客服、陪伴机器人、游戏中的NPC、数字人以及智能问答等领域。以前在搜索引擎中,你需要明确指定你要搜索的内容。但现在的大语言模型可以理解你的语义,你可以以自然对话的方式向搜索引擎提问。智能问答方面,你可以直接问出类似“搜线下性价比最高的产品是什么”这样的问题,它会理解你的意思并呈现出相应的结果。此外,大语言模型还可以辅助编写代码,帮助生成SQL语言和模块,以及撰写剧本和营销邮件等。

为了应对开源大语言模型可能出现的幻觉和胡编情况,可以采取一些限定条件下的回答策略,以确保机器人的回答不偏离主题。例如,在提问之前,可以通过企业文档和数据库来限定机器人的回答范围,让它只在特定领域内进行回答,从而实现可控的文本生成。

除了开源模型的应用,亚马逊云还提供了一系列机器学习能力。亚马逊云的机器学习服务分为三个层次。最底层是基础设施,提供强大的算力支持。中间层是机器学习训练平台,您可以在这个平台上进行模型训练、模型部署,并且可以找到并使用各种开源模型。最上层是托管的AI服务,如AIGC和模型推理等。

举一个例子,如果我们使用AIGC生成图片,可以结合图像识别服务,对生成的图片进行简单的筛选。例如,确保生成的图片不含有黄色或暴力内容。或者可以指定生成某种产品在特定场景下的展示图,然后通过图像识别服务检查生成的结果,确保是否符合要求。这类似于前处理或后处理的操作,可以借助不同的AI服务来实现。

目前,除了AIGC(Artificial Intelligence Generated Content)之外,另一个热门的工具是“Building”服务,它是围绕大语言模型的脚手架工具。由于开源大语言模型的种类繁多,而在不同的场景下可能会使用不同的模型或者有一些特定的思维链。Building工具可以帮助我们管理多个大语言模型,包括AWS自家的泰坦大语言模型,从而简化在大模型上的开发工作。

AWS还提供了基础设施算力支持,通过自研芯片可以降低未来推理成本。当我们完成模型开发后,通常需要进行推理以适用于实际场景。AWS自研的芯片可以提供低成本的算力资源,以满足各种应用的需要。

另一个面向个人开发者免费的服务是“第三个服务”,该服务支持多种语言。

刚刚提到的“Bedrock”服务是一个API,它支持许多常见的基础模型。举个例子,你可以使用AWS自家的大语言模型泰坦进行文字生成。同时,你还可以利用其他公司的大语言模型。有一些模型是预先训练好的,可以直接使用。然后,通过这种服务,你可以将这些开源大语言模型导入到你自己的AWS账号中,进行微调以满足特定场景需求。你可以将这些模型集成到自己的应用框架中。

“Bedrock”提供了许多模型,它们不断更新。你可以使用这些模型来生成内容,辅助编写代码等。

最后,让我们来了解一下关于基础设施的服务。目前,我们提供了A100和A800等型号的计算卡,这些资源可以在海外使用。除了在训练阶段需要的高性能算力外,我们还提供了用于推理的计算卡,以降低推理的成本。除了英伟达的计算卡外,我们还自行研发了芯片,例如SD和其他常见的大语言模型,这些模型可以在我们的芯片上进行部署。由于成本较低,相同的算力情况下,使用我们的自研芯片会更加经济高效。这些大语言模型已经兼容了我们的芯片。

在机器学习领域,AWS提供了全流程的赋能。我们拥有解决方案架构师团队,可以协助您进行架构梳理。此外,我们还有产品技术专家团队,以及人工智能实验室和数据算法科学家。如果您有创新的AIGC场景,我们会投入算法科学家与您合作,共同推进项目。此外,我们还提供培训体系,以确保您可以充分了解和利用我们的服务。

AWS的解决方案具有高度的灵活性,可以确保私域数据的安全性,并提供高性价比的基础设施选项。我们还提供了直接调用API来使用大模型的功能,同时我们也拥有全面成熟的AIGC解决方案,适用于各个行业、媒体等领域。

以上就是我今天的演讲内容,大家对于AIGC在海外的云计算,或者关于AIGC的任何问题,都可以一起来讨论,谢谢大家!

来源:金色财经

敬告读者:本文为转载发布,不代表本网站赞同其观点和对其真实性负责。FX168财经仅提供信息发布平台,文章或有细微删改。
go