最近这些年,区块链领域锣鼓喧天,人工智能(AI)领域鞭炮齐鸣,但这两大变革性技术却似乎交集不多。但从概念上看,区块链和 AI 有不少互补之处,比如区块链技术固有的去中心化特性也许可以帮助解决 AI 的中心化问题,区块链透明且可验证的性质或许有助于解决 AI 模型的不透明问题。
前段时间,「区块链 X AI」的概念炒作让不少相关加密货币市值大增,整个板块的市值一度超过 200 亿美元,如图 1 所示。这说明市场对这一组合相当看好,投资者也颇有信心。
图 1:不同细分领域的加密货币市值,2024 年 4 月 18 日数据
但是,区块链和 AI 的整合实践中也暴露出了这两者存在的一些冲突之处,比如 AI 需要密集计算和大量存储,而区块链的分布式账本架构则强调冗余——每个节点都会存储和计算同样的信息。
近日,清华大学和 Fraunhofer HHI 等机构的一个研究团队发布了一篇论文《Blockchain and Artificial Intelligence: Synergies and Conflicts》,分析了区块链和 AI 之间存在的技术协同和冲突。值得注意的是,该团队并没有埋头分析理论,而是着眼于加密货币市场,分析了市值超过 1000 万美元的「区块链 X AI」项目和一些特定用例。
下面我们就来看看这篇论文讲了啥,得到了什么有趣或有用的见解。
图 2 展示了区块链和 AI 之间的互补与对立之处。
去中心化与中心化。GPT 等当前最佳的大型语言模型(LLM)的训练和维护需要大量算力、电力和数据资源。举个例子,2020 年发布的 GPT-3 的训练过程的计算成本大约为 460 万美元。如此高的成本让 AI 大模型成为了少数几家大型科技公司的角力场——它们也基本上成了 AI 市场的垄断者。这样的垄断可能会妨碍竞争,这也是美国和欧洲等地区的政策制定者经常表达的担忧——这些地区在执行反垄断法方面非常积极,以维持市场平衡以及防止市场被单一实体主导。相比之下,区块链技术则是去中心化的;这样的特性或许能用于解决 AI 系统的中心化问题。只要部署得当,区块链的去中心化特性可防止任何一方控制整个网络。这一特性可帮助在 AI 系统内实现某种监管机制,实现更平衡的权力分布,并促进各方协同合作。因此,整合区块链技术可望解决 AI 领域内有关监管和垄断的争论,使 AI 治理变得更加包容和公平。
透明度与黑箱本质。区块链技术的另一大特点是透明,其上的交易和记录都是可验证且不可篡改的。另一方面,AI 却宛如一个黑箱——人们很难明晰其决策背后的推理过程。也许我们可以使用区块链账本来记录 AI 的决策过程,实现透明的审计跟踪,从而提升 AI 应用的可信度。此外,区块链还能整合先进的加密技术(比如 zk-SNARK 等零知识证明)或使用安全硬件(比如 Trusted Execution Environments/可信执行环境/TEE)。这些技术可帮助验证特定的计算步骤是否被忠实准确地执行。
数据管理和依赖。区块链可通过智能合约与星际文件系统(IPFS)等协议监管数据与数据访问权限。
开源与闭源。区块链可通过加密协议实现共享所有权,进而实现细粒度的隐私配置,从而解决 AI 专有模型的局限性。如果能让共享式 AI 系统(由参与方联合训练和控制)的性能达到商业模型的水平,那么 AI 发展的透明度将会大幅提升。这也能促进人们创造更公正和全面的人工智能解决方案。
尽管区块链和 AI 之间有上述协同共进之处,但它们之间的运营需求却存在重大冲突,妨碍了这两者的整合。
计算成本和负载。对于 GPT-4 和 Llama 3 等大型语言模型(LLM),训练和推理都需要大量计算资源。区块链的共识机制、加密操作和不利的数据结构都会增加计算负担,从而影响可扩展性。
存储限制和数据密集度。区块链的去中心化特性尽管能确保安全和冗余,但也会导致显著的存储需求,这对数据驱动的 AI 系统来说无疑是高成本和低效的。在以太坊等通用区块链系统(GBPS)中,每一个节点都必须存储所有信息,因为冗余能保证该区块链网络的安全性和弹性,但却不利于可扩展性。由于以太坊虚拟机(EVM)上的新数据都会被储存成交易格式,那么 EVM 结构上的常见数据可能会有碍检索的速度。另一方面,AI 应用则会生成和处理大量数据,这就需要高效且可扩展的存储解决方案。
伪匿名和安全性挑战。区块链允许通过非对称加密实现无许可、伪匿名的访问;而针对可能出现的女巫攻击(Sybil Attack),则可通过设置计算或资金屏障来保护网络。另外,某些用例是将区块链用作提升隐私保护和分布式 AI 训练的平台,使用的技术包括联邦学习等;而如果这些用例支持伪匿名地参与训练过程,则可能出现风险。
这些方法容易被对抗式联邦学习攻击攻破,而想要确定恶意攻击者的身份却非常困难,因为根据设计,向整体 AI 模型提交的贡献是私密的并且难以测量。
操作不匹配。大多数区块链虚拟机都使用了固定的账本操作以保证结果是确定的——这很重要,毕竟金融交易涉及的都是钱。而浮点运算则可能在计算中出现精度损失,尤其是当计算数量级相差巨大的多个数值时。但是,AI 训练的一种常见做法是将浮点参数归一化到 0 到 1 之间,因为这有助于实现稳定有效的梯度流并提供隐式的正则化,由此提升整体训练效果。
基于上述区块链和 AI 的协同与冲突,可以来看看用例了。该团队调研了在整合区块链和 AI 方面做得最好的一些项目。他们关注的重点是已有产品,并发行了代币且市值超过 1000 万美元的项目。此外还有一些市值虽低于 1000 万美元,但用例新颖的项目。他们基于三个研究问题对这些项目进行了分类:
该项目内区块链和 AI 技术协同整合的程度如何?
区块链在该项目中的作用?
AI 在该项目中的作用?
聚类分析结果如图 3 所示,其中包含 4 个主要聚类:AI 是区块链的外围技术、AI 参与到区块链中、区块链管理 AI 过程、区块链是 AI 的核心基础设施。
AI 可帮助提升与区块链交互的用户体验、实现智能化分析、简化区块链应用的开发流程等。
AI 可以积极地参与到区块链生态系统和治理结构中。该团队在论文中给出了两个探索方向:一是让 AI 智能体作为参与者或利益相关者加入到分布式网络中,比如让 AI 自己在 Dex 上炒币;二是让 AI 参与治理 DAO(去中心化自治组织),不过目前来看这方面还比较困难。
现在人们越来越多地使用区块链技术来管理 AI 过程,为资源共享、数据管理和应用部署创建一个去中心化框架。
以太坊等通用区块链系统(GPBS)面临这可扩展性、安全性和去中心化的三角权衡。
以以太坊为例,其安全性由分散在全世界的数千个节点保证,验证者数量已超过 100 万。为了达成共识和最终确定(finality),每一个新的信息区块都必须到达这个全球网络的每个节点并被每个节点验证,而每个区块的大小都在千字节量级并且每 12 秒创建一个,这会导致高昂的存储和计算成本。
因此,直接在链上执行或存储计算密集型的 AI 操作是不现实的;但现在 Layer2 rollup 正在成为一个比较热门的范式。简单来说,Layer2 rollup 就是指不在链上而在链下处理交易,之后将处理结果汇集后再记录到链上;这种解决方案既能提升吞吐量,也能降低成本,颇具成本效益。
类似地,专门为 AI 用例开发的区块链必须(1)克服与高计算和存储成本、公共访问和底层虚拟机限制相关的挑战以及(2)将区块链单纯用作纯管理、治理和安全层。表 1 展示了将区块链用作核心基础设施的新系统。
表 1:将区块链用作 AI 的基础设施,其中 DAI = 分布式人工智能、BC = 区块链、DT/FL = 分布式训练/联邦学习、C-Layer = 计算层、TA = 技术分析、DM = 分布式管理、PoS = 权益证明、 DPoS = 委托式权益证明、dBFT = 委托式拜占庭容错、FL = 联邦学习、DID = 去中心化身份、ZK = 零知识、DePIN = 去中心化物理基础设施网络、DC = 分布式计算、DD = 分布式数据、ASBS = 特定应用的区块链系统、IPFS = 星际文件系统、* = 成熟度低/没有公共代码,? = 信息不可用。
来源:金色财经