心化云端中,是现阶段 Web3 .0 即时通讯(IM)运用一个好的解决方案。 一、SocialFi 的存储问题的必要性和重要性讨论 SocialFi 让用户实现自我数据的拥有权,并让自我产生的数据产生实际的经济价值。从而实现 web3 所提倡的可读+可写+可拥有的愿景。而为了实现这一愿景,就必须关注其底层的存储赛道。存储赛道决定了 SocialFi 产品的用户上限,未来 SocialFi 赛道的扩容方案和数据上链的策略也会成为这个赛道的技术护城河。要关注 SocialFi 赛道中的存储问题,首先最重要的是要关注三个方面——去中心化,扩展性,以及经济性。 1.1 去中心化 现有的 Web2.0 社交类产品都是存储在中心化服务器上面的,用户是没有拥有权的。中心化的平台拥有绝对的掌控权,用户和平台之间的权利是不对等,在过去也产生过三个方面的问题:第一个问题是社交类公司通过用户的数据进行牟利。(如:算法牟利,出售数据)。 第二是社交类产品对用户进行不正当的审查。(如:禁言,封号,删帖)。最后一个问题是社交类公司对用户进行不正当的监控(如:划区域屏蔽,窃听)。所以 Web3.0 的 SocialFi 产品需要解决中心化带来的问题,即通过去中心化的技术手段和管理方式去避免上述问题的出现。通过对一个 SocialFi 产品的存储方案的分析其实也可以看出这个是不是真的 Web3.0 的产品。 1.2 扩展性 扩展性在 SocialFi 领域非常重要,这会直接的影响用户体验。在 Web2.0 的社交产品中,顶尖的产品的,比如 Twitter, Wechat, Snapchat. 的 TPS 都在 10w+。用户增量和日活数到底一个量级之后,Social 产品需要有更好的扩展性能够容纳相应的、日益暴涨的数据容量。如果需要 Web3.0 的产品要有一样的产品体验,必须要具有优秀的扩展性,也就是必须要考虑每秒事务处理量(TPS)。 1.3 经济性 SocialFi 产品需要良好的发展,就必须关注业务的成本。如果成本过高,则普通的用户是没有办法参与其中的,就像早期普通人没有办法坐飞机一样,(制造成本太高)。因此现阶段在存储方面也应该保持一定的经济性。经济性也体现出项目方在存储技术的问题上,是否考虑了未来的用户增量带来的潜在的经济问题,这一点对于 Web3.0 的社交 Dapp 应用来说,也至关重要。 二、SocialFi 目前采用的存储类别 现阶段 SocialFi 的存储类别主要分三大类:链上(On-Chain), 中心化云端(Centralized Cloud Storage CCS), 去中心化云端(Decentralized Cloud Storage DCS)。 2.1 链上存储 数据上链,指的是数据存储在链上,比如将数据存储在以太坊,Solana,Deso 上,这样存储的数据具有一定的可编程性,用户可以在链上完成数据的更改,交换,以及交易。这样的数据库是去中心化的,是可以永久的保存数据的。但是其致命的缺点就是费用高,且用户体验差。(频繁的链上授权) 2.2 中心化云端的存储 中心化云端的存储,指的是将数据存储在中心化的云服务器上,比如将数据存储在 iCloud 上,存储在百度云,存储在亚马逊云上。这样的存储方式,可以享受现阶段 Web2.0 的成熟的生态,以 AWS 为例子,它为用户提供了一套完整的基础设施和应用程序的服务,提供给客户计算,网络和存储等核心服务。Twitch(游戏直播网站) 就是运行在亚马逊云上的。但是需要注意的是,数据是中心化的,用户并不真正的掌控自己的数据。 2.3 去中心化云端的存储 去中心化云端的存储,指的是将数据存储在去中心化的存储解决方案上,比如 IPFS(星际文件系统是一个旨在实现文件的分布式存储、共享和持久化的网络传输协议)上的 filecoin, Arweave, Storj。这样的存储方式,所产生的存储费用最低,并且存储的数据库是去中心化的。但是面临的问题是,缺乏可编程性,生态不够完善,计算能力弱。现阶段并不能以其为基础,来构建一个高并发的实时通信的 APP。 三、 不可能三角在 SocialFi 赛道存储上的量化问题 3.1 去中心化程度 要衡量去中心化的程度,就得考虑节点的数量,通常来讲节点的数量越多,其去中心化的程度越高,数据不会被某些主体所掌控,也代表着数据的安全程度,通常来讲节点越多,数据丢失的风险就越低。(很多的节点都有备份。)因此笔者认为,节点数量是去中心化程度的一个重要的参考指标。 下面这张图的数据主要来自于 Hunter Lampson的研究。 3.2 扩展性 要衡量扩展性就必须要考虑每秒事务处理数(TPS),现阶段去中心化云存储采用的大部分都是静态存储,数据之间并不能实现可编程化,所以其并没有 TPS。 随着以后虚拟网络机的升级,比如 Filecoin 将要引入的 FVM,去中心化云存储才真正的实现了可交互性。所以在此,笔者只在链上和中心化存储之间进行对比(各链数据采用实时 tps)。 3.3 经济性 一个 SocialFi 产品必须控制其成本,让更多的人能够加入其中。考虑到存储 1GB 在以太坊上要花费 1 亿美元,存储 1GB 在 Solana 链上需要 52 万美金. 现阶段链上存储是不切实际的。对比于中心化的云存储,去中心化的云存储是最经济的。以 AWS 和 Filecoin 作为对比,存储 1GB/year 在 AWS 上的费用为$0.276, 而存储在 filecoin 上费用为$0.043. AWS 是 filecoin 的 6.5 倍。 总结来看, 可以得出以下图表: 四. 现有 SocialFi 产品的数据存储方式 4.1. lens protocol Lens protocol 是一个搭建在 Polygon 链上的可组合的去中心化的社交图谱,用户通过生成一个 Profile 作为其生态的通行证,在 lens 生态中,所产生的用户行为都会生成一个 NFT,比如 Follow 他人,发布收集动态,转载动态等。 通过对其合约的链上查看,以及询问 core member( lens protocol 合约代码 )笔者了解到其 profile nft 的元数据是链下存储的, 通过区块链浏览器查看了解到其存储在采用 Json_base64 的 Data application 中。这样的存储方式产生的问题是存储层与交互层实际上是分离的。这也意味着链上产生的信息不会立马的反馈到 NFT 的元数据当中去。另外 Profile NFT 和动态(post)所存储的地方也不同,动态的元数据存储在 Arweave 中。具体显示如下图所示: Lens protocol 致力于打造 Web3.0 的 Twitter, 所采用的存储方式是不能做到实时交互的,因为 NFT 的内容被存储在 AR 中,中心化存储器中,而其运行的平台是在 polygon 的链上。链上的行为和 NFT 之间不会立马体现出来,比如增加了一个粉丝,但是 Profile NFT 上会一段时间内没有变化。 4.2 Galxe Galxe 是一个链上记录凭证平台,目前的主要作用为撸毛,用户通过在 Galxe 上面做项目方的任务,来获取未来空投的预期。Galxe 的链上凭证(NFT)都是存储在 IPFS 中的。作为一个 Web3.0 项目的流量入口,Galxe 需要保证其提供的链上证明是不可篡改,以及可以溯源的,其对于扩展性的要求不高。其采用的 IPFS 的存储是非常符合产品定位的。 4.3 Mirror Mirror 作为 Web3.0 内容发布平台,用户可以在 Mirror 中发布自己的文章,该文章会永久的存储在 Arweave 中,用户可以将文章生成为 NFT 并出售。用户可以掌控自己的内容,不受中心化平台的限制,而且所发布的内容是永久存储的。 作为一个媒体平台,Mirror 并不需要很高的的交互性,仅需要关注发布者对文章的修改和读者对文章内容的读取。并且文本的存储占用的空间相对于视频和音频来说是可以忽略不计的。在这样的情况下选择去中心化云存储(DCS)很好的顾及了去中心化和经济性。 4.4 Cyberconnect Cyberconnect 是一款去中心化的社交图谱协议,意旨在帮助用户在社交网络中真正的拥有自己的社交身份,内容,和关联。传统的 Web2.0 的社交图谱,被 Web2.0 的机构所拥有。平台掌握着你的关于你个人的账号,你的粉丝,以及你的内容。当你违反了平台的规定和要求的时候,你的中心化账户很有可能收到影响,比如近期的炼金术士辛吉飞就由于内容遭举报,注销了自己的 600w 粉丝账号。这就意味着账号,上传的内容,关联(粉丝)都没有办法找回,幸苦的运营成果付之东流。 Cyberconnect 就是为了解决这个问题的,在 Cyberconnect 中用户拥有自己的社交图谱,用户之间可以互相的 Follow,可以把自己其他的账号关联在自己的社交图谱中,比如 Twitter 账户, Facebook 账户, 以太坊地址,Opensea 账户等。这样的好处有两个第一个是,当单个账户被封时,粉丝可以通过社交图谱再次连接到新的账户,并且用户可以证明原号是属于你的。 第二个好处是社交图谱作为基础层,和应用层是分离的。用户既将多个账户的数据集合到自己的社交图谱中,又可以将社交图谱当成一个端口,并且通过这个端口去登陆各个 Dapps 中。(万能钥匙,一个钥匙可以打开所有的门) 这样的产品设计理念,为了保证社交图谱的安全,是需要去中心化的; 同时也为了保证社交数据的高度动态,也需要很好的可扩展性。现阶段 Cyberconnect 采用的存储方式是 Arweave+Ceramic, 同时 Cyberconnect 也是架构在 Ceramic Protocol 上面的,从而实现数据的可组合性,从静态的不可变数据中获取可变的动态数据。(具体 Ceramic 的介绍请看Eshita Nandini,Messari的研报) 虽然 Ceramic 采用了分片进行了扩容,但是其能否实现大规模的运用,还需观察。 4.5 Nansen connect Nansen connect 是一款由 Nansen 打造的提供给 Web3.0 用户的社交软件,这款软件借助着 Nansen.ai 的强大数据支持,支持持币聊天,链上个人数据显示,链上交易实时预警,链上活动分群(比如在 Curve 上面提供流动性),以及不久将来要到来的 app 内 NFT 交易,App 内的礼物系统。在笔者看来这是一个杀手级别服务于链上用户的社交软件。(Nansen connect 产品分享会 ) 4.6 Deso DeSo 是一款专门为社交赛道打造的一款区块链,为了大规模的支持社交运用,Deso 的架构主要集中于两个方面,大量的自定义存储空间,以及完善的索引逻辑。在存储方面用户的数据大部分都是存储在链上的,包括:用户资料,动态和评论,所有的聊天信息(进行 end-to-end 加密),点赞和关注等;在索引方面采用了裸机来进行索引,使用每个节点在与对等节点同步时在共识期间构建的自定义索引,既在链下由每个单独的节点进行数据的读取,这样对比于传统的虚拟机来讲,极大的提高了数据的索引速度。Deso 所采用的方式,让用户的数据可以在其链上生态之间迁移。 虽然白皮书写的很好,但是从今天市场上的反应来看,无疑 Deso 是一款失败的项目。抛开其早期比特币充值到 deso 网络不能提现,以及 ICO 涉嫌非法证劵发行等问题外。Deso 的存储费用也是一个值得关注的问题,目前按照$Deso 的市场价来算存储 1GB 在 Deso 网络上是$6.45, 这都是在网络几乎没人使用情况下的价格。笔者同时认为,这样的产品设计逻辑是不合理的,当每一个动态,关注,以及评论都金融化的情况下,无疑会让产品的体验被撕裂成很多小的碎片,不能很好的留存住用户。 五、关于未来 SocialFi 在存储问题上的展望 目前受限于现存去中心化存储的可编程性问题,存储的数据大多数是静态的且不可交互的。同时也受限于计算速度的问题,现阶段的 IM 的 SocialFi 产品是很难完全构建在去中心化的网络上的。同时去中心化存储所占的市场份额还是非常的小的和整个 Web3.0 的用户量是成正相关的,虽然其存储费用已经低于中心化存储,但是无论是 Filecoin, 还是 Arweave 的生态,都是无法与 AWS,谷歌云,这些成熟的生态相抗衡的。其计算能力也是远远的落后于中心化存储解决方案。随着后续的技术的发展比如 Filecoin 的 FVM,以及其他的可编程的存储公链的崛起,以后的 SocialFi 产品的体验会有所改观。笔者相信以后的 SocialFi 产品,是可以让人忘记其其实是架构在区块链技术上的。 总结 链上存储,中心化云存储,以及去中心化存储现阶段都不是一个完美的解决方案,都不能兼顾去中心化,扩展性,以及经济性。现在还处于 SocialFi 的早期阶段,现阶段的存储方式还需要在存储的不可能三角上去平衡。SocialFi 产品需要根据自身的愿景去选择合适的方式,比如 Mirror 作为文章的发布平台,其采用 arweave 的存储方式,既保证了去中心化,对扩展性没啥要求,又相对便宜。在笔者看来这就是一个很好的解决方案。但是对扩展性有要求,高频交互的运用来说,混合的 Web3.0 存储方式,可以保证重要数据上链,其他数据存储在中心化云端中,可能是一个好的解决方案。 来源:金色财经lg...