Arweave—不仅仅是存储这么简单

项目简介

Arweave 是个非典型或非主流方向的区块链项目,我们之前对其一无所知,稍有了解的人,可能也就是把它看作是众多类似 Filecoin 的去中心化存储项目之一。所以也造成了之前我们对Arweave的一些忽视,今天就好好的把整个项目重新再认识一下。

Arweave 协议的愿景是提供去中心化、可扩展和永久的链上数据存储(永存);就像以太坊被认为是世界计算机,Arweave 可以被认为是永远不会忘记的世界硬盘。

创始人

Arweave创始人兼CEO—Sam Williams是去中心化爱好者,在分布式系统设计和实施方面具有丰富的经验。英国人,黑客,博士,目前推特关注者15K。

先简单了解Filecoin的方案

Filecoin是去中心化存储赛道最知名的项目,我们聊Arweave肯定免不了先来了解下Filecoin。

首先,我们知道,Protocol Labs开创的IPFS 是去中心化存储领域的开创者 ,从 2014 年上线开始,自由生长,已经存储了大量的数据。但是要让 IPFS 成为商业可用的存储系统,而不是随意的数据分享平台,必须提供服务质量保障 ,这就是 Filecoin 要解决的问题,即 IPFS 的经济激励层。

Filecoin 遵循 AWS 和其他云服务供应商的做法:基于合约的存储,即付即用模式

Filecoin 协议构建了两个市场:数据存储市场和数据提取市场。

整个服务的流程大致是这样的:有存储需求的用户到数据存储市场申明自己的需求:我要存多少大小的数据,要求有多少个副本,存储多少天。市场中的存储服务商 (存储矿工) 对这项存储需求报价,用户接受报价就跟矿工签订合同,支付费用。当用户需要使用数据时,就到数据提取市场提出申请;再由提取矿工给出报价,满足数据访问需求。

为此Filecoin 设计了 复制证明 (PoRe)来解决矿工需要提供存储了用户数据的密码学证明(证明是这位矿工在给这位客户提供存储空间存储着客户的数据);又设计了时空证明 (PoTS)采用质押机制解决在合同有效期内,协议要持续检查矿工如约保存了数据这个问题(如果违约,矿工要遭受罚款),最后用经济模型来激励矿工存储数据,让已存储数据的容量比空闲的容量赚取的更多增发奖励(同时需要防止矿工注水垃圾数据骗取增发奖励)。

不得不说,Filecoin 构建了一个比较复杂的技术架构加经济博弈系统,所以不可避免的,带来了一些不良后果。

首先是系统复杂性高 ,矿工除了承担必要的采购硬件存储成本,还要承担高昂的证明成本(时空证明的计算服务器)和质押 Filecoin 损失的机会成本。所以看到Filecoin的矿工为了规模效应能赚到钱,基本都要花几百万搭建起一个小型数据中心,这样就带来挖矿成本高的劣势,那就势必造成了 Filecoin 系统的存储服务价格比目前中心化的方案(AWS、阿里云)高很多。

此外,验证真实用户也是个微妙的问题,验证太严会影响用户使用体验,太宽则不能阻止矿工伪装成用户,验证就失去了意义,其间的平衡很难掌握。关于这点也咨询过黄老师,确实是目前大部分存储空间基本都是有矿工自己在冒充用户存进去,真实用户还是太少。

还有最后一点,Filecoin 协议将存储和提取分为两个市场,因此建立了两套激励机制和定价机制 ,而且还导致用户的数据访问权得不到保障。比如说我通过 Filecoin 存储了重要数据,支付了一定量的存储费用。后续我如果要访问该数据,还要根据提取市场的行情支付费用(这就很反人性,不是一个好的商业模式)

随着市场规模变大,如果提取市场价格很高,相当于数据被矿工挟持,用户面临要么支付高价,要么就只能迁移数据到中心化服务器的解决方案,这对企业级用户来说是一个灾难。

亚马逊云或阿里云,建造数据中心的成本远远低于市场(凭借巨量的采购规模降低硬件采购成本+数据中心的电费+网络宽带费成本),而且他们不需要在网络中证明、验证和抵押大量的代币造成带来机会成本;云服务厂商和客户之间签订的是法律合同 ,法律保证了客户的访问权和追索权。

以上的种种,导致目前filecoin这套去中心化的存储方案成本和商业模式都无法同中心化云存储方案竞争。

Arweave机制简单介绍

那么我们再来看看Arweave作为新协议是怎么来破局的,只有了解了Filecoin 的重和复杂,才能理解Arweave的轻和简洁。

首先说一下,Arweave是一套完整的去中心化存储协议,不是基于 IPFS的,有自己的底层架构和经济激励层。之前我们知道Filecoin设计一套复制证明(PoRe)来解决矿工证明的问题,Arweave并没有这样做,那如何解决矿工证明的问题呢,Arweave的答案是无需证明。

Arweave协议通过机制设计鼓励矿工尽量多存数据,而且优先存储副本少的稀缺数据 。至于每个矿工存了多少,存了哪些,那是矿工自己的事情,既不需要证明,也不需要检查。

Arweave不是通过在用户和存储提供商之间建立合同来实现的(这点与Filecoin基于合约的存储方案不同),而是通过鼓励矿工复制尽可能多的存储数据的加密经济激励措施

具体来仔细看看Arweave的技术方案:

Arweave采用一种叫访问证明 (Proof of Access) 的机制来达成共识出块,PoA可以看成是 PoW 的简单扩展。(PoA 的确可以确保矿工存储了网络数据,但矿工也可以使用远程服务器以降低成本,而服务器都是中心化的,这不可避免地有悖于去中心化理念。团队承认了这一点,并随后将共识升级成了「SPoRA」(Succinct Proofs of Random Access,随机访问的简洁证明)。)

每一轮 PoW 算随机数都跟某个过去的区块 (这里叫recall block—回忆块) 有关,只有存储了回忆块的矿工才有资格参与 PoW 算随机数。

由于回忆块是随机确定的,事先无法预测,因此矿工存储的区块越多,参与 PoW 竞猜的机会越大,获得出块奖励的可能性越高。如果矿工的存储空间有限,不能保存全部区块历史,那为了增大出块机率,他会优先保存在网络中副本数量较少的区块。因为每个块被选为回忆块的概率相等,当一个稀缺区块被选为回忆块,就只有少数矿工有资格参与 PoW 竞赛,因此存储稀缺区块对矿工更有利(这就是Arweave如何鼓励矿工尽可能多的存储数据的方式)。

到这里的话我们可能会有疑问,采用这种非强制性存储所有资料的方式,那如果恰好所有节点都没有存储某个区块,那这个区块不就永久丢失了吗?确实是这样的,这个可能性是存在的。不过,我们如果简单算一下就知道单一区块永久丢失的概率是多大?

首先说一下复制率,复制率是去中心化存储网络中矿工平均存储区块数的比例。例如网络一共出10000个块,平均每个矿工存储了 6000 个块,那么复制率就是 60%。复制率也是任选一个矿工,他拥有随机挑选的某个区块的概率。那么,随机挑选某个区块和某个矿工,这个矿工没有这个区块的概率就是是 1-复制率。当网络中有 N 个矿工节点时,所有矿工都没有某个区块的概率是*(1-复制率)^N*,那存在一个丢失区块的概率就是 (1-复制率)^N * 区块总数*。*

假设Arweave网络有 200 个矿工节点,复制率为 50%,区块总量为 200000,那么存在一个丢失区块的概率是:(1-0.5)^{200}*2000000

这个数是特别小的数了,是一个可以忽略不计的极小概率事件。

当前Arweave网络的矿工节点约为 1119 个,复制率是 95%,已出区块 81 万多个 ,存在区块丢失的概率比前面的计算结果还要低得多,在数量级上比发生私钥碰撞的概率还要小。所以从概率上来讲,整个网络中不可能存在永久丢失区块的事情发生,那也就不可能存在丢失客户存储内容的事情发生了。

Arweave协议只有一个市场,用户也只需要支付一次存储费 ,后续访问数据是免费的。能够做到这一点是因为协议采用类似于 BT 的机制设计,网络中所有节点都是平等的 (不区分矿工节点和用户节点),所有节点都尽量快速地响应其他节点的请求。跟 BT 一样,上行贡献越多,下行速度越快,自私节点会被其他节点降权,逐渐被网络排斥在外。

与 Filecoin 相比,Arweave网络有两大优势。一是成本低 ,1MB 文件在Arweave网络做几百个副本永久存储的价格,低于在 Filecoin网络上 10个副本存储 10 年的价格,而且Arweave的数据访问是永久免费的。第二,Arweave的激励机制使数据存储和访问都更加可靠,通过简洁巧妙地解决了去中心存储的最大难题,不需要复杂的证明机制和矿工的前期巨额构造数据中心的成本。

可以看出Filecoin和Arweave在构建协议的思路上采用了不同的证明机制,基于合同的Filecoin方案类似于盯人,Arweave协议则像考试。

Filecoin 要管理成千上万个不同的存储合同,检查每个合同的执行情况,分别提供奖励或执行惩罚;Arweave协议只处理一个合同,而且所有数据永久保存 。因此协议非常简洁,运行成本低,服务的价格和可靠性都优于基于合同的系统。

这一轮崛起的原因

这次NFT的浪潮带来了对去中心化存储的大量需求,但是作为去中心化存储领域老大的Filecoin似乎没有享受到这个红利,反而是此前不怎么被人熟知的Arweave被大量采用,代币价格也大幅拉升,这里面的原因是什么呢?

为 NFT 提供安全性

今年的NFT Summer带火了加密头像类资产,也给币圈自身带来了去中心化存储的需求。

我们知道这些JPEG类文件是不可能直接存储在以太坊上的(一是太贵了存不起,二是以太坊的一个区块大小也不支持存储此类文件),所以解决方案就是NFT 的智能合约通常将实际内容存储在一个简单的通证 URI 中,该 URI 指向数字对象实际所在的互联网地址。

这带来了一个问题:大多数 URI 不能保证永久性或不变性。此前很多项目就是存放在中心化的亚马逊云上面,这让很多买家望而却步,就算后来移植到 IPFS上面但也不能保证永久性存储和访问的问题。鉴于这些问题变得日益突出,此后的艺术家和创作者越来越多地使用 Arweave 的 NFT 存储平台,第一个吃螃蟹的名人是著名 NFT 艺术家 Beeple 和嘻哈巨星 Jay-Z。

这个 NFT 的持久性评分被列为优秀。这一 NFT 相关的元数据质量高于当前的行业标准。元数据存储在智能合约中,并符合所有 NFT 平台所采用的以太坊改进提案 (EIP) 中的所有标准,与这一 NFT 相关的媒体数据存储在最强大的分散式文件存储系统 Arweave 上。
——苏富比拍卖行对 Jay-Z 首个 NFT Heir to the Throne 的鉴定报告

Solana等公链将区块数据存放在Arweave中

通过Solar Bridge,Solana节点验证器将实现永久存储。即,一旦交易被验证,数据将被永久存储在Arweave上,保证这些珍贵的交易数据永不丢失。

我咨询过技术部的海哥,现在Solona每天产生的区块大小约60G,这是很夸张的,一年就是21T的区块数据,所以Solana对去中心化的永久存储有很大的需求,抗审查性,永久性和去中心化程度,加之Arweave后续免费访问特性,所以Solana最后选择了Arweave作为其重要的区块数据的永久存储之地。

Arweave 已经与Solana、Cosmos、Polkadot、Avalanche、NEAR 、Skale和Graph合作,允许任何人更有效地访问存档的区块链数据。

网站前端用户界面可永久存放在Arweave中

DeFi 的爆炸性增长让整个币圈的去中心化程度上了一个台阶,然而这些平台已然面临着一个隐藏的中心化风险:前端用户界面。政府和云提供商仍然有能力停止和审查 Dapp。

今年 7 月,Uniswap 出于对美国监管的担忧,从其前端移除了代币化股票。用户界面下的智能合约仍然存在,开发人员只是希望将其隐藏起来。作为回应,用户在 Arweave 上上传了 Uniswap 之前的 UI,允许用户访问审查之前存在的 Uniswap。其他平台,如Sushi、Compound和1inch也可在永久网上(PermaWeb)使用,最大限度地减少审查的威胁。

可以看看这一年的AR基本面总览:

AR、Filecoin和Sia数据面对比:

投资方

有三个顶级风投机构:a16z、Multicoin和Coinbase

Arweave 早期投资人有 1kxTechstars

2018 年 6 月,Arweave 通过 ICO 融资** 870 万**美元。

2019 年 11 月,Arweave 完成 500 万 美元融资;此轮由 a16z 领投,联合广场风投(Union Square Ventures) 和 Multicoin Capital 参投。

2020 年 3 月,Arweave 完成新一轮 830 万美元的融资,投资者包括领投 Arweave 上轮 500 万美元融资的 Andreessen Horowitz (a16z) 、联合广场风投 (Union Square Ventures) 、Coinbase Ventures。此轮融资的资金将用于扩大 Arweave 的社区生态建设。

代币经济模型

Arweave的代币是AR,总量6600万枚,目前流通量5000万左右。

主要分为:融资31.4%,团队 13%,战略合作7.1%,顾问2.9%,生态建设19.1%,保留26.5%。

其中生态建设部分主要是激励矿工的代币奖励,奖励的总量是1100万枚。规则是每年减半,第一年AR发行总数为550万枚,第二年开始即每年进行减半,第二年增发275万枚,第三年增发137.5万枚,以此类推,维持6600万枚总量不变。

到目前为止,已经进行了三次减半,2021年这个减半周期里AR计划增发68.75万枚。

那么AR的通胀率可以算一下,68.75/(5000+68.75)= 1.35%,从代币通胀率来讲,已经低于这个减半周期的BTC,且此后的通胀率还将由于继续每年减半而降低,对整个生态都有积极的意义。

AR目前价格60美元附近,流通市值30亿美元,FDV大概40亿美元左右,排名65位。

公链的特性

我们习惯了Arweave和Filecoin等协议作为一个存储工具的存在,各方面来讲,把他们当作对智能合约平台公链的补充,毕竟在 Web3.0 协议栈中,它们处在不同的层级,但是当我们再看深一点之后可以发现Arweave的更多可能性。

在底层的Arweave网络之上,项目方还构造了一个应用层,被称为PermaWeb(永存网)。

第三方项目开发者可以在其上创造自己的Dapp让用户使用,从而形成一个应用平台。

其他特性和智能合约平台的运行方式类似,但是与以太坊 (以及其他公链) 的智能合约有一点不同,Arweave的智能合约不是由矿工节点在链上执行,而是下载到合约调用者的计算机里链下执行

执行的过程是从合约的创世状态开始,按确定的顺序执行合约历史上的全部交易,最后执行合约调用者的交易。完成后,合约调用者将自己交易的输入和执行后的合约状态提交到Arweave网络,进入PermaWeb存储,后续的合约调用重复以上过程。

这就与目前主流的智能合约公链很不一样,现在的主流智能合约公链都是将数据在链上计算,而这就带来了扩展性的不足和高昂的gas war,Arweave这种将计算放在链上的架构可以将扩展性提高的同时,也大大降低手续费。

也就是说,对于一笔智能合约交易,Arweave网络只需调用者自己的节点来执行。由于调用者节点执行 (同时验证了) 了合约历史上的全部交易(这些都是链上数据),因此他无需信任或依赖任何节点,就能得到**可信的计算结果 **。

这种方式其实同Rollup的L2执行计算有点相似,这一设计使得 DApp 业务逻辑层的可扩展性 / 计算成本难题迎刃而解;智能合约几乎可以不受限制地包含任何复杂计算,只需付出很低的成本就可以完成web3时代所需的大量计算。

作为 Arweave 应用平台,PermaWeb 对于开发者构建顶层应用依然有区块链的原生优势,如永久数据存储、数据可用性、数据完整性、抗审查性、可访问性、防篡改性等。

所以基于此,Arweave也在形成自己的公链生态。

  • ArDrive – 永久存储的去中心化百度云
  • Weave Mail – 永久存储邮箱软件
  • Koi.rocks – 看展可以获得奖励的虚拟NFT画廊
  • Pianity – 音乐 NFT 平台

Arweave 真正的价值会在 Web3.0 时代爆发

除了图像 NFT 项目外,Mirror (将文本文章作为 NFT)媒体平台也将其文件托管在 Arweave 上。由于 Arweave 具有独特的优势,可以提供去中心化的永久性和不变性,预计将在下一轮 NFT 和创作者经济爆发式成长中继续见证 Arweave 采用率的高速增长。

再联想到今天链闻(ChainNews)宣布彻底关停,令人唏嘘又无奈,希望在下个周期,这类事件会因为crypto世界各个领域基础设施的完备而不再出现。

所以以上总总,我认为Arweave会是一个基础设施级别的大协议,他的真正价值一定会体现出来。

下一个周期的主题中,毫无疑问Web3是一个会让所有人瞳孔放大的赛道;而在这儿其中,属于我们币圈人自己的原生加密社交项目绝对是一个天王级的。

在Web2时代,我们就见识了社交网络因其独一无二的强大网络效应成为互联网行业里的皇冠,这里面孕育出了Facebook和腾讯这样的巨无霸企业,市值都在万亿美元级别;更别说Line、Twitter、微博、电报、Discord这类百亿千亿级的社交项目。

所以,当Crypto遇上社交会诞生出怎样的交互方式,演化出怎样的商业模型,一直是这个圈子里的资本和大佬们思考和追求的。

当我最近看资料时发现一个点,去中心化的社交平台可能很难搭建在现有的智能合约平台公链上。

主要问题就是链上存储成本,Deso给出了一个目前在链上存储1G空间主流公链的成本对比:

可以看出现在主流公链是绝对不可能承载社交平台每天那么大数据量的(或者说让这些社交数据都上链),因为本质上来说,目前区块链的架构也不是专门为社交平台而打造的。

这里面有一个变化,重要的变化,我们来看一下。

目前,市场上所有的公链架构都是为了支持我们所谓的有限状态应用程序。在这些应用程序中,项目方必须保证每个用户保留手头的数据或状态量是有限的。例如,为了构建一个金融应用程序,为了验证交易,真正需要知道的只是每个用户的账户余额。用户可以在彼此之间转移数百万次资金,但最终需要存储的只是几个表示每个用户最终余额的数字。

目前区块链的大部分应用,比如 DeFi类,都由有限状态应用程序组成。只需存储少量账户余额,项目方就可以开始构建任意复杂的工具供用户进行抵押、交易、借贷等操作,这意味着他们只是修改现有余额而不是将新数据附加到状态上。

问题来了,随着区块链世界继续往更深的地方进发,我们希望颠覆金融领域以外的应用程序,这时候开始就要面临处理完全不同类别的应用程序(媒体、社交、各种平台类商业),而他们是无限状态应用程序

例如,考虑一个典型的社交应用程序。用户可以创建个人资料,点赞,发布文字、图片、视频,关注人,转发等...... 不同之处在于社交应用程序,所有交易都是状态膨胀的而不是像 DeFi 那样是有限状态的。

由于以上商业形态在未来web3世界中是大规模存在的,这个巨大的变化这就给了以存储立足的公链一个机会,他们在打造无限状态类应用程序方面相对与以计算立足的现有公链有天然的优势。

这可能是未来Arweave、ICP、Deso这类新范式的公链们一个崛起的机会,这是值得我们持续跟踪并在下一个周期布局的赛道。

Subscribe to W3.Hitchhiker
Receive the latest updates directly to your inbox.
Verification
This entry has been permanently stored onchain and signed by its creator.