以太坊协议的未来发展（第四部分）：The Verge -区块周刊BlockWeeks

原文标题：《Possible futures of the Ethereum protocol, part 4: The Verge》

撰文：Vitalik Buterin

编译：Tia，Techub News

区块链最强大的功能之一是允许任何人都可以在计算机上运行节点并验证该链是否正确。即使 95% 的节点都同意更改规则并开始根据新规则生成区块，运行全节点的每个诚实个体都有会拒绝接受该链。不属于此类阴谋集团的权益持有者会自动汇聚在一起并继续构建一条遵循旧规则的链，并且完全验证的用户将遵循该链。

这是区块链和中心化系统之间的一个关键区别。然而，如果要保持这一特性，运行一个全节点需要足够简单，这样才能确保大多数人有机会运行节点。这既适用于质押者（如果质押者没有验证链，他们实际上并没有为执行协议规则做出贡献），也适用于普通用户。如今，在笔记本电脑上运行节点已成为可能，真正做到还是很困难。The Verge 希望改变这一点，让链的完整验证成本变得更低，以至于每个手机钱包、浏览器钱包，甚至智能手表都可以成为验证节点。

The Verge，2023 年路线图

最初，「Verge」指的是将以太坊状态存储移至 Verkle tree– Verkle tree 是一种更紧凑证明的树形结构，可实现以太坊区块的无状态验证。节点可以在硬盘上不拥有任何以太坊状态（账户余额、合约代码、存储……）的情况下验证以太坊区块，但需要花费几百千字节的证明数据和几百毫秒的额外时间来验证证明。而如今 Verge 愿景已经变得更为宏大，Verge 希望实现以太坊链的最大资源效率验证，其中不仅包括无状态验证技术，还包括使用 SNARK 验证所有以太坊执行。

除了需要长期关注对整个链进行的 SNARK 验证之外，还需要考虑另一个问题，即Verkle tree 是否是最好的技术。Verkle tree 容易受到量子计算机的攻击，因此如果我们用 Verkle tree 替换当前的KECCAK Merkle Patricia 树，我们以后将不得不再次替换树。Merkle 树的自然替代方案是直接使用二叉树中 Merkle 分支的STARK。从历史上看，由于开销和技术复杂性，这被认为是不可行的。然而，最近我们看到 Starkware 在笔记本电脑上使用圆形 STARK每秒证明 170 万个 Poseidon 哈希值，而且由于 GKR等技术，从中可以感觉到，更「传统」哈希值的证明时间也在迅速改善。

在过去的一年里，Verge 正变得更加开放，并且展现出了丰富的可能性。

The Verge：关键目标

无状态客户端：完全验证客户端和质押节点不需要超过几 GB 的存储空间
未来，能够实现在智能手表进行链的验证（共识和执行）。即只要下载一些数据，验证 SNARK，就可以完成。

无状态验证：Verkle 或 STARK

我们要解决什么问题？

如今，以太坊客户端需要存储数百 GB 的状态数据才能验证区块，而且这一数量每年都在增加。原始状态数据每年增加约 30 GB，各个客户端必须在其上存储一些额外数据才能有效地更新 trie。

这减少了可以运行完全验证的以太坊节点的用户数量：尽管只要有足够大的硬盘就可以随时存储多年的所有以太坊状态甚至历史记录，但人们默认购买的计算机往往只有几百 GB 的存储空间。状态大小也给首次设置节点的过程带来了很大的阻力：节点需要下载整个状态，这可能需要数小时或数天的时间。这会产生各种连锁反应。例如，它使质押者升级其质押设置变得更加困难。从技术上讲，可以在不停机的情况下做到这一点 – 启动一个新客户端，等待它同步，然后关闭旧客户端并传输密钥 – 但在实践中这一技术很复杂。

无状态验证是什么以及它是如何运行的？

无状态验证是一种允许节点在不掌握完整状态的情况下验证区块的技术。相反，每个区块都带有一个见证，其中包括 (i)区块将访问的状态中特定位置的值（例如代码、余额、存储），以及 (ii)这些值正确的加密证明。

实际上，实现无状态验证需要更改以太坊状态树结构。这是因为当前的 Merkle Patricia 树对于实现任何加密证明方案都极其不友好，尤其是在最坏的情况下。对于「原始」Merkle 分支以及将 Merkle 分支「包装」在 STARK 中的可能性都是如此。关键困难源于 MPT 的两个弱点：

它是十六叉树（即每个节点有 16 个子节点）。这意味着平均而言，大小为 N 的树中的证明有32 * (16 - 1) * log16(N) = 120 * log2(N)字节，或者在 2 (32)项树中大约有 3840 字节。使用二叉树，您只需要32 * (2 - 1) * log2(N) = 32 * log2(N)字节，或者大约 1024 字节。
代码未经过默克尔化。这意味着证明任何账户代码的访问都需要提供整个代码，最多 24000 字节。

我们可以计算的最坏情况如下：

30,000,000 gas / 2,400 ("cold" account read cost) * (5 * 480 + 24,000) = 330,000,000字节

分支成本略有下降（5 * 480而不是8 * 480），因为当分支数量较多时，分支的顶部会重复。但即便如此，这也意味着在一个 slot 内下载的数据量完全不切实际。如果我们尝试将其包装在 STARK 中，我们会遇到两个问题：（i）KECCAK 相对不利于 STARK，（ii）330 MB 的数据意味着我们必须证明对 KECCAK 轮函数的 500 万次调用，这在除最强大的消费级硬件之外的所有硬件上都太多了，即使我们可以让 STARK 证明的 KECCAK 更加高效。

如果我们只是用二叉树替换十六叉树，并且我们另外对代码进行默克尔化，那么最坏的情况大约是 14 个字节（14 是 ~2 (14 个)30,000,000 / 2,400 * 32 * (32 - 14 + 8) = 10,400,000分支的冗余位的减法，8 是块中叶子节点的证明长度）。请注意，这需要改变 gas 成本，以收取访问每个单独的代码块的费用；EIP-4762就是这样做的。10.4 MB 要好得多，但对于许多节点来说，在一个 slot 内下载的数据仍然太多。所以我们需要引入一些更强大的技术。为此，有两种领先的解决方案：Verkle tree和STARKed 二叉哈希树。

Verkle trees

Verkle tree 使用基于椭圆曲线的向量承诺来做出更短的证明。关键在于，无论树的宽度是多少，与每个父子关系相对应的证明部分只有 32 个字节。树宽度的唯一限制是，如果树太宽，证明的计算效率就会降低。以太坊提出的实现宽度为 256。

因此，证明中单个分支的大小为32 * log256(N) = 4 * log2(N)字节。因此，理论上的最大证明大小大约为30,000,000 / 2,400 * 32 * (32 - 14 + 8) / 8 = 1,300,000字节（由于状态块分布不均匀，实际计算结果略有不同，但作为初步近似值，这没问题）。

另外需要注意的是，在上述所有示例中，这种「最坏情况」并不完全是最糟糕的情况：更糟糕的情况是攻击者故意「挖掘」两个地址，使树中有一个较长的公共前缀，并从其中一个地址读取，这可以将最坏情况分支长度再延长约 2 倍。但即使有了这个警告，Verkle tree 也能让我们获得约 2.6 MB 的最坏情况证明，这与当今最坏情况的 calldata 大致相当。

我们还利用这个警告来做另一件事：我们让访问「相邻」存储变得非常便宜：要么是同一合约的许多代码块，要么是相邻的存储槽。EIP-4762提供了相邻的定义，并且相邻访问仅收取 200 gas。对于相邻访问，最坏情况下的证明大小变为30,000,000 / 200 * 32 = 4,800,800字节，这仍然大致在容差范围内。如果我们希望出于安全考虑降低此值，我们可以稍微增加相邻访问成本。

STARK 型二叉哈希树

这里的技术非常不言自明：你创建一个二叉树，取出证明区块中值所需的最大 10.4 MB 证明，并用该证明的 STARK 替换该证明。这样，证明本身就只包含要证明的数据，加上实际 STARK 的约 100-300 kB 固定开销。

这里的主要挑战是验证时间。我们可以进行与上述基本相同的计算，只是我们计算哈希值而不是字节数。10.4 MB 的区块意味着 330,000 个哈希值。如果我们加上攻击者「挖掘」树中具有较长公共前缀的地址的可能性，那么真正的最坏情况就是大约 660,000 个哈希值。因此，如果我们每秒可以验证约 200,000 个哈希值，那就没问题了。

这些数字已经在使用 Poseidon 哈希函数的消费级笔记本电脑上达到，该函数专为 STARK 友好性而设计。然而，Poseidon 相对不成熟，因此许多人还不相信它的安全性。因此，有两条现实的前进道路：

快速对 Poseidon 进行大量安全分析，并熟悉如何在 L1 上部署它
使用更「保守」的哈希函数，例如 SHA256 或 BLAKE

在撰写本文时，Starkware 的圆形 STARK 证明器在证明保守哈希函数的情况下，在消费级笔记本电脑上每秒只能证明约 10-30k 个哈希值。然而，STARK 技术正在迅速改进。即使在今天，基于 GKR 的技术也有望将其提高到约 100-200k 的范围。

除了验证区块之外的见证人的用例

除了验证区块之外，还有另外三个更高效的无状态验证关键用例：

内存池：当交易被广播时，p2p 网络中的节点需要在重新广播之前验证交易是否有效。目前，验证涉及验证签名，还涉及检查余额是否足够以及随机数是否正确。在未来（例如使用本机帐户抽象，如EIP-7701），这可能涉及运行一些 EVM 代码，这些代码会进行一些状态访问。如果节点是无状态的，则交易将需要附带证明状态对象的证明。
包含列表：这是一项拟议功能，允许（可能规模较小且不太复杂的）权益证明验证者强制下一个区块包含交易，而不管（可能规模较大且比较复杂的）区块构建者的意愿如何。这将降低强大参与者通过延迟交易来操纵区块链的能力。但是，这要求验证者有办法验证包含列表中交易的有效性。
轻客户端：如果我们希望用户通过钱包（例如 Metamask、Rainbow、Rabby……）访问区块链而不信任中心化参与者，他们需要运行轻客户端（例如Helios）。核心 Helios 模块为用户提供经过验证的状态根。但是，为了获得完全无需信任的体验，用户需要为他们进行的每个 RPC 调用提供证明（例如，对于eth_call 请求，用户需要提供调用期间访问的所有状态的证明）

所有这些用例都有一个共同点，那就是它们需要相当多的证明，但每个证明都很小。因此，STARK 证明实际上对它们来说没有意义；相反，直接使用 Merkle 分支是最现实的。Merkle 分支的另一个优点是它们是可更新的：给定一个状态对象 X 的证明，根植于区块 B，如果您收到一个带有其见证的子区块 B2，您可以更新该证明以使其根植于区块 B2。Verkle 证明本身也是可更新的。

与现有研究有哪些联系？

Verkle树：https ://vitalik.eth.limo/general/2021/06/18/verkle.html
John Kuszmaul 的原始 Verkle tree 论文：https://math.mit.edu/research/highschool/primes/materials/2018/Kuszmaul.pdf
Starkware 证明数据：https://x.com/StarkWareLtd/status/1807776563188162562
Poseidon2 论文：https://eprint.iacr.org/2023/323
Ajtai（基于格硬度的替代快速哈希函数）：https://www.wisdom.weizmann.ac.il/~oded/COL/cfh.pdf
Verkle.info：https://verkle.info/

还剩下什么要做？有哪些需要权衡？

剩下要做的主要工作是：

对 EIP-4762（无国籍 gas 成本变化）后果的更多分析
完成和测试过渡程序需要做更多工作，这是无国籍 EIP 复杂性的很大一部分
对 Poseidon、Ajtai 和其他「STARK 友好型」哈希函数的更多安全性分析
针对「保守」（或「传统」）哈希函数的超高效 STARK 协议的更多开发，例如基于Binius或GKR的想法。

我们很快就会有一个决策点，选择以下三个选项：（i）Verkle tree，（ii）STARK 友好哈希函数，以及（iii）保守哈希函数。它们的属性可以粗略地总结在下表中：

除了这些「总体数字」之外，还有其他一些重要考虑因素：

如今，Verkle tree 代码已经相当成熟。使用除 Verkle 之外的任何代码实际上都会延迟部署，很可能是一次硬分叉。这没关系，特别是如果我们无论如何都需要额外的时间来进行哈希函数分析或证明器实现，并且如果我们有其他重要功能希望更早地包含在以太坊中。
使用哈希更新状态根比使用 Verkle tree 更快。这意味着基于哈希的方法可以缩短全节点的同步时间。
Verkle tree 具有有趣的见证更新属性– Verkle tree 见证是可更新的。此属性对于内存池、包含列表和其他用例非常有用，并且还可能有助于提高实现效率：如果状态对象已更新，您甚至可以在不读取最后一级的情况下更新倒数第二级的见证。
Verkle tree 更难通过 SNARK 证明。如果我们想将证明大小一直减少到几千字节，Verkle 证明会带来一些困难。这是因为 Verkle 证明的验证引入了大量 256 位操作，这要求证明系统要么有大量开销，要么本身具有自定义内部构造，其中 256 位部分用于 Verkle 证明。这对无状态性本身来说不是问题，但会在以后带来更多困难。

如果我们希望以量子安全且合理高效的方式实现 Verkle 见证可更新性，另一种可能的途径是基于 lattice 的 Merkle 树。

如果证明系统在最坏情况下效率不够高，我们可以使用另一个「出其不意」的办法来弥补这种不足，那就是多维gas：对（i）调用数据、（ii）计算、（iii）状态访问以及可能的其他不同资源设置单独的 gas 限制。多维 gas 增加了复杂性，但作为交换，它更严格地限制了平均情况和最坏情况之间的比率。使用多维 gas ，理论上需要证明的最大分支数可能会从30,000,000 / 2400 = 12,5003000 减少到 3000。这样的话，即使是如今的 BLAKE3 也足够了，无需对 proof 进行进一步改进。

另一个「出乎意料」的提议是将状态根计算延迟到区块之后的slot。这将给我们整整 12 秒的时间来计算状态根，这意味着即使在最极端的情况下，也只有 ~60,000 哈希/秒的证明时间就足够了，这再次使我们处于 BLAKE3 的范围内，这才勉强够用。

这种方法的缺点是它会增加轻客户端延迟，不过这种技术还有更巧妙的版本，可以将延迟减少到证明生成延迟。例如，只要任何节点生成证明，就可以在网络上广播，而不必等待下一个区块。

它如何与路线图的其他部分互动？

解决无状态问题极大地提高了 solo 质押的便利性。如果能够降低 solo 质押最低余额的技术（例如 Orbit SSF 或小队质押等应用层策略）可用，这将变得更有价值。

如果同时引入 EOF，多维 gas 会变得更加容易。这是因为执行多维 gas 的一个关键复杂性在于处理不传递父调用的全部 gas 的子调用，而 EOF 只需使此类子调用非法即可使这个问题变得微不足道（并且本机帐户抽象将为当前部分 gas 子调用的主要用例提供协议内替代方案）。

另一个重要的协同作用是无状态验证和历史过期之间的协同作用。如今，客户端必须存储近 1TB 的历史数据；这些数据比状态大几倍。即使客户端是无状态的，除非我们能够减轻客户端存储历史的责任，否则几乎无存储客户端的梦想也无法实现。这方面的第一步是EIP-4444，它还意味着将历史数据存储在 torrent 或 Portal 网络中。