編按:本文為QuarkChain創始人兼CEO周期博士撰寫的技術文章,并以此文章為基礎,在DAppLearning進行了技術分享講座。
背景
DeFi、GameFi等去中心化應用的蓬勃發展,極大地增加了對低交易費用的高性能區塊鏈的需求。然而,構建高性能區塊鏈的一個關鍵挑戰是存儲爆炸。下圖是取自Etherscan的圖表,它說明了一個以太坊全節點的區塊鏈數據大小。
從圖中我們可以看出,節點的鏈數據規模穩步增長,現在已經達到~9TB。由于去中心化區塊鏈的一個目標是允許普通配置的計算機運行節點,因此在普通配置的計算機上強制要求9TB+存儲會難以達到。
分解存儲開銷
如果我們進一步分析存儲使用情況,我們可以發現區塊數據只占了約300GB的數據,這一數字遠小于9TB。那么剩下的8.7TB數據從何而來呢?
實際上,存檔節點執行所有塊并保留所有歷史數據,包括:
以太坊Layer2.上總鎖倉量為61.90億美元:金色財經報道,L2BEAT數據顯示,截至目前,以太坊Layer2上總鎖倉量為61.90億美元,近7日跌0.90%。其中鎖倉量最高的 為擴容方案Arbitrum One, 約33.60億美元,占比54.29%,其次是Optimism,鎖倉量18.77億美元,占比30.32%。[2023/3/5 12:43:02]
區塊
狀態
交易收據
這其中,狀態是這8.7TB的主要組成部分。所以有時,我們將存儲爆炸稱為“狀態爆炸”。但是為什狀態會如此之大?
什么是以太坊狀態?
以太坊狀態是一個MerklePatrica樹,其中
葉子節點是地址(0x...)=>帳戶的映射,其中帳戶存儲與地址關聯的余額、nonce等
內部節點維護樹結構,以便可以快速計算整個樹的哈希根
由于存檔節點將保留所有區塊的所有歷史狀態,這意味著MPT中的任何更新都將創建O(log(N))個內部節點,并且不會刪除舊的內部節點。
以太坊未確認交易為101,217筆:金色財經消息,據OKLink數據顯示,以太坊未確認交易101,217筆,當前全網算力為247.74TH/s,全網難度為3.32P,當前持幣地址為48,496,067個,同比增加170,361個,24h鏈上交易量為3,024,862.01ETH,當前平均出塊時間為12s。[2020/10/13]
Geth的全節點
為了解決存檔節點狀態爆炸的問題,Geth的天才工程師們創建了一種稱為“修剪”模式的新模式,該模式僅定期存儲MPT。這里我們舉一個簡化的例子,其中節點只保存每3個區塊的MPT。。
通過定期存儲MPT,狀態的存儲大小顯著減少。據Etherscan數據,目前Geth全節點的區塊鏈數據大小約為1TB。
Geth的可快速同步的全節點
Circle向以太坊網絡新增發1,938萬枚USDC:據DAppTotal.com穩定幣專題頁面數據顯示:09月20日16時59分 ,USDC發行方Circle向以太坊網絡新增發1筆價值1,938萬美元的USDC, 塊高度為:10898247,交易哈希值為:0x27cfd3325c44de71df51613b6a0d36d53a938ca8a566c6e9a58634c8f62b3946 。截至目前,Circle在以太坊網絡上的ERC20 USDC總發行量已達2,303,051,239枚。DAppTotal在此敬請廣大投資者警惕行情變動,謹慎應對市場風險。[2020/9/20]
通過從創世區塊開始重放所有交易來運行節點的一個問題是,重放所有交易會占用很長時間。一般來說,建立這樣一個節點需要數周時間才能從創世區塊趕上網絡的最新狀態。為了加速節點的啟動過程,Geth進一步提供了一種快速同步模式,可以下載最新的穩定區塊的MPT,而無需重放和維護區塊之前的歷史MPT。下載完MPT后,它會像全節點一樣重放新區塊。
在不存儲歷史MPT的情況下,一個Geth節點的存儲大小可以進一步減少到447G。通過減去300GB的區塊數據,我們推斷狀態大小約為150GB。
分析 | 以太坊基本面維穩 ERC20代幣對以太坊市值占比呈下滑趨勢:據TokenGazer數據分析顯示,截止至7月31日11時,以太坊價格為$211.58,總市值為$22,669.92M,主流交易所交易量約為$130.51M,環比昨日有一定回升;以太坊對比特幣匯率近階段保持穩定;基本面方面,以太坊鏈上交易量近期波動較大,目前有一定上行趨勢,活躍地址數、算力、鏈上DApp交易量保持穩定;以太坊30天開發者指數約為2.36;以太坊與BTC的關聯度緩慢下滑,仍處主流幣種與比特幣關聯度中的首位;以太坊30天ROI 年內低位小幅波動;ERC20代幣總市值約為以太坊總市值的67.10%,呈下滑趨勢。[2019/7/31]
問題
以目前以太坊447GB的存儲大小和15TPS,我們預計具有1TBSSD的普通配置計算機應該能夠運行以太坊節點相當長的一段時間。那么存儲爆炸或狀態爆炸真的存在嗎?或許未來幾年以太坊并不會,但假如我們可以將以太坊的虛擬機(EVM)擴展到數百或數千TPS呢?
讓我們將目光轉向另一個基于EVM的鏈,幣安智能鏈。截至2021年12月8日,BSC已有:
約984GB鏈上數據,其中區塊約占550GB,狀態約占400GB。
20.6623億筆交易,100TPS
如果我們進一步用交易數量來預測數據大小,我們可以得到:
金色財經數據播報 比特幣以太坊未確認筆數大幅降低:根據BTC.com數據顯示,目前比特幣未確認筆數為3484筆,目前相對平緩,未出現過于擁堵的現象。而根據etherscan數據顯示,以太坊當前未確認筆數為12004筆,今日最高峰達到26266筆未確認,目前未確認筆數走勢較為平穩。[2018/3/26]
如果TPS為100,即~3,153MTPY
1年后,總TX~5,219M,區塊~1.375TB,狀態~1.085TB
3年后,總TX~11,525M,區塊~3.025TB,狀態~2.387TB
如果TPS為150,即~4,730MTPY
1年后,總TX~6,796M,區塊~1.809TB,狀態~1.427TB
3年后,總TX~16,256M,區塊~4.327TB,狀態~3.414TB
綜上所述,對于BSC來說,如果保持目前的速度甚至更高,則很快就會達到以太坊存檔節點相同的存儲大小,這是普通計算機幾乎無法運行的。
具有極高TPS區塊鏈的存儲爆炸問題
如果我們對一個極高TPS的區塊鏈做一個更大膽的假設,這個數字會變成多少?我們來考慮一個具有1000TPS的區塊鏈并分析其區塊和狀態大小,將是:
假設tx大小約為100字節,每年區塊所需的存儲量為1000(TPS)*100*365*24*3600=2.86TB
假設MPT有100億賬戶,我們預計狀態大小將為150G/0.18B*10B=8.3TB
將這些數字放在一起,我們很容易得出一個結論,這是大多數普通配置計算機將無法承受的要求!
優化
為了優化存儲成本,我們必須將限制放寬為兼容EVM而不是兼容以太坊。即,我們必須構建/運行另一個支持EVM的鏈,而不是高度優化的以太坊客戶端。
狀態存儲優化
我們提出的第一個優化是使用普通的KV而不是MPT。當MPT很大時,MPT中的所有內部節點可能非常昂貴。而我們的優化將去掉MPT中的所有內部節點。假設每個賬戶的數據大約是50字節,我們可以節省下100億賬戶的數據為:
~10B*50+100GB=600GB,大約是MPT版本的1/10!
雖然使用普通KV會帶來巨大的好處,但一個主要問題是我們無法在如此短的區塊間隔內計算每個區塊的狀態后哈希,這意味著我們將失去以太坊的以下好處:
快速同步:下載任何區塊的狀態并通過重放剩余的區塊來快速同步網絡
分叉檢測:來自對等方新創建的區塊是否會導致與本地執行區塊的狀態不同。
為了啟用快速同步,我們有一個周期性的快照區塊。一個快照區塊包含前狀態哈希這一附加信息,即前一個快照區塊的后狀態哈希:
非快照區塊不維護狀態哈希,而是具有增量哈希,其中包含該區塊的所有交易事務的原始數據庫操作的哈希。這使得分叉檢測成為可能!
我們使用交易前狀態哈希來代替以太坊中區塊的交易后狀態哈希。原因是節點不能立即計算狀交易后的狀態哈希,但是通過使用交易前狀態哈希,節點可以使用整個epoch間隔來計算哈希。例如,假設狀態哈希計算每秒處理10M的狀態數據,那么計算600GB的整個狀態將需要600GB/10M~16.67小時
計算狀態前哈希的流程如下:
1.當一個快照區塊被接收并最終確定時,它的KV狀態被快照,并創建一個后臺線程來迭代所有KV條目并計算哈希。
2.當下一個快照區塊被創建時,計算出的狀態前哈希值將存儲在該區塊中。同樣,節點將創建KV的另一個快照并在后臺計算其哈希。
3.當下一個快照區塊被創建時,節點除了存儲狀態前哈希之外,節點現在可以釋放快照區塊的KV快照,這意味著來自快照區塊以來所有被刪除/更新的數據將被自動垃圾回收
其結果意味著,要存儲狀態,節點只需要最多兩個KV快照。
區塊存儲優化
使用快照區塊,我們可以通過僅存儲以下數據來進一步減少節點中所需的區塊數據:
最新的快照區塊的交易執行前狀態快照,即快照區塊的交易執行后狀態
快照區塊之后的完整區塊
我們可以對存儲成本進行簡單的數學計算:假設epoch持續時間為2周,則區塊重放大小為
2*14*24*3600*100*1000=224GB!
而且,這里的數字不會隨著時間的推移而增長!
總結
我們分析了以太坊當前的存儲使用情況:
不僅是區塊,狀態存儲消耗了很多的空間
當TPS>1000時,存儲空間用量高得令人望而卻步
我們提出對區塊和狀態進行優化:
區塊大小從每年2.86TB減少到224GB
狀態大小從8.3TB減少到600GB
一臺2TB的普通配置計算機應該能滿足長時間運行節點的條件
缺點:輕節點無法驗證狀態中的一個數據
致謝
感謝dapp-learning主辦此次活動。
Tags:以太坊MPTTPSETH以太坊官網倒計時IMPT價格https://etherscan.ioEverEarn ETH
在去中心化社區中管理復雜的人類/機器學習過程這篇文章是BlockSciencexGitcoin合作的最新作品,探索了去中心化社區——GitcoinDAO中人類/機器學習女巫檢測管道的操作和治理.
1900/1/1 0:00:00在BanklessDAO,我們經常將區塊鏈技術稱為金融革命,因為智能合約創建了無需信任、無需許可的系統。但是第一個詞,不信任,真正意味著什么?首先,必須知道不信任并不是不值得信任的同義詞.
1900/1/1 0:00:00作者|Barry出品|白話區塊鏈對CereNetwork來說,2021年是意義重大的一年。在過去的一年里,CereNetwork不僅實現了由Republic領導的融資目標,而且從Polygon獲.
1900/1/1 0:00:00Polkadot生態研究院出品,必屬精品 背景 正如新聞概述的,12月5日上午,Subsocial以鎖定100,420KSM贏得Kusama的第16次插槽Auction.
1900/1/1 0:00:00撰文:Footprint分析師Helen(helen@footprint.network)日期:2021年11月11日數據信息來源:FootprintAnalytics在《元宇宙法律合規問題系列.
1900/1/1 0:00:00介紹 隨著代碼行開始取代中心化的第三方,智能合約和區塊鏈技術幫助推動了去信任基金托管的新時代。許多投資者傾向于將“代碼即法律”一詞視為完全積極的詞,但自動化技術帶來的風險不容忽視.
1900/1/1 0:00:00