以太坊價格 以太坊價格
Ctrl+D 以太坊價格
ads
首頁 > FIL幣 > Info

BLOCK:ArcBlock 博客 | 區塊鏈和數據庫:致虛極,守靜篤

Author:

Time:1900/1/1 0:00:00

作者:陳天

前言:為紀念中本聰發表比特幣白皮書10周年,ArcBlock研發副總裁陳天特撰此文闡述他對區塊鏈與數據庫的關系的獨特觀察和思考。

10月31日,陳天發朋友圈感慨自己投身區塊鏈創業“半年過去了,無數打了雞血的三點鐘群已經悄無聲息,一票在泡沫里仰泳的投機者消失了,而我,像鉆進了兔子洞的愛麗絲,徜徉在這個奇妙的世界里……”

如果說牛頓的經典物理是愛因斯坦相對論在低速環境下的一種體現的話,我們所熟知的數據庫技術,可以認為是區塊鏈技術在弱分布式環境下的一個特例。

「弱分布式」環境是我胡扯的一個詞,你可以將其理解為節點數量極其有限,運行環境高度可控的一種分布式環境。一個數據庫集群運行在同一數據中心,或者不同數據中心,只要是同一個管理者,那么這就是可控的運行環境。在可控的運行環境下,默認不存在「作惡」的節點,也就無所謂BFT,因此我們不需要復雜的共識算法,一般兩階段提交或者paxos/raft就能收斂共識,滿足需要。所以,數據庫的共識算法是區塊鏈共識算法的特例。

在區塊鏈的世界里,交易和交易產生的狀態是嚴格分離的。若干交易由被共識算法選擇出來的礦工驗證并打包成為區塊并廣播出去,然后網絡里其他參與者驗證區塊中每個交易的合法性,并寫入自己的statedb。在bitcoin里,statedb是UTXO,在ethereum里,則是其worldstate。

數據庫的世界里仿佛沒有類似于區塊鏈的交易記錄,但仔細想想,它的交易歷史其實就是WAL。從外界接收到的請求,數據庫會先將其寫入WAL,確保其進入持久化存儲,才會往它自己的“states”里面寫入。從這個角度,我們可以認為WAL里的每一個記錄,就對應區塊鏈里的一個交易,它是區塊鏈交易的特例。

Zacks Investment Research ETF研究主管:其他發行方會很快加入現貨以太坊ETF競爭:金色財經報道,Zacks Investment Research ETF 研究主管Neena Mishra表示,她對未來幾周內以太幣現貨 ETF 的申請不會感到驚訝。 Mishra說:“如果一個發行方開始這一過程,其他發行方會很快加入競爭,不想被拋在后面”。

然而,CoinShares產品主管Townsend Lansing在6月份表示,如果基金發行方尋求現貨以太坊ETF,美國證券交易委員會可能會拒絕。[2023/9/7 13:22:50]

如果你再認真思考一下,WAL,blockchain,以及MartinFowler很早就提倡的CQRS在這個層面上其實都是「一中各表」:大家都強調「事件」和「狀態」的分離,通過前一個狀態+當前事件,可以推演出當前狀態。這樣,我們只要有一個初始的「狀態」,然后記錄系統發生過的所有的「事件」,就可以復原任意一個時刻的「狀態」。

我們回到交易和容納交易的「區塊」。你會發現,「區塊」是一個怪怪的存在,為什么數據庫不需要「區塊」這樣的概念作為容器裝載「交易」,而區塊鏈卻需要呢?我們知道,在區塊鏈的世界里,不確定性和確定性仿佛一對孿生兄弟,確定的是規則,不確定的是規則的執行者。所謂礦工輪流做,下回到我家,那怎么定義一個「回合」呢?為了回答這個問題,我們需要某種機制明確一個回合礦工地位的起止——這個起止就是一個「區塊」。不僅如此,在一個物理時鐘并不一致的分布式環境下,「區塊」還承載著全局時鐘的功能,滴答滴答將整個網絡往前推進。「區塊」的概念是如此重要,以至于它當仁不讓地成為共識算法的基礎——大家先得對下一個要出的區塊序號達成共識,否則這個游戲無法進行。反觀數據庫系統,在一個數據庫集群中,master是固定的,master令旗一揮,slave就迅速跟進,指哪打哪,不存在輪流坐莊,也就無所謂回合,所以其實每個「交易」就是一個「區塊」。所以在數據庫的世界里,邏輯上每個交易,或者說WAL的每個記錄,自成一個隱性的「區塊」。

Archimedes:暫未受Curve池漏洞直接影響,正重新評估發布策略:8月1日消息,DeFi借貸市場Archimedes發推表示,使用舊版本Vyper編譯器的Curve池受到可重入漏洞的影響,影響了Archimedes的兩個v2合作伙伴AlchemixFi、MetronomeDAO,但對Archimedes及用戶沒有直接影響,Archimedes正在重新評估發布策略,并權衡單一流動性池策略的所有選項。[2023/8/1 16:10:43]

我們從另一個角度來探討這個結論。「區塊」的另一個重要的作用是crashrecovery。在一個區塊鏈網路中,某個節點無論是斷網還是崩潰,其狀態和網絡中達成共識的狀態必不一致,那么,如何從這種不一致的狀態恢復同步的狀態呢?答案是「區塊」,因為它是唯一明確的共識的產物。節點總是能夠找到最近的commit的和網絡中一致的區塊高度,然后從這個高度往后一個區塊一個區塊同步,依次運行區塊中包含的所有交易并更新本地的狀態,最終可以保證和網絡中的狀態達成一致。在這里,「區塊」就是檢測和達成狀態一致的最小單元。而在數據庫系統中,在崩潰發生后,系統會從其他節點同步最新的WAL,并從上次commit的WAL的位置往后一個記錄一個記錄執行命令,直到所有記錄運行完畢,這時數據庫狀態恢復到集群的當前狀態。在這里,WAL的記錄是檢測和達成一致的最小單元,所以我們稱其為隱性的「區塊」,沒毛病。

在區塊鏈的世界里,一筆交易需要被驗證。這里的驗證有兩重含義:1)身份驗證——交易是由其發起人正確簽名的;2)完整性驗證——交易對狀態的變更是合法的。身份驗證好理解,你用自己錢包的私鑰簽名給我轉1個ABT的交易,系統會驗證你的確是你;完整性驗證則是指在statesdb里,你的賬號下的確有超過1個ABT的token,才能發起這個交易。在數據庫的世界里,身份驗證直接赤果果用諸如RBAC的訪問控制系統解決了,而完整性驗證和區塊鏈類似。

Alameda Research相關錢包向匿名地址轉入逾2600萬枚USDC:5月16日消息,據Watchers監測,北京時間23:37:11,Alameda Research相關錢包向0xb1開頭匿名地址轉入26141526.6992枚USDC,價值26,141,526美元。[2023/5/16 15:06:42]

接下來我們看看確定性。所謂確定性,就是在同一個狀態Sn-1下,大家拿著同樣一筆交易,不依賴任何第三方信息獨立執行,執行的結果完全一致。這一點僅就純粹的從交易到statesdb的處理來說,區塊鏈和數據庫是完全一致的,大家都能保證確定性。然而,如果某個區塊鏈要支持交易中攜帶額外信息,這些信息觸發某些鏈上部署好的代碼的執行,那么,我們就得注意代碼本身需要具備確定性。所謂確定性,無非是:

代碼中不要使用不確定的隨機數生成器——比如使用計算機的時鐘作為種子生成隨機數,這就是不確定的。因為交易在被執行的那一刻,我們無法保證所有參與者的時鐘是精確同步的。

代碼避免使用多線程。多線程引發的racecondition具有不確定性。

不要使用系統時鐘。不解釋。

不要使用未初始化的內存。鬼知道上面是陳冠希還是諸子百家。

不要使用浮點數——這個很奇葩,因為不同的CPUarch,編譯器,甚至不同CPU型號間,由于支持的浮點數指令集不同,會導致結果不同。

不要使用編程語言的可能有隨機行為的數據結構。比如遍歷一個map

Valour宣布前21Shares董事總經理Marco Infuso擔任首席銷售官:金色財經報道,瑞士的數字資產ETP發行方Valour宣布前21Shares 董事總經理Marco Infuso加入資產管理團隊,擔任首席銷售官(CSO),領導交易所交易產品 (ETP) 的全球銷售。

據悉,Infuso先生通過獲得認證加密金融專家 (CCFE) 加深了對區塊鏈和加密貨幣的知識,CCFE 是金融行業領先的瑞士加密和區塊鏈頭銜。

今年 1 月,Valor通過投資SEBA銀行的 C 系列融資以及與 SEBA 銀行簽訂了優先合作協議。[2022/7/5 1:52:38]

基本上避免了這些,代碼就具備了確定性,可以在區塊鏈上執行。那么,為什么數據庫中的存儲過程可以允許沒有確定性的代碼的執行?比如,一個存儲過程里可以使用當前時間插入一條記錄?我們如果再回歸本源,從「交易」的角度看待問題,可以發現,存儲過程類似于“off-chain”執行的代碼,它雖然植根于數據庫之中,但其實是「交易」的源頭,存儲過程的執行產生真正的交易,也就是WAL記錄,然后同步給其它節點。所以存儲過程可以non-deterministic,因為其產生的WAL記錄已經是deterministic的——添加一條帶當前時間的記錄這件事情,在master執行時,已經將取「當前時間」這個動作完成并得到一個確定的值,攜帶于WAL之中。這跟區塊鏈的smartcontract的概念有本質的區別,這也是為什么存儲過程可以不必具備確定性,而“on-chain”執行的smartcontract需要確定性。從這個角度來講,數據庫系統也是一個弱化的區塊鏈系統。

聲音 | Arca的首席投資官:比特幣不是“避風港”:金色財經報道,加密公司Arca的首席投資官Jeff Dorman表示,將比特幣視為潛在的“避風港”完全是“不負責任的”,他甚至聲稱比特幣永遠不會與黃金處于同一水平。Dorman稱,看看黃金、國債和股票是如何對全球危機立即作出反應。比特幣和數字資產不在該流程之內。[2020/2/28]

既然區塊鏈和數據庫存儲的對象都是數據,那么,提過了數據的完整性和確定性,接下來就是數據的一致性。區塊鏈顯然是最終一致性的典范——網絡越大,參與的節點越多,區塊的擴散就越慢,任何時刻在不同的節點上讀取狀態就很大幾率出現不一致的情況。然而,只要節點能同步到最新的區塊,整個網絡的狀態是收斂的,最終大家能夠得到一個一致的狀態數據。其實,按照這個道理,所有使用WAL,CQRS思想的分布式系統,其數據的狀態都是最終一致的——這似乎和我們對經典數據庫強一致性的印象不匹配。然而,如果我們把視角拉到數據庫內部,可以發現,強一致性只不過是最終一致性之上添加了一些條件,是個特例。如果我們假定一個區塊鏈滿足下面的條件:

任何節點收到新的區塊,必須在交易執行完成,寫入statesdb中之后,給礦工節點發送確認

礦工節點在收到所有確認之后廣播給網絡中所有節點這個區塊大家已經commit成功

在一個區塊沒有收到礦工節點的上述廣播之前,客戶端發送來的查詢進入隊列排隊

那么在外界看來,它也是強一致性。當然,第三點有些過于苛刻,一般的數據庫實現都會采用MVCC,讓每個client看到當前狀態的一個snapshot,因而存在一個很小的窗口,大家看到的數據是不一致的。如果較真,MVCC不算強一致性,當然沒人會這么認為。

通過上面的規則,數據庫可以通過犧牲一些性能來打造對外而言的強一致性。但有時候,為了一些崇(wo)高(chuo)的理想,數據庫系統也可以打破這些規則來號稱更高的性能。mongdb可以在cluster的環境下,寫操作不需要節點確認即可返回,于是有了美其名曰的,如薛定諤的貓一般的「弱一致性」。

一個區塊鏈網絡理論上可以通過上述規則把自己營造成對外強一致性的感覺,但這實際上沒有可操作性。能力越大,責任越大網絡越大,延遲越大,所以,實際可操作的強一致性只能發生在節點數量很少,且節點都在同一個datacenter的環境下。從數據一致性的角度來說,數據庫也是區塊鏈在特殊場景下的一個特例。

最后說說性能。性能這事,和網絡規模成反比。兩個主要原因:1)節點越多,達成共識的難度就越大。2)節點越多,「交易」在網絡中傳播所需的時間就越長。那想要達到宇宙無敵的TPS怎么辦?其實不難——既然數據庫是一個弱分布式環境下的特例,那么,咱就把區塊鏈往數據庫的方向退化就好。PoW說「王侯將相,寧有種乎」,讓全網參與鐵王座的競爭,PoS就讓「一小部分人先富起來」,DPoS再進一步,「讓領導先走」,也許不久的將來,有人會則憋出終極大招,全網就一個九五之尊,把數據庫里能用的招數,replicaSet,Sharding等等統統用上,再使用兵法中不戰而屈人之兵之術:「今治水軍八十萬眾,方與將軍會獵于吳」…于是,可以名正言順地搶下性能的桂冠。

只不過…就像非誠勿擾里車曉問葛優:那事兒,就那么有意思嗎?

ArcBlockTechnicalLearningSeries第七期

Tendermint:ConsensusMadeEasy

下周三,11月7日下周三上午8時,由ArcBlock研發副總裁陳天授課,介紹Tendermint及其架構,共識算法如何工作,以及如何復制應用程序數據。

主講

陳天

ArcBlock研發副總裁

●前舊金山創業公司TubiTV研發副總裁,比圖科技(TubiTV中國全資子公司)總經理,創建中國團隊,并領導TubiTV研發團隊在過去兩年半時間幫助業務成長數十倍

●前JuniperNetworksTechLead&Sr.StaffEngineer

●2011-2013曾在北京創立在線旅游創業公司途客圈,獲創新工場和金沙江投資,在結束途客圈的創業生涯后,將創業經歷撰寫成《途客圈創業記》一書,由人郵出版社出版。

●技術愛好者,涉獵網絡安全,云計算,分布式系統和區塊鏈。主力語言:elixir,nodejs和python。github:tyrchen。

●公眾號「程序人生」(programmer_life)作者,知乎專欄「迷思」作者。自2014年以來,撰寫技術文章近四百篇,很多文章被知乎日報推薦。

報名聽課,登錄官網注冊:

https://hack.arcblock.io/learning/

或登陸掘金注冊:

https://juejin.im/events/all

或掃描二維碼注冊:

ArcBlock課堂①|IntrotoGraphQLandAbsinthe

ArcBlock課堂②|IntrotoEthereumSmartContract

ArcBlock課堂③|IntrotoAWSDataPipelineServices

ArcBlock課堂④|IntrotoAWSAthena

ArcBlock課堂⑤|WhatisAWSKinesis

ArcBlock課堂⑥|多步驗證那些事

ArcBlock課堂⑦|IntrotoCQRSandCommanded

Tags:區塊鏈ARCBLOCKBLOC區塊鏈的未來發展前景論文ARCHIEblockWRKbloc幣幣幣情

FIL幣
TOKE:首屆Token Hunt告一段落,下一場醞釀在即

TokenHunt是一個面向全球的線下尋幣活動,于2018年8月27日由CyberVein發起,活動為期一個月。參與者至少完成5項CyberVein社交任務,經核實后方能成功報名.

1900/1/1 0:00:00
Kucoin:風險披露聲明

Thispostisalsoavailablein:English(英語)在使用我方服務進行交易或交易活動之前,貴方極有必要了解其中風險.

1900/1/1 0:00:00
XTR:采訪“僵尸戰場”游戲總監Roy Shapira?—?— 第二節:僵尸技能大解密

RoyShapira是“僵尸戰場”的游戲總監。他接受了社區活躍成員Extranji的采訪,談論了為游戲創造每張新卡牌的過程。這是我們將要發布的系列采訪的第二節.

1900/1/1 0:00:00
GON:DragonEx上線創新區 ZIB/ETH 交易對

DragonEx上線創新區ZIB/ETH交易對 2018-11-07 親愛的用戶: DragonEx將于新加坡時間2018年11月7日下午16:00上線創新區ZIB/ETH交易對.

1900/1/1 0:00:00
ETH:ETH充值賽 贏50倍充值獎勵

ETH充值賽,贏50倍充值獎勵!活動時間:香港時間2018年11月13日15:00-2018年11月20日15:00 活動規則: 1.活動期間,充值至少1ETH,并于活動結束時保持至少1ETH.

1900/1/1 0:00:00
ITL:創意拼圖活動得獎作品分享!

獲獎作品即將揭曉! Kyber已經接收到了各位的熱情~其中有很多腦洞大開的創意,感謝這次每一位來投稿的參賽者.

1900/1/1 0:00:00
ads