Robert:大家好,我RobertHackett?又回來了,為Web3witha16z?帶來新的一集。我最近與我們的一些研究人員就數據可用性采樣和Danksharding的話題進行了現場聊天——這與區塊鏈的擴展有關,同時也為更高級的區塊鏈網絡和用戶應用鋪平了道路。雖然許多討論與以太坊特別相關,但我們涉及的一些概念也適用于計算和網絡的普遍進步。
這一討論涉及到一些具體的數學問題,我們在這一集里談到了。
在你聽的時候,為了快速了解情況,你會很多次聽到“多項式承諾”。這是一種工具,有助于減少驗證復雜計算所需的數據量。而“插值”,是你將聽到的另一個術語,是一種從有限的數據點中重建數據的方法。
請務必在a16zcrypto.com/das查看本集提到的論文,以獲得更深入的解釋——也就是DAS,代表數據可用性采樣。一如既往,以下內容不屬于投資、商業、法律或稅務建議。更多重要信息請見a16z.com/disclosures,包括我們投資清單的鏈接。
Robert:好的,今天我們要討論的是數據可用性抽樣和danksharding.現在,如果你對這些東西不熟悉,不要害怕,因為我和幾位專家在這里,他們將為你分析這些東西。我們有斯坦福大學教授、著名密碼學家和a16z加密研究顧問DanBoneh,以及a16z加密的研究伙伴LeraNikolaenko.
Lera:很高興參與這期內容。謝謝你,Robert.
Dan:謝謝,Robert.很高興來到這里。
Robert:也謝謝你們。那么,如前所述,Dan和Lera最近寫了一個很好的帖子,并有一個與改進protodanksharding的方法有關的提案,這是今年晚些時候以太坊計劃的這次升級。那篇文章中有很多豐富的細節,所以我們會深入挖掘那一點。
但在我們進入所有的細節之前,我想也許我們可以先放大、后退,從更整體的圖景開始。讓我們從Dan開始。Dan將幫助我們理解今天談話的主題,數據可用性采樣。
也許我們可以,你知道,保持簡潔,讓更多的人了解,因為你或許能夠這樣做。
Dan:當然,所以在我們談論數據可用性采樣之前,也許我們可以放大一點。也許讓我們先來談談這里的總體目標。這是為以太坊擴展所做努力的一部分。
因此,擴展以太坊的方法之一是使用rollup,而rollup實際上需要在鏈上推送大量的數據。因此,rollup允許你采取,例如,100或1000個交易,并將它們作為一個單一的交易在以太坊第一層處理。然后所有與這些交易相關的數據基本上都被推送到鏈上。
因此,有必要在鏈上實際存儲相當多的數據。而問題是如何做到這一點。而這恰恰是danksharding發揮作用的地方。因此,這是一個非常美麗、美麗的想法。它來自以太坊基金會,尤其是DankradFeist.這是一個非常優雅的結構,基本上,Lera和我想概述一下這個結構是如何工作的,并有可能看一下它可能的一些選項,可以幫助它改進一點。
Lera:是的。Rollup本質上允許以太坊的執行擴展,但問題是,你如何使數據擴展?而danksharding/數據可用性抽樣基本上為以太坊增加了這個缺失的部分,使其能夠實現全面擴展。這篇文章有點相當的技術性。有些方面我們沒有探討,比如網絡,這也是很有趣的研究和寫作,但我們主要關注danksharding的密碼學方面。
Dan:實際上我甚至想補充說,如果你對這個領域感興趣,還有非常漂亮的開放性問題留給研究人員去思考。圍繞著編碼和多項式承諾有很多美麗的問題。有一些真正相當有趣的問題。如果這些問題能夠得到解決,我們最終會得到更有效的系統。
Robert:這是很好的背景補充。稍后我肯定要問你關于那些開放的潛在查詢領域的問題。但在這之前,讓我們多談談這個將釋放以太坊區塊鏈空間的建議。因此,區塊鏈基本上是這個巨大的交易記錄,從這個系統啟動的時候就開始了,到創世區塊。開發人員如何考慮釋放空間,使其獲得更大的吞吐量、可擴展性、更便宜的交易,所有這些聽起來不錯的東西,將使系統更加可用。你們實際上如何達到這個目的?要獲得這些效率的提高需要什么?
超47,000個地址領取2370萬枚ARKM代幣,價值逾1500萬美元:金色財經報道,區塊鏈分析平臺Arkham早些時候發布了ARKM代幣,并向新賞金平臺的早期參與者和Beta測試人員進行了空投,該代幣也可以通過幣安獲得。截至發稿時,已有超過47,000個地址領取了2370萬枚ARKM代幣,價值超過1500萬美元。根據Nansen的數據,代幣合約地址以及索賠合約都是當天以太坊鏈上最大的Gas消耗者之一,其中做市商Wintermute收到了大約 1500 萬個 ARKM 代幣,其中大部分被發送到幣安,其余則保留在交易地址中。[2023/7/19 11:03:52]
Lera:我認為主要的挑戰是,你不能只是要求驗證者存儲更多的數據。這不會讓你走得太遠。如果你想擴大區塊鏈的規模,將區塊的大小增加幾個數量級,你必須將你的區塊分割,并將其分散到驗證器中,以便每個驗證器只存儲區塊的一些片段。這就是糾錯和擦除編碼的想法,讓你能夠做到這一點。
因此,基本上是在不給驗證者帶來太多負擔的情況下增加塊的大小。我想說這是主要的技術困難。這正是dankshardin正在解決的問題。
Robert:你提到了擦除編碼,聽起來這是這項技術的一個關鍵部分,使其能夠發揮作用。也許你可以提供一些更多的細節。什么是擦除編碼?它是如何工作的,以及它在這種情況下是如何應用的?
Lera:當然,絕對的。所以你基本上是把一個有用戶數據的區塊擴大。你對它進行擦除編碼,把一個較小的區塊變成一個較大的區塊,而這個較大的區塊可以容忍其中的一些遺漏。因此,你可以失去該塊的某些部分。
在danksharding的情況下,你可以失去25%的區塊,但仍然能夠從你擁有的東西中重建這些缺失的部分。因此,當你把這個擴大的區塊分散給驗證者時——而驗證者因為其中一些是雜亂無章的或有問題的而倒下了——你仍然可以從這些驗證者那里重建,如果他們倒下了,失去了他們的碎片,那也沒關系,其余仍然在線和仍然誠實的驗證者可以恢復這些丟失的碎片。這就是為什么擦除編碼的特性在這里很有用,只是為了替代雜亂無章或有缺陷的驗證器。
Dan:也許我們甚至可以用一個比喻來解釋它。這就像,你知道,如果你在看Netflix的電影,并且說,你知道,Netflix的服務器正在向你的電腦發送數據包,而你正在看電影,那么想象一下,10%的數據包實際上沒有通過,你的電腦只能看到90%的數據包。
因此,通常你會開始看到各種有損的視頻和性能的下降。通過擦除編碼,發生的情況是,如果電影使用擦除編碼,即使只有90%的數據包通過,筆記本電腦也有足夠的信息來實際重建整個電影。
有趣的是,擦除編碼到處都在使用,比如沒有擦除編碼,通信網絡就無法工作。也許再次,只是另一個例子,當你有一個深空探測器,它正在發送消息回地球。有很多噪音,很多信息要么被丟棄,要么被擾亂,然而在地球上,我們能夠恢復信號,得到來自火星的那些清晰的圖像。
這實際上也是使用一種稍強的技術來完成的,稱為糾錯碼,我們不僅要丟失數據包,而且還要從數據包被扭曲、被改變價值中恢復。在區塊鏈的背景下,有趣的是,所有的數據都被簽名。所以我們實際上并不關心數據損壞,因為簽名層會檢測到數據損壞。
因此,我們真正關心的是,一個惡意節點能做的唯一事情——試圖阻止數據被重建的人——該節點能做的唯一事情是,在某種意義上,刪除構成數據的碎片。因此,我們并不關心從數據損壞中恢復的問題,因為那是由簽名來處理的。
但是,我們確實很擔心數據片斷的缺失,結果是,不管是誰試圖重建數據,都無法做到這一點。因此,這正是擦除編碼的作用,我們知道唯一可能發生的事情就是某塊數據丟失。它不可能被亂碼。因此,如果我們得到了它,我們就得到了正確的,這是因為簽名的關系。但如果它丟失了,我們必須以某種方式恢復。而這正是Lera所說的,這就是擦除編碼的想法。
你這樣做的方式基本上是你把你的原始數據——在以太坊的情況下,你會采取一個區塊,你會把它擴大一點。
實際上,你把它擴大了像四倍,以便在區塊中獲得更多的數據,所以現在數據在塊中是多余的,現在你把它分成小塊。現在你可以問每一個驗證器,“哦,你知道,你不需要存儲整個區塊——你只需要存儲這一小塊塊的數據”。
Web3錢包Magic完成5200萬美元融資,PayPal Ventures領投:金色財經報道,Web3錢包Magic宣布在PayPal Ventures領導的戰略融資中籌集5200萬美元,Cherubic、Synchrony、KX、Northzone和Volt Capital也參與其中。新一輪融資使公司的融資總額超過了8000萬美元。[2023/5/31 11:50:49]
如果有足夠的驗證器做他們的工作并存儲這些小碎片——當我們需要重建區塊時,他們將這些碎片送回給我們——如果有足夠的碎片被送回,那么我們就能夠重建整個區塊。特別是在danksharding中——再次,這是一個美麗的、漂亮的提議——恢復率是75%.因此,如果75%的驗證者作出回應,并且我們能夠恢復75%的碎片,那么我們就能夠重建整個區塊。這是一種用于danksharding的核心機制。
Robert:這真的很有用。因此,聽起來擦除編碼是這樣一種技術,它使你能夠應用一些冗余和備份,這樣你就不會失去所有的數據,這樣你仍然可以組裝它,獲得訪問它,看到它的存在。
Dan,你提到,做這種數據可用性抽樣的原因是為了防止壞人做某些事情,比如把一些數據弄走。我們在這里到底是要防備什么?
Dan:是的,接下來聊這件事很好。因此,事實上,發生的情況是,隨著這些解決以太坊上的數據問題的建議,將會有一個新的交易類型被引入。
這被稱為“blob-carrying交易”,它基本上將允許人們做的事情是嵌入blob.每個blob是128千字節。所以你把blob嵌入到區塊中。因此,通常區塊是由交易組成的,對以太坊的狀態做各種事情。所以現在,除了我們熟悉和喜愛的常規交易外,每個區塊還將有一個或幾個攜帶blob的交易,正如我所說的,每個交易將是128千字節。
現在的長期計劃,實際上也許Lera可以談談過渡到我們如何到達那里,但長期計劃是,在每個區塊中可能有相當多的數據攜帶的blob,這實際上會使區塊相當大,對嗎?我的意思是,每個blob是128千字節。
如果你把這些東西放在一起,你可能最終,實際上,你將最終得到30兆字節的區塊——要求驗證者存儲這些巨大的區塊是不合理的。今天,這些區塊只有100KB左右,所以這些將是大得多的區塊。因此,我們的想法是基本上把這些大的區塊分解成小塊。
每個驗證器,每個節點實際上都只存儲這一小塊。而現在的問題是,如果他們說他們存儲了這個區塊,但事實上他們沒有存儲,會發生什么?對嗎?那我們該怎么做呢?而這正是數據可用性抽樣的作用,這是一種非常有效的方法,可以在區塊創建時測試,事實上,每個人都收到了他們的碎片,每個人目前都有他們的碎片,而且目前區塊可以被重建,盡管它被分解成很多很多的小碎片。這些碎片被儲存起來,分布在網絡上。
Robert:在Lera接下去說之前,我只想確保我明白一些事情。所以你說今天的區塊大約是100千字節。而我們的想法是,在所有這些升級之后,它們將是30兆字節左右。擴大區塊大小的部分原因是為了適應這種新的數據類型,這種blob數據,其目的與你通常塞進區塊的東西不同,后者只是純粹的交易數據。
而這個blob數據確實與幫助這些鏈下Layer2以更短暫的方式存儲一些數據有關。我說的對嗎?
Dan:是的,我很高興你重申了這一點,因為這很重要。所以這些blob基本上會被這些rollup使用。因此,rollup必須存儲rollup的數據。
因此,今天他們所做的是將其存儲為所謂的“調用數據”,這有點昂貴,而且不是調用數據的目的。因此,相反,他們將把這些數據存儲為區塊中的blob.有趣的是,這些blob實際上不會被Ethereum的執行層使用。
它們只是作為塊中的blob被存儲。執行層將只看到這些大的區塊的哈希值。他們將不能訪問blob中的單個字節或元素,這是新的機制。因此,今天,這種存儲方式,正如我們所說的,是在調用數據中,而調用數據,對以太坊的執行層都是可用的。
因此,由于這種簡化,存儲blob數據將比調用數據便宜得多。因此,原則上來說,這樣做的目的是為了降低Layer2系統的成本。因為今天他們必須付出相當大的代價來把所有的數據存儲為呼叫數據。在未來,一旦部署了danksharding,甚至一旦部署了protodanksharding,成本就會低很多。
Voyager疑似正通過Coinbase出售資產,現仍持有6.31億美元的加密資產:2月26日消息,Lookonchain發推稱,Voyager似乎正在通過Coinbase出售資產。我們注意到,Voyager在過去3天內從Coinbase收到了1億枚USDC。而且Voyager從2月14日起幾乎每天都向Coinbase發送資產。
Voyager目前持有約6.31億美元的資產,包括172223 ETH(2.76億美元)、1.86億枚USDC、6.5萬億枚SHIB(8100萬美元)、214萬枚LINK(1580萬美元)等。[2023/2/26 12:30:15]
因此,L2系統將變得便宜得多,而且更容易使用。
Robert:這聽起來很棒。我喜歡我們正在進行關于密碼學和非常技術性的軟件的復雜對話,而我們卻一直在使用“blob”這個詞。這讓我想起了80年代的科幻電影AttackoftheBlob.但是,Lera,是的,也許你現在可以談談這個趨勢,以及我們如何從現在的位置到未來擴大區塊大小的愿景。
Lera:是的,當然。在我深入討論這個問題之前,只想對Dan所說的補充兩點意見,我想說的是,重要的是blob要過期,驗證者不給任何保證,他們會永遠存儲這些blob.現在,過期的時間大致設定為30到60天,這也是以太坊基金會正在考慮的問題。
因此,在這段時間之后,在此期間,你將有機會下載所有這些blob并將其存儲在本地。你知道,網絡將放棄它們,但對這些blob的承諾將持續存在。如果你需要,所以如果你有blob本身,你總是可以用調用數據將它們重新提供給執行層。
因此,只要你存儲了blob,你就可以通過重新提供它們來證明那些是你擁有的正確的blob,因為鏈上繼續存儲著這些blob的哈希值,即承諾。我還想提到另一件重要的事情,那就是這些blob的收費市場將是不同的。
所以會有另一個收費市場。它們的價格會有一些不同。所以以太坊會有這兩條管道。一個管道,如果它變得擁擠,你要支付更大的費用,比如說執行,如果一個數據管道變得擁擠,你要支付更大的費用來存儲數據。所以我們還不知道存儲會有多貴。直覺告訴我們,它一定比今天調用數據的成本低。但是,我們必須再次進行實驗,看看到底會便宜多少。而protodanksharding實際上是向全面danksharding邁出的一步,但它就像我們要進行的一項實驗,看看驗證器如何處理這個額外的負載,以及存儲這些數據塊的費用會有多高。
因此,在通往破譯的路上,我們要做這個實驗,用protodanksharding.在protodanksharding中,基本上你不應用任何擦除編碼或糾錯。你所做的就是添加這種特殊的交易類型,攜帶數據塊。這些數據塊會有一個過期時間,僅此而已。
所以在以太坊中,區塊大小會增加一點。所以現在,正如Dan所說,大約是100千字節。如果使用protodanksharding,它將會是大約500KB左右。因此,這不是一個很大的增長,但我們仍然要測試像所有的假設,希望能檢查出來,以太坊將繼續走向完全的danksharding.
Robert:那么Lera,你在那里說了很多東西。我想確保所有這些觀點都能被理解。你提到,blob數據會有不同的收費市場。那么,考慮這個問題的正確方式是,比如你有不同的高速公路系統,或者也許你在高速公路上有一個車道,比如你有一個E-ZPass或其他類似的東西,也許在這個HOV、E-ZPass式的車道上的人更便宜?把這種數據放在區塊鏈上,你會得到較低的費用,而那些只是普通通勤者則需要支付通行費。我知道我在這里混合了一些比喻,但我想知道這是否是一個物理類比來描述不同類型數據的收費市場的差異。
Lera:是的,我想說很難想象這個新數據的費用會比我們目前的費用高,所以假設是如果你不關心從執行層訪問這些數據的話,把你的數據放在這些blob中總是會比較便宜的。因此,就像在你的高速公路上開辟另一條車道一樣,這只會增加交通流量,但對于某些類型的交易,你會進入這條車道,對于那些數據量大的交易和執行力強的交易,你會繼續通過主車道,如果這有意義的話。
Robert:是的,確實如此。聽起來,它可以更便宜的原因之一是它有這個到期日,正如你提到的。我想你說過,目前的想法是,這個blob數據將持續30到60天,到那時,它將簡單地消失,只剩下一個痕跡——你描述那種的承諾。
Mango Markets 社區將批準 4700 萬美元與黑客的交易:金色財經報道,Mango Markets 治理論壇正在通過投票,批準為通過該協議竊取1.14億美元的黑客提供巨額漏洞賞金。根據提供的交易條款,黑客將返還大約6700萬美元的代幣,并保留剩余的 4700 萬美元作為漏洞賞金。治理投票還規定,該項目將使用國庫資金注銷任何剩余的壞賬,一旦返還部分代幣,將不再進行刑事調查。治理投票有1.19億個代幣投票贊成,460萬個反對該交易。投票已達到法定人數,這意味著投票可能會在10月15日早些時候結束時通過。?
金色財經此前報道,10月12日,Mango遭黑客攻擊,損失約1.14億美元。[2022/10/15 14:28:08]
Lera:是的,沒錯。
Dan:也許要補充一下,基本上發生的情況是,當你提交交易時,有一個收費市場,正如Lera所說,如果有大量的交易被同時提交,比如有一個大的NFT鑄幣廠,每個人都想發出交易,那么當然每筆交易的價格會立即上升。
嗯,blob數據將是一個平行的收費市場,所以估計提交blob的人比提交交易的人少。因此,希望在blob上的擁堵會更少。但原則上,這可能發生。希望不會,但有可能發生的是,突然間,由于某種原因,blob出現了巨大的擁堵,然后blob的收費市場實際上會上升。
但原則上,同樣,因為提交blob的需求比提交交易的需求少,所以希望blob的成本會比交易的成本低。
Robert:好的。這對理解也很有幫助。所以我們已經為這些更新制定了一種時間表。也許,聽的人,也許你熟悉“以太坊合并”,這發生在去年秋天,這個大的以太坊升級,基本上消除了以太坊在能源消耗方面的環境影響。而現在我們正在進入這個新的升級時期,以太坊的聯合創始人Vitalik稱之為“激增”,意思是說,突然之間,這些更新將使區塊鏈的規模比以前要強大得多。因此,這次更新的一部分,第一批更新之一,是protodanksharding.它將在今年晚些時候發生。
在這種升級和完全的danksharding之間會發生什么?兩者之間的區別是什么,我們什么時候才能得到未來完全形成的danksharding?
Lera:這是個好問題。我認為在這一過程中還有一些研究問題需要解決,特別是圍繞著網絡,因為當這些驗證器只存儲blob的片段時,它們需要互相幫助重建這些片段。如果某個驗證器沉睡了一段時間,當它醒來的時候,它希望其他驗證器能幫助它重建其丟失的片段。
因此,這是一個相當復雜的網絡協議,目前仍在制作中,而且還有其他令人興奮的研究問題,有可能改進該計劃,但我認為到目前為止,它看起來是一個相當清晰的路徑,從protodanksharding到danksharding.而問題只是也許如何使它變得更好,如何改進它的不同方面,使它更有效率。
Dan:也許值得補充的是,在protodanksharding的方法中,每個塊最多有四個blob,這就是為什么每個blob是128千字節。4乘以128得到半兆字節,這就是為什么這是protodanksharding中對塊大小的限制,而且這實際上即將發生。這應該會在今年晚些時候發生。
然后,是的,一路走到danksharding仍然需要一些工作。事實上,最近有一個非常大的事件,就是聯合生成danksharding的參數。因此,在準備實現完全的danksharding方面還有很多工作要做。
Lera:是的,那是相當令人興奮的。我想他們仍然在接受參與貢獻,以參加受信任的設置儀式。是的,所以它仍在進行。這是一個大型社區的努力,真的很有趣,人們想出了很多創造性的想法來貢獻。所以,你們得看看這個,絕對的。
Robert:那超級酷的。我實際上參加了一些早期隱私幣的可信設置儀式。這個受信任的設置儀式是否像某些人那樣浮夸,在那里你有人們燃燒筆記本電腦和爆炸的硬盤之類的東西?
Lera:就我所見,這只是人們想出了不同的創造性方法來產生熵。有些人使用他們的寵物、狗和貓。有些人正在創造一些復雜的大理石運行機器之類的東西。甚至有一個從衛星上做的貢獻,是那里的最高海拔貢獻。
Dan:實際上我們必須提到這一點。這實際上是非常酷的。這家公司Cryptosat實際上在軌道上有衛星,對太空中的噪音進行采樣,然后貢獻并參與到可信設置協議中。
Distributed Finance完成250萬美元種子輪融資,Borderless Capital領投:金色財經報道,Distributed Finance宣布獲得250萬美元的種子輪融資,并利用部分資金收購了Algorand NFT市場Rand Gallery。Borderless Capital領投本輪融資,Algorand基金會、Eterna Capital、Big Brain Holdings和Fun Fair Ventures參投。
據悉,Distributed Finance旨在促進Algorand生態系統中非同質化代幣(NFT)和去中心化自治組織(DAO)的發展。(The Block)[2022/8/24 12:44:15]
因此,看到這一點是非常酷的。
Robert:哇,這太棒了。我還不知道太空中還有加密貨幣呢。丹,你說過,“原汁原味”將在每個區塊上有四塊blob.儲值是什么功能?我們在這里討論的是多少個blob?
Dan:是的,所以順便說一下,protodanksharding每塊最多有四個blob.
他們的目標實際上是兩個,但最多是四個。然后danksharding,正如我們所說,他們的目標是最多30兆字節的區塊。因此,只要將30兆字節除以128千字節。這告訴你這是在一百個的順序上,我猜是每塊有一百個blob.
Lera:是的,我記得目前的計劃是每一個區塊有128個blob的目標,也許最多有256個blob.
Robert:聽起來很棒!
Dan:而這正是區塊變得相當大的時候。這時,驗證器要保留整個塊就變得有點困難了。這時,我們就必須開始把它們分成幾塊。每個驗證器將存儲一個片段。
Robert:我明白了。我很欣賞這種基本劃分。也許你在帖子中所涉及的一些技術性較強的數學知識在這里會有點難以表達,但這是有道理的。也許我們可以談一談你在最近的帖子中提出的一些建議。所以你做了這項研究,你發現通過一些調整,你有可能從EIP-4844?中獲得更多的效率,這是protodanksharding的技術名稱。
Lera:是的,大部分的工作只是為了全面了解danksharding的提議,然后我們觀察到一些不同的方式來研究數學——其中的加密成分——希望能解開我們可以使用的新工具包。所以大致的想法是,不要太深入,你通過你的區塊擬合一個多項式。
這是一個雙變量多項式,因為你的區塊是矩形的。然后你在更多的點上評估這個多項式,有點像擴大區塊。我們的想法是,如果你已經使用了這些雙變量多項式——而不是像danksharding所做的那樣,作為一個多變量多項式的列表——你就可以應用雙變量評估、雙變量插值的技術,甚至可能嘗試應用雙變量糾錯代碼。但這是非常開放的,可以進行更多的研究和探索。因此,在這次訪談中,我們試圖解釋在哪些方面可以做更多的研究,以改善該計劃的方向。
Dan:是的。也許我可以補充一下。我是說,danksharding是個很好的主意。真的。以太坊基金會在這方面應該得到很大的幫助。而且,你知道,特別是Dankrad。這真的是一個相當優雅的結構。
最初,我們只是想了解細節,花了一些時間才準確地恢復了一切工作的細節。我們想,也許再寫一篇解釋該機制如何運作的文章會對世界有所幫助。最初,我想原始的danksharding,它被描述的方式,都是使用單變量多項式承諾,我們把每一行,我們把它看作一個多項式。擦除編碼都是使用多項式完成的。
也許我甚至可以在這里用一句話教一下擦除編碼。假設你在一個平面上有兩個點,你想對它們進行擦除編碼。你可以做的是,你可以用一條線穿過這兩個點,現在你可以直接發布,而不是只發布這兩個點,你可以發布這兩個點,也許再加上線上的兩個點。
所以現在你總共有四個點。而且你知道,如果這四個點中有兩個能到達接收方,接收方可以用它收到的兩個點來恢復線路,然后再恢復原來的兩個點。這就是擦除編碼的整個想法。因此,當然,我們使用更高程度的多項式來實現不同的閾值,而不是線條,但這就是這個想法。
基本上,我們有兩個點。我們通過一條線。我們在這條線上得到更多的點。如果這條線只有兩個點能到達接收者那里,接收者可以重建這條線并恢復原來的點。因此,danksharding實際上是通過把區塊看成是一個矩陣,看成是一個矩形的數據集來做到這一點的,真的是相當優雅的。
然后它基本上延伸,使用這些線的想法,在水平和垂直方向上。而這實際上給出了編碼塊——然后,該矩形的碎片被發送到不同的驗證器。有趣的是,現在你有了一個矩形,你可以把它看作是一個二維的物體。這很自然地導致了將其視為一個雙變量多項式,正如Lera所說。
Danksharding所做的是,它提供了一種非常有趣的方式來承諾這些雙變量多項式。因此,它通過使用對單變量多項式的承諾建立了一種承諾雙變量多項式的方法。因此,事實證明,在danksharding中進行的重建機制也是基于沿線和列的構建——也是使用單變量多項式進行的構建。然后當我們通過這個工作時,我們意識到,嘿,這里的一切真的是關于矩形和二元多項式。也許有一種方法,也可以通過使用雙變量多項式的插值來進行重建。
Lera:所以事實上,你把你的區塊,在兩個方向上都擴大到X的系數。因此,你有4倍的點作為結果。但這4倍的點只編碼了一個小象限。
因此,原則上,你只需要一個象限,以便插值和恢復這個編碼塊的所有其余部分。因此,25%的點應該是足夠的。但是,由于danksharding是通過單變量插值工作的,它需要75%的塊來進行列和行的重建。
如果你直接做雙變量插值,你應該只用25%而不是75%就可以了。因此,這將改善你為了重建、恢復區塊所需的元素數量。它還將改善通信和數據可用性采樣,但這都是由于改進了重建。
而現在的問題是,它變成了一種數學問題,即你如何做有效的雙變量插值?
那里顯然需要一個更好的算法。我們正在研究這個問題,到目前為止,它似乎還沒有被充分開發。因此,也許以前并沒有雙變量插值的應用。也許這只是一個困難的問題,或者我們不知道。但這絕對是一個有趣的方向,基本上可以嘗試改進雙線性插值算法。
Dan:我喜歡這個,就像Lera說的,對于觀眾中更多的算法的人來說,在做單變量插值方面已經有很多工作了。如果我給你一個單變量多項式上的點,比如一條線上的點,然后我讓你重建這個多項式,有非常好的單變量多項式插值算法。
而事實證明,雙變量插值問題,不知為何,它似乎受到的關注較少。而這里真正酷的是,突然間,區塊鏈、以太坊、danksharding正在為雙變量多項式插值這個真正自然的算法問題創造一個應用。
我們在這里真的需要它。如果我們有一個很好的雙變量多項式插值算法,我們就可以讓danksharding變得更好,因為正如Lera所說,重建將從75%下降到25%.所以對我來說,這真的很美,因為區塊鏈、以太坊、danksharding正在創造這個新的研究領域,或者至少優先考慮這個新的研究領域,表明我們真的需要更好的算法、新的算法、高效的算法來做雙變量多項式插值。
因此,希望這將鼓勵和刺激對這些類型的算法進行更多的研究,估計它們對這個問題將非常有用。
Robert:所以我喜歡我們在這里鉆研方法論,沒有回避數學。我知道有些東西可能聽起來有點復雜——雙變量多項式和單變量多項式。但我特別欣賞你用幾何學和形狀來描述這些,因為我想這里的每個人都能真正想象出一條線穿過一些點或一個矩形的功能。所以我認為這真的有助于鞏固你所做的工作。
我想雙擊你提到的這個統計數字,目前的建議需要75%的樣本才能被重建,而你的建議將把這個比例降低到25%.因此,這是一個巨大的差異。75%對25%。但是,這聽起來就像對于一個不經意的觀察者來說,如果你只有25%,事實上,它只是不到50%,聽起來,這真的足以讓人確信這些數據是可用的,并且是可用的?
當你下降到25%的時候,聽起來,我不知道,你可能是在削減一些角落。那么,你如何向人們保證,事實上,只要有25%的數據樣本就足夠了,而且事情可以在這個水平上運作?
Lera:是的,這讓我們想到了數據可用性抽樣的話題,以及它所達到的目的,我猜,因為這個重建閾值——75%或25%——基本上決定了你需要多少個樣本來獲得數據存在的高度保證。
你做樣本的方式是,你要求驗證器網絡給你一個元素,這個編碼塊的一個隨機元素。如果你成功地拿回來——你也可以驗證,一旦驗證者給你拿回這塊的有效性證明,你就可以根據鏈上持久存儲的承諾進行驗證——所以當你拿回成功的樣本時,使你確信數據是可用的,其概率是1減去四分之一或四分之三,這取決于你的重建算法如何工作,它是否需要25%的數據或75%的數據。
因此,每當你做一個隨機樣本并成功返回時,基本上你的假陽——你認為數據是可用的,但它不是的概率——就會呈指數級下降。而它下降的速度取決于你在重建中需要多少數據。因此,如果你的重建要求25%的數據,你就會做更少的樣本,你的保證——假陽率——比你只有一個需要75%的數據的重建算法下降得更快。
因此,取決于你的重建的效率如何,你可能需要更少的樣本,以便有同樣的保證,數據是可用的。所以這就是為什么你在這里不僅改善了重建,而且還改善了你的數據可用性抽樣所需的樣本數量。
數據可用性抽樣很有趣,因為它是概率性的。所以你做的樣本越多,你對數據可用性的保證就越高,對嗎?而且你總是可以通過做更多的樣本來放大這個概率,使之清晰。
Dan:我認為,Lera,你剛才的解釋真的非常非常重要。
這就是danksharding和數據可用性采樣的核心。所以我再講一遍,只是為了讓聽眾聽兩遍,因為這確實是它的核心。因此,也許可以考慮一下這個塊。我們說過,塊會被編碼為這個矩形,對嗎?因此,我們以某種方式從一個塊到一個矩形。
如何做到這一點的具體方法是使用這種擦除編碼。但讓我們假設我們從一個數據塊變成一個矩形。所以現在想象這個矩形是字面上的一個矩形的點。每一個點都對應著一塊數據,將被分配給一個驗證人。所以現在要做數據可用性抽樣,有人要驗證是否有足夠多的點是真的可用的。
我們知道,如果超過75%的點是可用的,那么就可以用擦除編碼的方法重建該區塊。或者說,如果我們所說的將被使用,那么只有25%的點足以重建原始矩形。但你怎么知道75%的點是可用的?
所以這正是數據可用性的抽樣機制。你所做的是你可以想象你在這個矩形上投擲飛鏢,對嗎?所以,每次你投擲飛鏢,你都會擊中矩形中的一個隨機點,然后持有該點的驗證器必須證明,“是的,我真的有這個點”。
現在你要驗證75%的點是可用的。所以,想象一下你有這個矩形。也許只有75%的點在那里。有些點由于某種原因消失了。你想確認75%的點是可用的,因為如果75%是可用的,你就可以重建整個矩形。那么,你要怎么做來驗證75%的點在那里?
你要向這個長方形扔一堆飛鏢。每當飛鏢擊中一個點,它所擊中的驗證器就必須證明這個點真的在那里。因此,如果你投擲一百個飛鏢,所有一百個飛鏢都回來說,“是的,數據真的在那里”,這給你一個相當好的想法,超過75%的數據是可用的。
因為你知道,如果少于75%的數據是可用的,而你投擲了四個飛鏢,你預計有一個飛鏢會擊中一個丟失的點。如果你扔了100個飛鏢,所有的飛鏢都回來說數據是可用的,你就可以很好地保證75%以上的點都在那里。所以這就是數據可用性抽樣的想法。
你只是嘗試很多很多的隨機點,比如一百個。如果所有的都有,那么你就有相當大的把握,超過75%的都有,你可以重建數據。你看,如果你想得到75%的保證,你需要投擲100個飛鏢。如果你只需要25%的保證,你需要投擲的飛鏢要比這個少。
所以這基本上會減少滿足抽樣機制所需的數據量。現在,也許值得說的是,一旦數據可用性抽樣檢查成功——所以所有的一百個飛鏢都回來說,“是的,這些點真的在那里”——然后驗證器說,“啊,數據是可用的”。
然后繼續前進并簽署該區塊,表示“該區塊通過了數據可用性采樣”。是的,這在以后的共識中會用到。這就是測試的內容。基本上,數據可用性抽樣是一個非常有效的方法來測試是否有足夠的數據來重建區塊,而不需要實際完全重建區塊。
所以我認為聽兩遍,甚至第三遍和第四遍是好的。但這也是使這一切成功的核心思想。
Robert:我喜歡這句話,我特別喜歡你用鏢靶和投擲飛鏢的實物比喻。我認為這真的讓人感到很親切。好了,我們已經接近這個小時的盡頭了。
我想準備收尾了。但在我們這樣做之前,也許我會用一句話把它扔給你們倆。所有這些的結果是什么?比如為什么要獲得這些效率的提高?
Lera:好吧,我想說的是,最終的目標當然是擴大區塊鏈的規模,這些新技術將使它能夠做到這一點,為以太坊實現全面擴展。
我想說的是,這是一個非常有趣的方法,因為在一開始,以太坊就在考慮做分片,完全分片,并達成了相當復雜的設計。但是,擁有rollup有助于擴展以太坊的執行層,而這就使得以太坊要擴展其數據可用性層。基本上,增加空間,而rollup增加執行能力,這些部分加在一起,將給我們帶來更便宜、更快速的區塊鏈。
Dan:是的,Lera說得很好。我的意思是,以太坊真正的擴展故事是rollup,而讓rollup更有效、更便宜的方法是通過解決數據問題。而danksharding是一種非常優雅和有效的方式。因此,結果是一個可擴展的以太坊版本,其中rollup的使用比現在便宜得多。
Robert:聽起來真好。如果你得到更便宜的交易和進行更多交易的能力,我認為這為以太坊開辟了各種新的應用,而這些應用在以前的高gas和費用下是不可能的。所以聽起來真的很好。感謝大家加入我們這一期。我希望你們都能學到一點關于數據可用性抽樣和danksharding的知識。
如果你想了解更多,如前所述,你可以查看Dan和Lera的帖子。這是一篇非常、非常棒的文章,所以我強烈推薦你閱讀它,并查看其中包含的所有參考資料。
感謝大家的收聽。我很期待這個周末的到來。我要去我當地的酒吧,在飛鏢盤上給大家講講擦除編碼的問題。所以謝謝大家,保重。
Lera:聽起來不錯。謝謝你。
Dan:謝謝你。今天的聊天很有趣。再見了。
感謝您收聽《a16z的Web3》節目。你可以在a16zcrypto.com?上找到帶有所討論的資源、書籍或論文鏈接的節目筆記;文字記錄,以及更多。本集由我們的音頻編輯JustinGolden進行了技術編輯。藝術方面也歸功于MoonshotDesign.并全部感謝a16zcrypto的支持。
如果想要關注我們的更多工作,并從我們和其他人那里獲得更新、資源,請務必訂閱我們的Web3每周通訊——你可以在我們的網站a16zcrypto.com?上找到它。
感謝您的收聽,感謝您的訂閱。讓我們<消音>開干吧!
Tags:DANINGDANKANKcardano幣行情兔王幣KAREKINGMu DankBaby Shark Tank
0、開源文化發展史:由小眾走向主流從封閉到開放,為自由軟件的理想《大教堂與集市》是開源運動的《圣經》,顛覆了傳統的軟件開發思路,影響了整個軟件開發領域.
1900/1/1 0:00:00注:原文來自@ChrisYicheng發布長推,MarsBit整理編譯。Layer3(L3)和應用鏈解決方案的興起為以太坊生態系統帶來了新的可能性.
1900/1/1 0:00:00近日,美國《財富》雜志發布新一期世界500強排行榜。從數量上看,今年世界500強企業中,有129家來自中國,首次超過美國的121家,實現了歷史性的突破.
1900/1/1 0:00:00BRC-20的瘋狂大家已經見識過了,而ORC20是BRC20的升級版。此文手把手教你們體驗暴富的技能1、ORC-20是什么?2、如何找ORC-20代幣文本3、ORC-20銘文鑄造教程詳細步驟4、.
1900/1/1 0:00:00MarsBitCryptoDaily2023年5月6日 一、今日要聞 數據:質押以太坊存入凈數量達97586ETH,價值1.89億美元以太坊上海升級之后,就仍在等待提取質押資金的實體而言.
1900/1/1 0:00:001.Crypto投資人的盡頭不是網紅我覺得投資人的盡頭不是網紅,就像餐飲行業的盡頭不是網紅店。投資要賺錢,要管理風險,要給創始人幫忙.
1900/1/1 0:00:00