2020年分布式存儲以其獨特的姿態涌入我們的視野之中,可是我們好像從來沒有思考過,究竟什么是分布式存儲?而我們為什么需要分布式存儲?
實際上采用分布式存儲可以說是“被迫”的,因為面對越發飛速發展的互聯網、整個生態應用不斷創新、用戶數量不斷龐大、數據階梯式增長這些無疑不給現有的本地存儲帶來巨大的壓力。因此,必須通過采用其他分布式存儲系統去緩解相應的壓力,所以分布式存儲和分布式文件系統應運而生。
今天我們這篇文章將對于分布式存儲進行介紹,并對Filecoin進行深入研究。
定義
分布式存儲系統,是將數據分散存儲在多臺獨立的設備上。傳統的網絡存儲系統采用集中的存儲服務器存放所有數據,存儲服務器成為系統性能的瓶頸,也是可靠性和安全性的焦點,不能滿足大規模存儲應用的需要。分布式網絡存儲系統采用可擴展的系統結構,利用多臺存儲服務器分擔存儲負荷,利用位置服務器定位存儲信息,它不但提高了系統的可靠性、可用性和存取效率,還易于擴展。
分布式存儲簡介
現代計算處于高度集中的階段,在過去的十年時間中,一些大型存儲公司通過將傳統計算機系統劃分云存儲產品獲得了巨大的財富。這側面反映了現代化網絡中心化集中的現象——如果其中一個供應商發生問題時,便會衍生成重大的互聯網事件。比如:2017年Amazon網絡突然中斷;2020年6月Github長時間中斷;2020年10月Microsoft多周云服務出現問題等等。
美國參議員:從政策制定的角度來看,擁有比特幣與擁有牛沒有什么不同:金色財經報道,美國參議員Cynthia Lummis正準備推出負責任的金融創新法案,這將影響加密貨幣的征稅方式。她表示,從政策制定的角度來看,擁有比特幣與擁有牛沒有什么不同。作為2020年上任的參議員,Lummis 報告稱持有價值 50,000 至 100,000 美元的 BTC,2021 年 8 月,她報告額外購買了價值 50,000 至 100,000 美元的 BTC。她沒有從出售資產中獲得任何收入。(decrypt)[2022/4/2 13:59:51]
而我們托管在這些服務上的內容也值得我們擔心,它們被隱藏在經常斷開的脆弱鏈接之后面,這對我們構建的計算機系統以及越來越依賴它們的社會具有深遠的影響。集中式架構之所以成功,部分原因在于它們易于構建。為了阻止合并,開發人員需要同樣容易組成的基礎新構建塊。分布式存儲就是這樣的基石,是分布式Web的前提。
分布式存儲的基本特征
1.彈性
現代互聯網非常脆弱。如今,Web內容隱藏在URL后面,每個URL在任何給定時刻都屬于一臺確定的服務器,一旦供應商出于原因中斷網絡連接,其指向的內容將不可訪問。集中化會增加這種影響,造成單一節點故障并為審查提供方便。結果,在當今的互聯網中,普遍存在著互聯網鏈接失效的現象,就好像當一個鏈接斷開或永久不可用,國家級審查和分布式拒絕服務攻擊破壞可以訪問任何文件。
播客主持人:當下的孩子們或許知道比特幣是什么:播客節目“Magic Internet Money”主持人Brad Mills發推稱:“我在萬圣節糖果盒里放了一些價值100美元的Rise Wallet比特幣卡,捕捉到了一些隨機的‘不給糖就搗蛋’的人發現它們的瞬間。‘嘿哥們,我發現了比特幣!’我想這些孩子們或許確實知道比特幣是什么。”[2020/11/1 11:22:05]
在理想的分散系統中,運營商的損失不應阻止用戶對先前存儲和服務的內容的訪問。通過將責任分散到網絡的許多節點上,分散式系統還可以自然地抵抗審查制度和其他拒絕服務的嘗試,因為沒有集中的目標可以使攻擊者大量獲取資源。
集中存儲系統易于受到審查的影響,一個典型的案例是當西班牙的17個自治社區之一的加泰羅尼亞,舉行獨立公投時,反對獨立計劃的西班牙政府封鎖了擁有ISP級別投票信息的網站,通過切斷這些關鍵的鏈接,政府有效地阻止了許多個人訪問這些信息。
然而,許多網站也使用對等存儲網絡星際文件系統進行了鏡像。任何運行IPFS節點的人都可以從網絡上的其他節點下載經過審查的信息,并開始自己分享。IPFS的分散化本質與西班牙政府阻止訪問這些文件的企圖背道而馳——只要一個節點被封鎖,另一個節點就可以輕易地取代它。通常,分布式存儲系統使網絡級阻塞變得更加困難。
2.效率
所有計算系統體系結構都有其優點和缺點,并且沒有單一的解決方案適合所有可能的用例。不幸的是,現代網絡對集中化的重視沒有什么不同。如今,全球少數城市中的一些集中式數據中心存儲的內容最多。例如,如果同一網絡上的兩個用戶希望彼此發送消息,這些消息通常將發送到其中一個數據中心;如果100個用戶在一個房間里用他們的設備觀看同一段視頻,他們每個人都會訪問一個中央服務器并下載100份副本,而不是下載一份副本并在本地網絡上共享它。
聽證會 | 扎克伯格:應讓Libra發行,看看市場有什么反應:金色財經直播報道,在今日聽證會上,議員Frank Lucas,你們如何說服那些沒有銀行賬戶的人,讓他們不信任銀行,卻使用Facebook的服務嗎?扎克伯格回答說,他現在也不知道如何找到答案,唯一的辦法是讓Libra發行出來,然后看看市場會有什么反應。[2019/10/23]
最簡單的說法是:分布式存儲使得共享文件變得更容易,而不需要在互聯網上向特定的幾個數據中心發送請求。取而代之的是,節點之間通過盡可能少的中間人建立連接。例如,連接到其他國家的節點仍然需要幾次跳轉,但是同一網絡上的節點可以直接共享文件。分布式存儲的最終目標是建立眾多的節點,從而使每個人都可以通過本地對等的節點來獲取信息。
分布式存儲解決方案可以將基本的新效率引入此類活動。通過繞過數據中心,分布式系統可以使節點放置在比現代內容分發網絡更接近終端用戶的地方,甚至比現代內容交付網絡都更靠近最終用戶,從而大大加快了文件檢索速度。通過本地網絡進行點對點文件共享還可以節省帶寬,特別是在對更廣泛的互聯網訪問有限的地區。
分布式存儲的理想特性
盡管彈性和效率是分布式存儲的標志,但理想的存儲系統可能還具有許多其他特征:
1.可訪問
理想的分布式系統應該是可訪問的。參與網絡應該很容易,允許盡可能多的節點代表網絡存儲和分發文件。
聲音 | 福布斯財務委員會成員:Ripple有很多產品可以提升XRP的價值 但沒人知道XRP可以達到什么水平:福布斯財務委員會成員David Gokhshtein發推文稱,Ripple公司將盡一切可能使XRP有價值。他們有很多很棒的產品(如:xRapid)可以提升它的價值。但是沒有人知道它會達到什么水平。[2019/7/29]
如果您正在閱讀本文并想知道:我可以是一個節點嗎?答案是:視情況而定。借助Filecoin,任何相對精通技術的人都應該能夠運行客戶端節點以與網絡進行交互。至于運行存儲礦工節點,并不是所有人都能做的,因為您需要具有滿足特定規格的硬件。
對于IPFS,節點的硬件要求較低,這意味著有可能有更多的用戶通過運行節點,或許通過運行內置的Web瀏覽器,對網絡做出貢獻。云服務提供商使廉價,可靠的存儲比以往任何時候都更容易使用。它們成功的一個主要方面是能夠通過API通過代碼配置和管理存儲的能力。任何競爭性系統都應該能夠提供相同級別的便利。
2.內容尋址
如前所述,URL體現了一些內在的設計折衷。它們描述的是數據的位置,而不是數據的內容。為了解釋集中式系統是如何使查找數據變得困難的——假設您想下載一只毛茸茸的小貓的照片。考慮以下兩個URL:
https://example1.com/cat.jpeg
https://example2.com/cat.jpeg
動態 | FCA調查:73%的英國人不知道加密貨幣是什么:英國金融市場行為監管局(FCA)今日發布了一項針對數字貨幣投資者的調查,73%接受調查的英國人不知道“加密貨幣”是什么,在購買了數字貨幣的人中有一半投資了200英鎊(約1766元)以下的資金。另外超過50%的投資者曾投資了BTC,34%的人投資了ETH。[2019/3/7]
這些URL都引用了一個名為cat.jpeg的文件,但不能保證這兩個文件相同。如果example1.com離線,則無法確定example2.com是否滿足您的需求-cat.jpeg可能完全不同。事實上,它甚至可能是一張狗的照片!URL和它引用的內容之間沒有固有的關系。
因此,你沒有辦法問今天的互聯網,“有人有這個文件嗎?”因為除了它的位置之外,你對文件一無所知。
當您使用URL共享文件時,可能會出現問題。服務器可能會從該URL開始提供不同的文件,或者有人會執行中間人攻擊并修改文件(奇怪的是,這種攻擊并不少見)。很難確認訪問URL的每個人都收到了他們想要的文件。
相比之下,內容尋址基于內容標識符(CIDs)查找文件,CIDs作為文件的數字指紋。用這種方式尋址文件解決了位置尋址的問題。當客戶端需要一個文件時,他們向網絡中的節點詢問具有特定CID的文件,而不是向一個服務器詢問URL。客戶端下載文件后,便會自己對其進行指紋識別。
回顧我們前面的例子,就好像所有網站都對輸入cat.jpeg時要交付的文件有共同的理解。因此,雖然不能保證任何節點都具有特定的cat.jpeg,但這些節點將檢查該文件的指紋以嘗試找到匹配項。
盡管像指紋識別這樣的步驟需要比普通人要多的技術知識,但Filecoin和IPFS客戶可以輕松地使此過程自動化。這樣一來,客戶就可以保證他們已收到所需的文件-在此系統中,查找數據的備用提供者很簡單。
主要要點:CIDs意味著您可以找到集中式系統中可能丟失的內容,CIDs還可以防止中間人攻擊或服務器在特定URL處突然更改文件。
3.獨立性
無信任系統允許雙方進行合作,而不需要了解對方或尋求第三方。她認為,系統的激勵促使參與者朝著網絡運行所必需的行為前進。
4.可驗證
理想的存儲系統應該能夠輕松地持續證明節點正在存儲它們所承諾的精確數據。這種類型的可審核性是實現不信任的關鍵。如果您總是能夠確定數據被正確地存儲,那么您就不太需要信任提供存儲的一方。
5.開放性
最后,理想的分布式存儲系統是開放的:它的代碼是開放源代碼的,并且是可審計的。此外,存儲系統不應該是單塊的。相反,它應該公開一個任何人都可以實現和構建的開放協議,而不是鼓勵鎖定。
案例研究:Filecoin如何體現這些特征
Filecoin項目是一個分布式存儲系統,旨在滿足這些特性。在2014年的描述中,Filecoin協議最初是作為一個激勵層開發的星際文件系統(IPFS),一個對等存儲網絡。與IPFS一樣,Filecoin是一種開放協議,它基于其較早版本的屬性,利用相同的底層對等和內容尋址功能。
Filecoin節點網絡為文件的檢索和存儲提供了一個分散的存儲市場。這個網絡是由一個新的區塊鏈支持的,它記錄了網絡參與者所做的承諾。用戶使用區塊鏈的加密貨幣FIL在網絡上進行交易。
1.檢索市場
在檢索市場上,被稱為檢索礦工的節點競爭將文件盡快提供給客戶端。檢索礦工通過少量的FIL費用獲得獎勵。這使得位于關鍵位置的節點有了加入網絡的動機,并促進了文件的快速分發。它還鼓勵建立一個穩健的網絡來復制和保存急需的文件。
2.存儲市場
在Filecoin的存儲市場中,被稱為存儲礦工的節點被授權在各種特性上競爭,比如價格和位置,為客戶提供指定時間內的文件托管合同。存儲礦工在接受合同前,必須先進行抵押FIL;如果存儲礦工未能履行其對客戶的義務,則此功能可用于自動向客戶償還費用。
當存儲礦工和他們的客戶達成協議時,客戶將他們的數據傳輸給存儲礦工。存儲礦工將其數據添加到一個扇區,扇區是Filecoin中存儲的基本單位。然后礦工執行計算密集型操作,以創建該扇區數據的唯一副本。
如果客戶希望存儲其數據的多個唯一副本,那么封裝過程將確保每個副本都具有惟一的指紋,而獲取該指紋所需的計算量將防止節點從基礎數據重新生成指紋,從而避免作弊。數據最終用于向Filecoin區塊鏈發布復制證明。
在存儲交易期間,需要定期要求存儲礦工向區塊鏈提交時空證明。礦工使用隨機性,密封扇區和發布到區塊鏈的復制證明來獲得這些證明。這些證據為客戶端提供了一個強有力的概率論證,即存儲礦工擁有完整,唯一的數據副本。這是一個非常有力的保證-甚至是現代云存儲提供商也無法提供其客戶。
客戶通過支付FIL作為交易費來獎勵Filecoin存儲礦工。還為存儲礦工提供了為區塊鏈挖掘區塊的機會,這既需要FIL獎勵,也可以向希望在開采塊中包含消息的其他人收取交易費用。Filecoin的證明系統意味著礦工需要一些額外的硬件,但對于技術熟練的個人來說,要求仍然很低。作為客戶端參與網絡的硬件要求是適當的,Filecoin節點還公開了一個用于與網絡進行編程交互的API,允許第三方服務在核心網絡功能之上構建。
結論
分布式存儲提供了一種與傳統的集中式存儲相對應的強有力的選擇。它為開發人員提供了探索設計計算空間的機會,從而強調了內容存儲和交付的穩定性和效率。Filecoin表明,通過分布式存儲可以不僅可以讓數據更加安全;也可以讓Web3.0網絡為更多人使用。
行業要聞 1、新加坡央行高管:新加坡央行正專注于開發批發CBDC2、OCC推動美國銀行向加密貨幣企業開放3、美國資產管理公司DAiM推出比特幣401(k)計劃4、灰度以太坊信托基金(ETHE)獲.
1900/1/1 0:00:00BSN國際區塊鏈服務網絡正式宣布與dfuse平臺建立合作伙伴關系。BSN國際會在平臺上提供dfuse的大規模可擴展的數據訪問API,在EOSIO和以太坊鏈上發布應用的用戶將能夠直接通過BSN國際.
1900/1/1 0:00:00近期Kucoin被盜,okex不能提幣事件中,也已經充分暴露出中心化交易所的風險。 脆弱的中心化的交易所: 1.技術風險 服務器軟件漏洞、配置不當、DDoS攻擊、服務端Web程序漏洞、辦公電腦安.
1900/1/1 0:00:00比特幣,在瘋狂牛市的奔跑之中,出現了兩日的大回調,兩天大跌近2200個點,說實話幅度有點大,很多人以為是歐美股市暴跌的影響引起市場的恐慌,而歐美股市暴跌的原因是因為新冠疫情在英國變異了.
1900/1/1 0:00:00整個區塊鏈產業都在等待著春天的到來。區塊鏈技術若想大規模落地,還需要許多配套基礎設施的完善。國內企業中的互聯網巨頭BATJ均已推出了自研的BaaS平臺.
1900/1/1 0:00:00行業要聞 1、SBI集團與瑞士交易所SDX成立合資公司在新加坡提供機構投資者數字資產服務2、富國銀行報告:加密貨幣投資像19世紀50年代的早期淘金熱3、外媒:渣打銀行將為機構投資者推出加密貨幣交.
1900/1/1 0:00:00