原文作者:AndrewHong
原文標題:GuidetoWeb3Data:Thinking,Tools,andTeams
編譯:GaryMa,吳說區塊鏈
本文假設你是一個剛接觸web3的數據分析師,開始組建你的web3分析團隊,或者剛剛對web3數據產生興趣。無論采用哪種方式,你都應該已經大致熟悉了APIs、數據庫、轉換和模型在web2中的工作方式。
在這本新指南中,我將盡量簡明扼要地闡述我的三個觀點:
1、思考:為什么開放的數據渠道會改變數據發揮效用的方式
2、工具:web3數據棧中的工具概述,以及如何利用它們
3、團隊:web3數據團隊的基本考慮和技能
數據思考
讓我們先總結一下如何在web2中構建、查詢和訪問數據。我們有四個步驟來簡化數據渠道:
1、觸發API事件
2、更新到數據庫
3、特定產品/分析用例的數據轉換
4、模型訓練和部署
當數據是開源的時候,唯一需要的步驟是在轉換完成之后。Kaggle和hugsFace等社區使用一些公開的數據子集來幫助企業構建更好的模型。有一些特定領域的情況,比如在前面的三個步驟中開放數據的開放街道地圖,但是它們仍然有寫權限的限制。
百度數字人生成方法專利獲授權,可應用于元宇宙等場景:金色財經報道,北京百度網訊科技有限公司申請的“生成數字人的方法、模型的訓練方法、裝置、設備和介質”專利獲授權。專利摘要顯示,本公開涉及人工智能領域,具體涉及自然語言處理、深度學習、計算機視覺、圖像處理、增強現實和虛擬現實等技術領域,可應用于元宇宙等場景。[2023/6/9 21:26:19]
我想聲明的是,我只是在這里談論數據,我并不是說web2完全沒有開源。像大多數其他的工程角色一樣,web2數據有大量的開源工具來構建他們的管道。我們仍然在web3中使用所有這些工具。總之,他們的工具是開放的,但他們的數據是封閉的。
Web3也將數據開源,這意味著不再只有數據科學家在開放環境下工作,分析工程師和數據工程師也在開放環境下工作!每個人都參與到一個更連續的工作流程中,而不是一個幾乎是黑盒的數據循環。
工作的形式已經從web2數據大壩到web3數據河流、三角洲和海洋。同樣重要的是需要注意,生態系統中的所有產品都會同時受到這個循環的影響。
讓我們看一個web3分析師如何一起工作的例子。有幾十家交易所使用不同的交易機制和費用,允許你將代幣A交換為代幣B。如果這些是典型的交易所,如納斯達克,每個交易所將報告自己的數據在10k或一些API,然后其他一些服務,比如capIQ,會把所有交換數據放在一起,然后收取費用,讓你訪問他們的API。也許有時候,他們會舉辦一次創新競賽,這樣他們就可以在未來收取額外的數據/圖表功能。
Terra社區成員發起0.5% LUNA緊急資金分配的分配方法的新提案:6月6日消息,Terra社區成員發起0.5% LUNA 緊急資金分配的分配方法的新提案,提議有三個群體有資格獲得緊急資金分配:在 Terra Classic 上推出并實現產品市場匹配和 TVL 的項目、在 Terra Classic 上推出并實現了產品與市場匹配但沒有可衡量的 TVL 的項目、尚未實現產品與市場匹配(pre-PMF)的項目(發布前和上市后),并建議向符合條件的 pre-PMF 團隊分配 10 萬到 30 萬美元的 LUNA 資金。
注,Terra 生態系統復興計劃 2 指定了 LUNA 供應量的 10% 專門用于激勵 Terra 2.0 上的開發人員,其中 0.5% 為緊急基金,旨在在網絡啟動后幫助項目方們構建產品,如果產品在 1 年內未推出,則退還資金。[2022/6/6 4:04:27]
在web3交易所中,我們有這樣的數據流:
1、dex.trades是Dune上的一個表格,所有的DEX交換數據都被聚合在一起,所以你可以很容易地在所有交易所中搜索單個代幣的交易量。
2、一名數據分析師通過社區開源查詢創建了一個儀表盤,所以現在我們對整個DEX行業有了一個公開的概述。即使所有的查詢看起來都是由一個人寫的,你可以猜測這是在discord上經過大量的爭論,才準確地將其拼湊在一起得。
IRS尋求監視加密錢包內活動的方法:美國國稅局(IRS)數字取證團隊正在研究用于加密錢包的破解工具,以“將網絡安全研究限制在可衡量的,可重復的,一致的數字取證流程中。”(beincrypto)[2021/5/25 22:40:24]
3、DAO科學家查看儀表板,并開始在他們自己的查詢中分割數據,查看特定的對,比如穩定幣。他們會觀察用戶行為和商業模式,然后開始建立假設。由于科學家可以看到哪個DEX在交易量中占據了更大的份額,他們將提出一個新的模型,并提議改變治理參數,以便在鏈上進行投票和執行。
4、之后,我們可以隨時查看公眾查詢/儀表板,看看提案如何創造出更具競爭力的產品。
5、在未來,如果另一個DEX出現,這個過程將重復。有人將創建插入查詢來更新這個表。這將反過來反映在所有的儀表板和模型。任何其他分析師/科學家都可以以別人已經完成的工作為基礎。
由于共享的生態系統,討論、協作和學習在一個更緊密的反饋循環中發生。我承認這有時會讓人難以承受,我認識的分析師基本上都在輪換數據耗盡。然而,只要我們中的一個人繼續推動數據向前,那么其他人都會受益。
它并不總是必須是復雜的抽象視圖,有時它只是實用功能,如使它容易搜索ENS反向解析器或工具的改進,如自動生成大多數graphQL映射與一個CLI命令!所有這些都可以被每個人重用,并且可以在某些產品前端或您自己的個人交易模型中進行API的使用。
聲音 | 社科院尹振濤:區塊鏈技術可在金融監管應用過程中做適當的調整,匹配監管方式和方法:金色財經報道,中國社會科學院金融研究所法與金融研究室副主任尹振濤表示,區塊鏈技術主要基礎是數據和信息,更重要的是數據的流通、交易,轉移等,區塊鏈技術的這些特征,跟監管有很多相似和匹配之處。但是,區塊鏈技術在金融監管的應用中,也可能存在一些問題。區塊鏈最明顯的特征是去中心化,但是去中心化并不意味著沒有中心,只是可能弱化中心。去中心和去監管是兩個不同的概念。在被弱化中心的機構中,監管部門如何發揮作用需要思考。尹振濤認為,區塊鏈技術正處于發展中,可以在金融監管的應用過程中做一些調整,匹配監管方式和方法。同時,監管機構也應該圍繞新的模式和生態,做適當的調整,更好地規范行業的發展。[2019/11/23]
雖然這里開啟的可能性是驚人的,我確實承認,輪子還沒有平穩地運行。與數據工程相比,數據分析師/科學領域的生態系統仍然很不成熟。我認為有以下幾個原因:
數據工程是web3多年來的核心焦點,從客戶端RPCAPI的改進到基本的SQL/graphQL聚合。像theGraph和Dune這樣的產品就是他們在這方面所付出努力的例證。
對于分析師來說,要理解web3獨特的跨協議關系表是非常困難的。例如,分析人員可以理解如何只分析Uniswap,但卻很難在混合中添加聚合器、其他DEXs和不同的代幣類型。最重要的是,實現這一切的工具直到去年才真正出現。數據科學家通常習慣于收集原始數據并獨自完成所有的工作。我認為他們不習慣在開發初期與分析師和工程師進行如此密切和公開的合作。對我個人來說,這花了一段時間。
公告 | 火幣合約官網無法登錄解決方法:據火幣公告,合約界面點擊登錄后還是處于未登錄狀態或者在登錄來回跳轉Safari瀏覽器Mac電腦Safari瀏覽器無法登錄,解決方法為:打開Safari瀏覽器 -> 偏好設置 -> 隱私 -> 阻止跨站跟蹤勾選去除。勾選去除后重新打開網站即可。谷歌瀏覽器谷歌瀏覽器無法登錄,解決方法:找到瀏覽器設置→內容設置→Cookie設置→允許網站保存和讀取 Cookie 數據勾選上1)內容設置2)Cookie設置3)允許網站保存和讀取 Cookie 數據Firefox瀏覽器Firefox瀏覽器無法登錄,解決方法:首選項→隱私與安全→第三方Cookie(跟蹤器)1)首選項2)隱私與安全→第三方Cookie(跟蹤器)。[2018/12/20]
除了學習如何協同工作之外,web3數據社區還在學習如何跨這個新的數據堆棧工作。你不再需要控制基礎設施,或者慢慢地從excel構建到數據池或數據倉庫,只要你的產品上線,你的數據就會到處上線。你的團隊基本上是被扔到了數據基礎設施的最深處。
數據工具?
以下是一些數據工具匯總:
下面我們看看每種類型以及用法:
1、交互+數據源:這主要用于前端、錢包和較低層次的數據攝取。
1.1、客戶端:雖然以太坊的底層實現是相同的,但每個客戶端都有不同的額外特性。例如,Erigon對數據存儲/同步進行了大量優化,Quorum支持隱私鏈。
1.2、節點即服務:你不必選擇運行哪個客戶端,但使用這些服務將為你節省維護節點和API正常運行的麻煩。節點的復雜性取決于你想要捕獲多少數據。
2、查詢+數據映射:這一層中的數據要么作為URI在合約中引用,要么來自使用合約ABI將交易數據從字節映射到表模式。合約ABI告訴我們合約中包含哪些函數和事件,否則,我們只能看到部署的字節碼。
2.1、交易數據:這些是最常用的,主要用于儀表板和報告。theGraph和FlipsideAPI也在前端中使用。有些表是合約的1:1映射,有些表允許模式中額外的轉換。
2.2、元數據“協議”:這些并不是真正的數據產品,而是用于存儲DIDs或文件存儲的。大多數NFT將使用其中的一個或多個數據源,我認為今年我們將開始越來越多地使用這些數據源來增強我們的查詢。
2.3、專業提供商:其中一些是非常健壯的數據流產品,Blocknative用于mempool數據,Parsec用于鏈上交易數據。其他的聚合鏈上和鏈外數據,比如DAO治理或國庫數據。
2.4、高維度數據提供商:你不能查詢/轉換他們的數據,但是他們已經幫你完成了所有繁重的工作。
如果沒有強大的、杰出的社區來配合這些工具,web3就不會出現!我們可以看到每種類型對應的杰出社區:
1、Flashbots:專注于MEV上,提供從保護交易的自定義RPC到專業白帽服務的所有事宜。MEV主要指的是槍跑問題,當有人支付比你更多的Gas,這樣他們就可以搶先執行他們的交易。
2、Dune數據精英:專注于為Dune的數據生態做貢獻的數據分析精英。
3、Flipside數據精英:專注于為Web3數據升天做貢獻的數據分析精英。
4、MetricsDAO:跨生態工作,處理多個鏈上的各種數據獎勵。
5、DiamondDAO:專注于Stellar的數據科學工作,主要在治理、財政庫以及代幣管理方面。
6、IndexCoop:專注于代幣等特定領域的分析,以制定加密貨幣行業最好的指數。
7、OurNetwork:每周對各類協議以及?Web3的數據覆蓋。?
注:以上DAO的參與聯系方式詳看原文。
每個社區都做了大量的工作來改善web3的生態系統。毫無疑問,擁有社區的產品將以100倍的速度增長。這仍然是一個被嚴重低估的競爭優勢,我認為除非人們在這些社區中建立了一些東西,否則他們不會獲得這個優勢。
數據團隊
不用說,你也應該在這些社區中尋找可以加入你的團隊的人。讓我們進一步分析重要的web3數據技能和經驗,這樣你就能真正知道你在搜索什么。如果你想被雇傭,把這看作是你追求的技能和經驗!
至少,分析師應該是Etherscan偵探,知道如何閱讀Dune儀表盤。這可能需要1個月的時間來適應悠閑的學習,如果你真的要瘋狂學習,則需要2周的時間。
除此之外,你還需要考慮更多的內容,特別是時間分配和技能轉移。
1、時間方面:在web3中,數據分析師大約有30-40%的時間將花在與生態系統中的其他分析師和協議保持同步上。請確保你不會氣暈他們,否則,這將成為對每個人的長期損害。與更大的數據社區一起學習、貢獻和構建是必要的。
2、可轉移性方面:在這個領域,技能和領域都是高度可轉移的。如果使用不同的協議,可能會減少上手時間,因為鏈上數據的表模式都是一樣的。
記住,知道如何使用這些工具并不重要,每個分析師或多或少都應該會寫SQL或創建數據儀表盤。這一切都是關于如何做出貢獻并與社區合作。如果你正在面試的人不是任何web3數據社區的一員,你可能要問問自己這是否是一個危險信號。
鏈捕手消息,費城市長JimKenney已經批準該市開始探索與CityCoin合作的可能。費城首席信息官MarkWheeler周一宣布,費城已經準備好推出CityCoin,這是一個由加密貨幣愛好者.
1900/1/1 0:00:00鏈捕手消息,TristanMetaverse將在4月份發布重量級元宇宙基礎設施產品TristanMetaWallet.
1900/1/1 0:00:00鏈捕手消息,在Decrypt新一期播客當中,FTX旗下Web3基金負責人AmyWu對JackDorsey的Web3概念和風險投資公司a16z在該領域的巨大作用進行了權衡,她表示.
1900/1/1 0:00:00鏈捕手消息,據TheBlock報道,紅杉資本推出規模為5-6億美元的加密貨幣投資基金,主要投資于流動性代幣,包括在加密貨幣交易所上市和尚未上市的代幣.
1900/1/1 0:00:00作者:Bankless 編譯:DeFi之道 去中心化自治組織在過去的一年里爆發式地流行起來。它們已經從只有少數貢獻者的小眾項目成長為擁有數十億資金和數千名熱心社區成員的巨無霸,它們都在為實現其使.
1900/1/1 0:00:00作者:TheDeFiEdge 編譯:谷昱,鏈捕手 為了成為更好的加密投資者,我研究了數百種認知偏差。以下是最重要的14個: 1)單位偏差 人們更愿意購買代幣的“整個單位”,而不是其中的一小部分.
1900/1/1 0:00:00