撰文:Yiping,IOSG Ventures
隨著大語言模型(LLM)日益蓬勃,我們看見不少項目正在將人工智能(AI)和區塊鏈融合。LLM 和區塊鏈的結合越來越多,我們也看到人工智能重新與區塊鏈融合的機會。其中值得一提的,當屬零知識機器學習(ZKML)。
人工智能和區塊鏈是兩種具有根本性差異特征的變革性技術。人工智能需要強大的計算能力,通常由中心化的數據中心提供。而區塊鏈提供了去中心化的計算和隱私保護,在需要進行大規模計算和存儲任務上表現不佳。我們仍在探索和研究人工智能和區塊鏈集成的最佳實踐,后續也將向大家介紹目前一些「AI + 區塊鏈」結合的項目案例。
Source: IOSG Ventures
IOST突破0.02 USDT關口 24h漲幅超11%:據幣安交易平臺數據顯示,IOST今日持續拉升,現報價0.021 USDT,24h漲幅超11%,24h交易量超7億IOST。[2021/6/29 0:13:25]
本篇研究報告分為上下兩部發表,本文為上部,我們將重點關注 LLM 在加密領域的應用,并探討應用落地的策略。
LLM(大語言模型)是一種計算機化語言模型,由一個具有大量參數(通常為數十億)的人工神經網絡組成。這些模型在大量未標記的文本上進行訓練。
2018 年前后,LLM 的誕生徹底改變了自然語言處理的研究。與以往需要為特定任務訓練特定監督模型的方法不同,LLM 作為一個通用模型,在各種任務上都表現出色。其能力和應用包括:
理解和總結文本:LLM 可以理解和總結大量的人類語言和文本數據。它們可以提取關鍵信息并生成簡潔的摘要。
IOST與Raze Network達成戰略合作,推動IOST態中隱私保護層發展:4月20日,IOST宣布與基于波卡的跨鏈隱私協議Raze Network達成合作,攜手推動IOST生態中隱私保護層的發展。
Raze Network將為IOST生態中的交易和數據出入提供隱私保護機制。通過將IOST dApps、錢包與RazeVM集合,用戶能夠使用“Σ-子彈”算法有效的對賬戶余額和交易進行加密,并提升Raze和IOST賬戶隱私支付渠道在用戶中的影響力。
Raze Network是一個波卡生態中基于substrate的跨鏈隱私協議。它致力于為DeFi和Web 3.0提供一個跨鏈隱私中間件,是一個能為DeFi和Web 3.0堆棧提供端對端匿名性的原生隱私協議。[2021/4/20 20:39:59]
生成新內容:LLM 具有生成基于文本內容的能力。通過向模型提供 prompt,它可以回答問題、新生成的文本、摘要或情感分析。
iOS版Opera瀏覽器可直接訪問IPFS地址:星際文件系統(IPFS)表示,目前iOS版Opera瀏覽器可直接訪問IPFS地址,另外,該功能將于2021年3月份在Windows、macOS和Linux版的Opera桌面瀏覽器上線。具體來說,OperaTouch支持由遠程HTTP網關處理的ipfs://和ipns://協議方案的地址,默認情況下,使用的網關為dweb.link。[2021/2/9 19:18:26]
翻譯:LLM 可用于在不同語言之間進行翻譯。它們利用深度學習算法和神經網絡來理解詞匯之間的上下文和關系。
預測和生成文本:LLM 可以基于上下文背景預測并生成文本,與人類生成的內容類似,包括歌曲、詩歌、故事、營銷材料等。
在各個領域的應用:大型語言模型在自然語言處理任務中具有廣泛的適用性。它們被用于對話式人工智能、聊天機器人、醫療保健、軟件開發、搜索引擎、輔導、寫作工具等眾多領域。
Brave宣布修改其iOS系統版本 取消BAT瀏覽獎勵功能:12月11日,隱私瀏覽器Brave官方宣布將對其為iOS系統發布的最新版本進行一些更改,新版本將限制iPhone和iPad用戶獲得瀏覽獎勵代幣BAT。因為Apple認為Brave的獎勵系統不符合其應用商店規則。[2020/12/11 14:55:29]
LLM 的優勢包括其對大量數據的理解能力、執行多種語言相關任務的能力,以及根據用戶需求定制化結果的潛力。
由于其出眾得自然語言理解能力,LLM 具有相當大的潛力,而開發者主要關注以下兩個方面:
基于大量的上下文數據和內容,為用戶提供準確的并且最新的答案
通過使用不同的代理和工具完成用戶下達的特定任務
正是這兩個方面讓與 XX 聊天的 LLM 應用如雨后春筍般爆發。例如,與 PDF 聊天、與文檔聊天以及與學術論文聊天。
紅杉資本曾投資Filecoin、Orchid Protocol、IOSToken、Ontology等項目:據公開資料顯示,紅杉資本曾投資過Filecoin、Orchid Protocol、IOSToken、Ontology等加密數字貨幣項目,其中Orchid Protocol還未正式上市。今日幣安趙長鵬在推特宣布,未來所有在幣安上幣的項目都需要披露是否與紅杉資本有直接或間接的關聯。[2018/5/8]
隨后,人們嘗試將 LLM 與各種數據源融合。開發者已成功將平臺,如 Github、Notion 和一些筆記軟件與 LLM 整合。
為了克服 LLM 固有的限制,不同的工具被納入了系統中。第一個這樣的工具是搜索引擎,為 LLM 提供了訪問最新知識的能力。進一步的進展將把 WolframAlpha、Google Suites 和 Etherscan 等工具與大型語言模型整合。
下圖概述了 LLM 應用在回應用戶查詢時的流程:首先,相關的數據源被轉換為嵌入向量并存儲在向量數據庫中。LLM 適配器使用用戶查詢和相似性搜索從向量數據庫中找到相關的上下文。相關的上下文被放入 Prompt 中并發送給 LLM 。LLM 將執行這些 Prompt,并使用工具生成回答。有時,LLM 會在特定數據集上進行調優,以提高準確性并降低成本。
LLM 應用的工作流程可以大致分為三個主要階段:
數據準備和嵌入:該階段涉及將機密信息(例如項目備忘錄)保留以供將來訪問。通常,文件會被分割,并通過嵌入模型進行處理,保存在一種特殊類型的數據庫中,稱為向量數據庫。
Prompt 的構建(Formulation)和提取(Extraction):當用戶提交搜索請求(在本例中,搜索項目信息)時,軟件會創建一系列 Prompt,輸入到語言模型中。最終的 Prompt 通常包含由軟件開發人員硬編碼的提示模板,作為 few-shot 示例的有效輸出示例,以及從外部 API 獲取的任何所需數以及向量數據庫中提取的相關文件。
Prompt 的執行和推理:完成 Prompt 后,將它們提供給預先存在的語言模型進行推理,這可能包括專有模型 API、開源或經過個別微調的模型。在此階段,一些開發人員可能還會將操作系統(如日志記錄、緩存和驗證)整合到系統中。
盡管加密領域(Web3)與 Web2 有一些類似的應用,但在加密領域中開發出優秀的 LLM 應用需要尤其謹慎。
加密生態系統獨特,具有其特有的文化、數據和融合性。在這些加密限定的數據集上微調的 LLM 可以以相對較低的成本提供優越的結果。雖然數據豐富可得,但在類似 HuggingFace 等平臺上明顯缺乏開放數據集的。目前,只有一個與智能合約相關的數據集,其中包含 11.3 萬個智能合約。
開發者還面臨將不同工具整合到 LLM 中的挑戰。這些工具與 Web2 中使用的工具不同,它們賦予 LLM 訪問與交易相關的數據、與去中心化應用(Dapp)互動以及執行交易的能力。到目前為止,我們還沒有在 Langchain 中找到任何 Dapp 的集成。
盡管開發高質量的加密 LLM 應用可能需要額外的投入,但 LLM 天然適合加密領域。這個領域提供了豐富的、干凈的、結構化的數據。再加上 Solidity 代碼通常簡潔明了,這使得 LLM 更容易生成功能性的代碼。
在《下部》中,我們將討論 LLM 可以幫助區塊鏈領域的 8 個潛在方向,如:
將內置的人工智能 /LLM 功能集成到區塊鏈中
使用 LLM 分析交易記錄
使用 LLM 識別潛在的機器人
使用 LLM 編寫代碼
使用 LLM 閱讀代碼
使用 LLM 幫助社區
使用 LLM 跟蹤市場
使用 LLM 分析項目
敬請期待!
IOSG Ventures
企業專欄
閱讀更多
金色財經
Web3活動
Techub Info
區塊律動BlockBeats
金色財經 善歐巴
金色早8點
比推 Bitpush News
TaxDAO
SeeDAO見道
WJB
白話區塊鏈
北京時間 8 月 7 日晚,支付巨頭 PayPal 宣布將推出穩定幣 PayPal USD (PYUSD).
1900/1/1 0:00:00作者:Leandro Pereira (Sciammarella) ;翻譯:火火/白話區塊鏈按市值計算的第二大加密貨幣以太坊將對其網絡進行重大升級.
1900/1/1 0:00:00作者:Yonathan Lapchik,CoinDesk;編譯:松雪,金色財經Meme 幣:這個術語在加密社區中既讓人感到有趣,又讓人蔑視.
1900/1/1 0:00:00作者:深潮 TechFlow 清潔工8月15日,當SEI/Cyber正式上線Binance之后,擼毛社群哀嚎遍野,不少人宣稱自己被PUA/反擼,然后迅速達成共識:“國產項目只會PUA,毫無格局.
1900/1/1 0:00:00作者:Jie Xuan Chua,Binance Research整理:深潮 TechFlowTelegram上的各種Bots 代幣,前陣子以驚人的漲幅引起大家注意.
1900/1/1 0:00:00作者:Darren Kleine,blockwork 編譯:善歐巴,金色財經對于一個大規模的公司來說,在區塊鏈領域進行建設,選擇適當的技術堆棧是一項相當重要的決策.
1900/1/1 0:00:00