以太坊價格 以太坊價格
Ctrl+D 以太坊價格
ads

ROM:BuidlerDAO x KNN3:大型語言模型使用經驗

Author:

Time:1900/1/1 0:00:00

作者:@於方仁 @Caroline Sun

編排:@黑羽小斗

LLM

大型語言模型(LLM, Large Language Model)是利用海量的文本數據進行訓練海量的模型參數。大語言模型的使用,大體可以分為兩個方向:

A. 僅使用

B. 微調后使用

僅使用又稱 Zero-shot,因為大語言模型具備大量通用的語料信息,量變可以產生質變。即使 Zero-shot 也許沒得到用戶想要的結果,但加上合適的 prompt 則可以進一步獲取想要的知識。該基礎目前被總結為 prompt learning。

大語言模型,比較流行的就是 BERT 和 GPT。從生態上講 BERT 與 GPT 最大的區別就是前者模型開源,后者只開源了調用 API ,也就是目前的 ChatGPT。

兩個模型均是由若干層的 Transformer 組成,參數數量等信息如下表所示。

目前生態上講,BERT 多用于微調場景。因為微調必須在開源模型的基礎上,GPT 僅開源到 GPT2 的系列。且相同模型參數量下 BERT 在特定場景的效果往往高于 GPT,微調需要調整全部的模型參數,所以從性價比而言,BERT 比 GPT 更適合微調。

而 GPT 目前擁有 ChatGPT 這種面向廣大人民群眾的應用,使用簡單。API 的調用也尤其方便。所以若是僅使用 LLM,則 ChatGPT 顯然更有優勢。

ChatGPT Prompt

趙長鵬回應幾位高管離職:每家公司都有人員流動,將持續BUILD和招聘:7月7日消息,趙長鵬回應《財富》雜志有關幣安幾位高管離職的報道稱,關于一些離職FUD,新聞給出的理由是完全錯誤的。隨著加密貨幣的市場和全球環境的變化,隨著幣安的發展以及個人情況的變化,每家公司都有人員流動。幣安將持續BUILD,并繼續招聘。感謝所有前團隊成員為幣安的成長做出的貢獻,并祝愿他們一切順利。

此前,《財富》雜志稱,幣安幾位高管離職的原因是對司法部正在對趙長鵬和幣安進行的調查的回應。《財富》表示,此前有傳言稱美國司法部即將對幣安和趙長鵬提起刑事訴訟。[2023/7/7 22:22:43]

下圖是 OpenAI 官方提出對于 ChatGPT 的 prompt 用法大類。

Figure 1. Prompt Categories by OpenAI 

每種類別有很多具體的范例。如下圖所示:

Figure 2. Prompt Categories Examples by OpenAI

除此以外,我們在此提出一些略微高級的用法。

高級分類

這是一個意圖識別的例子,本質上也是分類任務,我們指定了類別,讓 ChatGPT 判斷用戶的意圖在這

Flashbots工程師:所有共識客戶端均實施、測試并確認builder-specs集成:9月6日消息,Flashbots工程師Chris Hager在社交媒體發文表示,Flashbots實現了MEV-Boost的另一個里程碑事件,所有共識客戶端都實施、測試并確認了builder-specs的集成,現在可將MEV-Boost與任何客戶端一起使用。MEV-Boost是由Flashbots構建的提議者-構建者分離(proposer-builderseparation,PBS)的實現,用于以太坊權益證明。MEV-Boost旨在與標準Ethereum Builder API兼容,這意味著它與所有共識和執行客戶端兼容。運行MEV-Boost的驗證者通過向開放的builder出售區塊空間來最大化其質押獎勵。[2022/9/6 13:11:45]

Figure 3. Prompt Examples

實體識別與關系抽取

利用 ChatGPT 做實體識別與關系抽取輕而易舉,例如給定一篇文本后,這么像它提問。

Figure 4. Example Text Given to ChatGPT

這是部分結果截圖:

Figure 5. Partial Output from given Text on ChatGPT

之后可以追問給他們的關系,例如:

Paxful與Built With Bitcoin Foundation共同向非營利性組織人權基金會捐款:9月15日消息,點對點金融科技平臺Paxful宣布將向非營利性組織人權基金會捐款。Paxful將與Built With Bitcoin Foundation一起進行捐贈。后者是一個人道主義組織,所有這些都由加密貨幣提供支持。這筆捐款將為Qala Fellowship提供資金,該項目旨在尋找和培養尼日利亞當地人才,從開發人員開始,在比特幣領域發展職業生涯。Qala Fellowship目前正在接受申請,旨在吸引更多非洲開發人員從事比特幣工作,建立自己的公司,為開源做貢獻,以及/或在不同的公司從事比特幣工作。開發人員還將獲得每月的津貼,以便專注于課程工作。(Sun News Online)[2021/9/15 23:26:31]

Figure 6.Asking relationship on ChatGPT

這樣,一個大型的知識圖譜便可輕松建立。

分析任務

如下圖所示,我對 ChatGPT 提出了分析我目前需求的問題。

Figure 7. Result for needs request on ChatGPT

甚至還能讓它給定分數。

LBank即將上線ANT和BUIDL交易:據悉,LBank將于2020年7月30日18:30(UTC+8)上線ANT/USDT、BUIDL/USDT交易對。并于7月30日18:00開啟充值,31日開啟提現。

為慶祝此次上線,LBank將于7月31日16:30 啟動針對ANT、BUIDL的站內流動性挖礦活動。用戶通過在指定交易對盤口的前10檔掛單來獲得獎勵系數,并在隔日瓜分200枚 ANT,每日一輪,連續7天。更多詳情請關注LBank官網公告。[2020/7/30]

Figure 8. Scoring to evaluate the identified needs

除此以外還有數不勝數的方式,在此不一一列舉。

組合Agent

另外,我們在使用 ChatGPT 的 API 時,可以將不同的 prompt 模板產生多次調用產生組合使用的效果。我愿稱這種使用方式叫做,組合 Agent。例如 Figure 1 展示的是一個大概的思路。

Figure 9.  The Paradigm of the Combination Agent

具體說來,例如是一個輔助創作文章的產品。則可以這么設計,如 Figure 10 所示。

Figure 10. Agent combination for assisting in creation

動態 | 日本BUIDL公司推出面向加密貨幣交易所的洗錢對應工具SHIEDL:據Crypto Watch消息,5月30日,日本BUIDL公司推出了面向加密貨幣交易所的AML/CFT對應工具SHIEDL。該工具可計算出區塊鏈地址的風險分數,并通過API提供,該工具可防范洗錢風險較大的用戶的洗錢行為。目前該工具只能用于BTC、ETH、XRP三個幣種,今后將逐漸應對ERC-20及其他加密貨幣。[2019/5/30]

假設用戶輸入一個請求,說“幫我寫一篇倫敦游記”, 那么 Intent Recognition Agent 首先做一個意圖識別,意圖識別也就是利用 ChatGPT 做一次分類任務。假設識別出用戶的意圖是文章生成,則接著調用 Article Generate Agent。

另一方面,用戶當前的輸入與歷史的輸入可以組成一個上下文,輸入給 Chat Context Analyze Agent。當前例子中,這個 agent 分析出的結果傳入后面的 AI Reply Agent 和 Phase Control Agent的。

AI Reply Agent 就是用來生成 AI 回復用戶的語句,假設我們的產品前端并不只有一個文章,另一個敵方還有一個框用來顯示 AI 引導用戶創作文章的語句,則這個 AI Reply Agent 就是用來干這個事情。將上下文的分析與文章一同提交給 ChatGPT,讓其根據分析結果結合文章生成一個合適的回復。例如通過分析發現用戶只是在通過聊天調整文章內容,而不知道 AI 還能控制文章的藝術意境,則可以回復用戶你可以嘗試著對我說“調整文章的藝術意境為非現實主義風格”。

Phase Control Agent 則是用來管理用戶的階段,對于 ChatGPT 而言也可以是一個分類任務,例如階段分為[文章主旨,文章風格,文章模板,文章意境]等等。例如 AI 判斷可以進行文章模板的制作了,前端可以產生幾個模板選擇的按鈕。

使用不同的 Agent 來處理用戶輸入的不同任務,包括意圖識別、Chat Context 分析、AI 回復生成和階段控制,從而協同工作,為用戶生成一篇倫敦游記的文章,提供不同方面的幫助和引導,例如調整文章的藝術意境、選擇文章模板等。這樣可以通過多個 Agent 的協作,使用戶獲得更加個性化和滿意的文章生成體驗。 

Prompt 微調

LLM 雖然很厲害,但離統治人類的 AI 還相差甚遠。眼下有個最直觀的痛點就是 LLM 的模型參數太多,基于 LLM 的模型微調變得成本巨大。例如 GPT-3 模型的參數量級達到了 175 Billion ,只有行業大頭才有這種財力可以微調 LLM 模型,對于小而精的公司而言該怎么辦呢。無需擔心,算法科學家們為我們創新了一個叫做 prompt tuning 的概念。

Prompt tuning 簡單理解就是針對prompt進行微調操作,區別于傳統的 fine-tuning,優勢在于更快捷, prompt tuning 僅需微調 prompt 相關的參數從而去逼近 fine-tuning 的效果。

Figure 11. Prompt learning

什么是 prompt 相關的參數,如圖所示,prompt tuning 是將 prompt 從一些的自然語言文本設定成了由數字組成的序列向量。本身 AI 也會將文本從預訓練模型中提取向量從而進行后續的計算,只是在模型迭代過程中,這些向量并不會跟著迭代,因為這些向量于文本綁定住了。但是后來發現這些向量即便跟著迭代也無妨,雖然對于人類而言這些向量迭代更新后在物理世界已經找不到對應的自然語言文本可以表述出意思。但對于 AI 來講,文本反而無意義,prompt 向量隨著訓練會將 prompt 變得越來越符合業務場景。

假設一句 prompt 由 20 個單詞組成,按照 GPT3 的設定每個單詞映射的向量維度是12288,20個單詞便是245760,理論上需要訓練的參數只有245760個,相比175 billion 的量級,245760這個數字可以忽略不計,當然也會增加一些額外的輔助參數,但同樣其數量也可忽略不計。

問題來了,這么少的參數真的能逼近 fine tuning 的效果嗎,當然還是有一定的局限性。如下圖所示,藍色部分代表初版的 prompt tuning, 可以發現 prompt tuning 僅有在模型參數量級達到一定程度是才有效果。雖然這可以解決大多數的場景,但在某些具體垂直領域的應用場景下則未必有用。因為垂直領域的微調往往不需要綜合的 LLM 預訓練模型,僅需垂直領域的 LLM 模型即可,但是相對的,模型參數不會那么大。所以隨著發展,改版后的 prompt tuning 效果可以完全取代 fine-tuning。下圖中的黃色部分展示的就是 prompt tuning v2 也就是第二版本的 prompt tuning 的效果。

Figure 12. Prompt learning parameters

V2 的改進是將原本僅在最初層輸入的連續 prompt 向量,改為在模型傳遞時每一個神經網絡層前均輸入連續 prompt 向量,如下圖所示。

Figure 13. Prompt learning v2

還是以 GPT3 模型為例,GPT3 總從有96層網絡,假設 prompt 由20個單詞組成,每個單詞映射的向量維度是12288,則所需要訓練的參數量 = 96 * 20 * 12288 =23592960。是175 billion 的萬分之1.35。這個數字雖不足以忽略不計,但相對而言也非常小。

未來可能會有 prompt tuning v3, v4 等問世,甚至我們可以自己加一些創新改進 prompt tuning,例如加入長短期記憶網絡的設定。(因為原版的 prompt tuning v2 就像是一個大型的 RNN, 我們可以像改進RNN 一般去改進prompt tuning v2)。總之就目前而言,prompt tuning 使得微調 LLM 變得可行,未來一定會有很多垂直領域的優秀模型誕生。

總結

Large Language Models (LLMs) 和 Web3 技術的整合為去中心化金融(DeFi)領域帶來了巨大的創新和發展機遇。通過利用 LLMs 的能力,應用程序可以對大量不同數據源進行全面分析,生成實時的投資機會警報,并根據用戶輸入和先前的交互提供定制建議。LLMs 與區塊鏈技術的結合還使得智能合約的創建成為可能,這些合約可以自主地執行交易并理解自然語言輸入,從而促進無縫和高效的用戶體驗。

這種先進技術的融合有能力徹底改變 DeFi 領域,并開辟出一條為投資者、交易者和參與去中心化生態系統的個體提供新型解決方案的道路。隨著 Web3 技術的日益普及,LLMs 創造復雜且可靠解決方案的潛力也在擴大,這些解決方案提高了去中心化應用程序的功能和可用性。總之,LLMs 與 Web3 技術的整合為 DeFi 領域提供了強大的工具集,提供了有深度的分析、個性化的建議和自動化的交易執行,為該領域的創新和改革提供了廣泛的可能性。

參考文獻

金色薦讀

金色財經 善歐巴

Chainlink預言機

區塊律動BlockBeats

白話區塊鏈

金色早8點

Odaily星球日報

歐科云鏈

MarsBit

深潮TechFlow

Tags:ROMPROOMPMPTROMEODOGE價格pros幣世界杯comp幣發行量JMPT幣

幣安交易所app下載
ETH:為什么 EigenLayer 讓我們興奮

地平線上似乎出現了一個新的“紀元”。在加密之旅中,每隔一段時間,開拓者就會發現一種新的原語,從而改變整個行業的格局.

1900/1/1 0:00:00
DEF:DeFi 挖礦、杠桿交易?深入挖掘加密億萬富翁和大佬們的鏈上活動

加密研究員 Hoeem 最近總結了一些加密億萬富翁和交易大佬在鏈上的活動,涉及杠桿交易、DeFi 挖礦等.

1900/1/1 0:00:00
ELAN:金色觀察 | Multicoin Capital:讀懂web3原生SQL項目Tabeland

作者:Kyle Samani,Multicoin Capital聯合創始人;翻譯:金色財經xiaozou繼比特幣之后的第一波加密創新浪潮中,很多開發人員分叉了比特幣代碼庫.

1900/1/1 0:00:00
EFI:DeFi牛市發動機:LSD如何引領史詩級狂暴大牛市

文章作者:0xShadow文章編譯:Block unicornLSD 將是DeFi生態系統的催化劑,通過合理利用LSD資本效率,可以撬動ETH的資產杠桿.

1900/1/1 0:00:00
比特幣:熊市并未結束?12張圖解讀加密行業“迷之四月”

在經歷了表現不俗的2023年一季度后,加密行業并未繼續高歌猛進,4月份再次陷入低迷,有人認為熊市并未完全結束,但也有人認為或許只是暫時市場修正,并不會影響長期發展.

1900/1/1 0:00:00
UNI:"莊家"互撕 曝出加密巨頭拉的那些"幫派"

如果談到最近哪家投資機構最為風頭無兩,那非 DWF Labs 莫屬——幾乎是以每月定投的形式大筆向外撒錢,憑借頻繁大手筆的投資而強勢殺入大家的視野之中.

1900/1/1 0:00:00
ads