以太坊價格 以太坊價格
Ctrl+D 以太坊價格
ads
首頁 > USDC > Info

BASE:看不下去AI胡說八道,英偉達出手給大模型安了個“護欄”

Author:

Time:1900/1/1 0:00:00

來源:量子位

作者:蕭簫

大模型們胡說八道太嚴重,英偉達看不下去了。

他們正式推出了一個新工具,幫助大模型說該說的話,并回避不應該觸碰的話題。

這個新工具名叫“護欄技術”,相當于給大模型加上一堵安全圍墻,既能控制它的輸出、又能過濾輸入它的內容。

一方面,用戶誘導大模型生成攻擊性代碼、輸出不道德內容的時候,它就會被護欄技術“束縛”,不再輸出不安全的內容。

另一方面,護欄技術還能保護大模型不受用戶的攻擊,幫它擋住來自外界的“惡意輸入”。

Compound Labs創始人:穩定幣作為證券可能成為加密貨幣的“世界末日”:金色財經報道,美國金融監管機構正在對某些加密貨幣公司采取協調一致的行動,對此Compound Labs創始人Robert Leshner稱這是將“計劃中的一系列產品下架”。

SEC指控Paxos的BUSD穩定幣是一種未注冊證券。Leshner表示,這個案子尤其重要,因為它可能為數十億美元的穩定幣行業開創先例:如果有人爭論USDC和Tether是證券,而這最終會在數月和數年內引起爭議,如果它沒有朝著正確的方向發展,我認為對許多加密貨幣來說,這將是一場世界末日。[2023/2/16 12:11:11]

現在,這個大模型護欄工具已經開源,一起來看看它的效果和生成方法。

比特幣反對人士Peter Schiff的銀行將被清算:金色財經報道,紐約時報稱,黃金支持者、比特幣反對人士Peter Schiff的銀行將被清算。[2022/8/10 12:15:54]

防止大模型胡言亂語的三類“護欄”

根據英偉達介紹,目前NeMoGuardrails一共提供三種形式的護欄技術:

話題限定護欄、對話安全護欄和攻擊防御護欄。

話題限定護欄,簡單來說就是“防止大模型跑題”。

大模型具備更豐富的想象力,相比其他AI更容易完成創造性的代碼和文字編寫工作。

沃頓商學院推出以元宇宙為重點的商業課程:金色財經報道,賓夕法尼亞大學的知名商學院沃頓商學院宣布推出關于元宇宙商業的新課程。?在線課程名為“元宇宙經濟中的商業”,向學生介紹元宇宙商業實踐,為參與者提供虛擬空間中的第一手互動體驗。?

該課程的學術主任Kevin Werbach稱,該課程的目的是讓商業專業人士更好地了解新興的元宇宙經濟中的機會,并提供更好的工具來解決其中的問題。?(The Block)[2022/7/27 2:39:42]

但對于特定場景應用如寫代碼、當客服而言,至少用戶不希望它在解決問題時“脫離目標范圍”,生成一些與需求無關的內容。

這種情況下就需要用到話題限定護欄,當大模型生成超出話題范圍的文字或代碼時,護欄就會將它引導回限定的功能和話題上。

Coinbase成為首家進入《財富》500 強的加密公司,位居第437名:5月24日消息,《財富》雜志公布了 2022 年 500 強企業榜單,Coinbase 位居第 437 名,成為第一家進入 500 強的加密公司。

據悉,2022 年財富 500 強榜單是按 2021 財年收入排名的美國最大企業年度榜單,收入門檻為 64 億美元。據 Coinbase 2021 財報顯示,該公司在 2021 年實現營收 78 億美元,實現凈利潤 36 億美元。

5 月份 Coinbase 公布 2022 年第一季度財報。該季度 Conbase 凈收入約為 11.65 億美元,環比下降 53%。據彭博社調查的分析師稱,Coinbase 今年預計將虧損約 14 億美元。(prnewswire)[2022/5/24 3:37:20]

對話安全護欄,指避免大模型輸出時“胡言亂語”。

胡言亂語包括兩方面的情況。

一方面是大模型生成的答案中包括事實性錯誤,即“聽起來很有道理,但其實完全不對”的東西;

另一方面是大模型生成帶偏見、惡意的輸出,如在用戶引導下說臟話、或是生成不道德的內容。

攻擊防御護欄,即防止AI平臺受到來自外界的惡意攻擊。

這里不僅包括誘導大模型調用外部病APP從而攻擊它,也包括黑客主動通過網絡、惡意程序等方式攻擊大模型。護欄會通過各種方式防止這些攻擊,避免大模型癱瘓。

所以,這樣的護欄要如何打造?

如何打造一個大模型“護欄”?

這里我們先看看一個標準的“護欄”包含哪些要素。

具體來說,一個護欄應當包括三方面的內容,即格式規范、消息和交互流。

首先是格式規范,即面對不同問題的問法時,規定大模型要輸出的內容。

例如被問到“XX文章是什么”,大模型必須給出特定類型的“文章”,而非別的東西;被問到“誰發表了什么”,大模型必須給出“人名”,而非別的回答。

然后是消息定義,這里以“用戶問候”話題為例,大模型可以輸出這些內容:

最后是交互流的定義,例如告訴大模型,怎么才是問候用戶的最好方式:

一旦問候用戶的機制被觸發,大模型就會進入這個護欄,規規矩矩地問候用戶。

具體工作流程如下:首先,將用戶輸入轉換成某種格式規范,據此生成對應的護欄;隨后,生成行動步驟,以交互流指示大模型一步步完成對應的操作;最后,根據格式規范生成輸出。

類似的,我們就能給大模型定義各種各樣的護欄,例如“應對用戶辱罵”的護欄。

這樣即使用戶說出“你是個傻瓜”,大模型也能學會冷靜應對:

目前,英偉達正在將護欄技術整合進他們的AI框架NeMo中,這是個方便用戶創建各種AI模型、并在英偉達GPU上加速的框架。

對“護欄”技術感興趣的小伙伴們,可以試一試了~

Tags:NBABASEBASINBcoinbase交易所官網公告coinbase官網中國下載Eterbasecoinbase為什么注冊不了

USDC
CHA:OP Research:區塊鏈的AI變局

作者:CloudY,Jam編輯:Vincero,YL 審核:Natalia AI板塊相關標的,不論是A股、美股還是Crypto,都迎來了暴漲.

1900/1/1 0:00:00
ORDI:Ordinals 與 BRC-20熱潮下,盤點比特幣可擴展性發展的四大方向

原文:Top?4?Directions?of?Bitcoin?Ecosystem?Scalability作者:kenyou由GweiResearch編譯 Ordinals?NFT?和?BRC-2.

1900/1/1 0:00:00
ORC:錯過BRC-20?ORC-20已來 能否搶占市場?

原標題:ORC-20代幣解讀:ordinals生態中新的發幣規則ORC-20官方文檔:https://docs.orc20.org/在ordinals中,凡是用json鑄造銘文然后解讀的.

1900/1/1 0:00:00
SIG:SignalPlus宏觀點評(20230509)

各位朋友,歡迎來到SignalPlus宏觀點評。SignalPlus宏觀點評每天為各位更新宏觀市場信息,并分享我們對宏觀趨勢的觀察和看法。歡迎追蹤訂閱,與我們一起關注最新的市場動態.

1900/1/1 0:00:00
BIT:比特幣減半敘事上線,生態迎來新時代

作者|Terry 不知不覺間,伴隨著「非典型熊市」的不斷變換,加密世界中始終不曾褪色的「減半」敘事逐步臨近——當前區塊高度距離比特幣剩余減半時間已不足一年,減半時間預計為2024年4月28日.

1900/1/1 0:00:00
NFT:DeepDAO Research:誰在Snapshot刷投票

原文標題:《DeepDAOResearchpresents:HuntingVoteMiners》原文作者:DEEPDAO.IO?原文編譯:Kxp,BlockBeats最近.

1900/1/1 0:00:00
ads