GPT-4發布一天之后,壓力全部給到百度這邊。
就在剛剛,百度交卷。
文心一言,百度全新一代知識增強大語言模型,正式在百度總部會議室里發布。
在一片靜寂的氛圍里,李彥宏小步登場,語氣里帶著點緊張:
大家的期望值,是我們對標ChatGPT,對標GPT-4,這個門檻有點高(笑)。
十月懷胎,我們就帶大家來看看這個AI大模型文心一言長什么樣。
此前,有人狂轉meme圖把百度比作GPT-4旁邊的垃圾箱。
也有人鼓吹百度是全村的希望。
而在發布會進行的同時,百度港股市值大幅下跌,相關話題還沖上了微博熱搜。
但直播彈幕中也有網友點贊:
那么這個中國版ChatGPT到底實力如何?
咱們就用百度發布會演示的預錄制Demo,對比一下嶄新出爐的GPT-4,先憑實力說話。
文心一言 vs GPT-4
和GPT-4一樣,文心一言是一個多模態大模型。
李彥宏開場就展示了文心一言具備的5種能力,包括文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成。
文心一言甚至還現場秀了一口接地氣的四川話,現場網友發出一片笑聲:
其他能力如何?我們具體展開來看。
特斯拉官網付款頁面源代碼出現“BITCOIN”字眼,暫無法確認是否為新增:7月20日消息,據特斯拉官網頁面顯示,其支付頁面源代碼中出現“BITCOIN”字眼,暫無法確認是否為新增。此外,特斯拉此前曾在支付頁面源代碼中加入“doge”相關字眼,但最終僅支持用于購買周邊商城產品。
此前消息,特斯拉曾于2021年3月24日宣布支持比特幣支付購車,此后于同年5月13日表示取消支持該支付手段。[2023/7/20 11:06:57]
在文學創作上,李彥宏一開場就搬出了《三體》作者劉慈欣坐鎮。
先讓文心一言介紹一下大劉,畢竟我也是劉慈欣老鄉嘛:
看起來沒什么問題。同樣的問題問問GPT-4呢?
嗯???直接把劉慈欣的老家挪到了湖北省洪湖市。湖北人狂喜。
隨后,李彥宏又展示了從哲學的角度對這段文章進行續寫的demo:
看起來中規中矩,比較理性。老樣子,我們也來與GPT-4進行一波對比:
這波你是想看GPT-4續寫的《三體》,還是文心一言的?
再來看看《三體》電視劇中扮演史強和汪淼的老搭檔,于和偉和張魯一,有什么共同點?
比特幣閃電網絡節點數量為16,384個:金色財經報道,1ML數據顯示,當前比特幣閃電網絡節點為16,384個,過去30天增加1.22%;通道數量為75,612個,較一個月前減少了0.8%;網絡容量為5,413.88枚BTC,月漲1%。[2023/3/21 13:16:02]
也沒什么問題。
就是看起來展示的速度有點快,比李彥宏的語速還要快上那么一點點(手動狗頭)。
接下來,李彥宏又展示了一下文心一言在商業文案創作上的能力。
比如給新公司起個名字。
并且這個名字它還不是瞎起的:
再來看看GPT-4起名的效果?
看起來,GPT-4對中文的掌控能力相比之下還是少了一點精髓。
至于寫個公司成立的新聞稿?對文心一言來說似乎也不成問題:
數學能力,是考驗生成式大模型的一大難題。ChatGPT剛上線時,也翻了不少車。
不過在現場,文心一言處理的數學問題不算復雜,是小學數學競賽常見的雞兔同籠問題。
烏克蘭商業銀行發布TASCOMBANK發布Stellar運行數字貨幣試點報告:1月13日消息,烏克蘭商業銀行發布TASCOMBANK發布Stellar運行數字貨幣試點報告,報告向烏克蘭國家銀行和烏克蘭數字化轉型部強調在區塊鏈上發行電子貨幣的優勢,包括在所有流通階段和所有交易參與者之間透明度和問責制,低交易成本、即時支付功能以及高吞吐量區塊鏈平臺,還可以提高客戶數據的安全性和機密性。
據悉,2021年12月,恒星幣發展基金會宣布,恒星幣區塊鏈將用于試點烏克蘭國家貨幣格里夫納的電子版本。該試點由金融科技公司Bitt和TASCOMBANK進行,將由該國中央銀行在數字化轉型部的鼓勵下進行監督。[2023/1/13 11:10:07]
彩蛋是,李彥宏現場展示的第一題,引得文心一言說出了《狂飆》里高啟盛的經典臺詞:這題出得不對。
修改一下題目,OK,再扔給文心一言試試:
看起來,答案還算是有理有據,一步步邏輯推理出來的那種。
李彥宏表示,這些題不敢說百分之一百能做對,但至少體現了文心一言的思考歷程。
接下來,李彥宏著重展示了一下文心一言對中文的理解能力,并特意強調:
文心一言對中國文化的了解,理應超出任何一個預訓練大模型。
一上來就是一個成語,洛陽紙貴到底有多貴?
這是文心一言的效果展示:
中非共和國開始公開發售Sango Coin:金色財經報道,根據Sango項目網站上的詳細信息,中非共和國(CAR)的國家加密貨幣 Sango Coin 現已發售。公開發售于周一開始,以 0.10 美元的價格購買2億枚 Sango Coin。據該網站稱,最終上市價格為0.45美元。想要購買代幣的人需要至少 100 美元的主流加密貨幣。這些代幣是BTC、ETH、BNB、USDT、USDC、BUSD和Dai。此次銷售支持在以太坊 ERC-20 和幣安智能鏈網絡上轉移這些代幣。該項目已經規定了參與這一輪的最低金額為 500 美元,但由于潛在買家的投訴,該項目被迫降低了入場要求。
截至發稿時,Sango 項目已售出 5.25% 的代幣。這意味著該項目在公開發售的前 24 小時內籌集了超過 100 萬美元的資金。該項目計劃通過為期一年的代幣銷售籌集超過 10 億美元。在此公開銷售階段購買的 Sango Coin有一年的鎖定要求。因此,在鎖定期結束之前,買家不能撤回或轉移他們的代幣。(the block)[2022/7/27 2:39:46]
還解釋了一下這個成語背后的經濟學原理:
那么,將這個問題拋給GPT-4呢?首先問問它,知不知道洛陽紙貴是什么意思:
接下來,再問問他對應的經濟學理論是什么:
這波看起來,GPT-4的中文理解似乎也不輸文心一言啊。
那么,再來看看二者寫藏頭詩的能力?
首先是文心一言的效果展示:
Cardano開發團隊即將推出首款輕錢包“Lace”:6月22日消息,Cardano開發團隊Input Output開發了一款新的輕錢包“Lace”。據開發團隊介紹,這款新錢包具有許多功能,允許用戶在同一處主要管理、控制以及存儲他們的加密貨幣。
該錢包還將允許用戶將他們的NFT保存在同一個地方,這將幫助用戶在一個錢包中管理他們的所有數字資產,而無需依賴第三方解決方案。
據悉,Lace是在Input Output的側鏈解決方案的幫助下打造的,目前開發人員正專注于將引入Cardano和以太坊網絡之間的互操作性。目前,這項新舉措仍處于測試階段,很快將進入部署階段。(Bitcoinist)[2022/6/22 5:04:35]
接下來,我們再看看GPT-4怎么說:
誒,看起來反而是GPT-4沒有真正理解藏頭詩的含義。
這波文化理解上,屬實是文心一言小勝一籌了。
不過在英文上,李彥宏也承認,雖然文心一言也能處理,但能力是顯著不如中文的。
這也和百度目前能用到的訓練數據有關。
最后,李彥宏還簡單展示了一下文心一言多模態生成的能力。
首先來看看,為即將到來的2023世界智能交通大會創作海報。
而除了前文展示過的文字轉四川話能力,文心一言還能文字轉視頻。
李彥宏一句指令,將以上內容生成視頻,很快啊,不到幾秒鐘,文心一言就把字幕和視頻做好了:
有些遺憾的是,在ChatGPT被頻頻稱贊的編程方面,文心一言并沒有現場展示相關能力。
但王海峰透露,文心一言的訓練數據中同樣包括代碼。
正如ChatGPT脫胎于OpenAI的GPT系列,百度這次推出的文心一言(ERNIE Bot),背后也正是基于文心大模型技術打造。
據王海峰介紹,文心一言主要脫胎于兩大模型:
百度ERNIE系列知識增強千億大模型,以及百度大規模開放域對話模型PLATO。
在此基礎上,主要采用了六項核心技術。
其中三個是廣為人知的大模型技術,包括有監督精調、人類反饋強化學習(RLHF)和提示構建。
p.s. 人類反饋強化學習也是ChatGPT的關鍵技術。
另外三個,則是百度比較有特色的技術,包括知識增強、檢索增強和對話增強技術。
首先來看與ChatGPT類似的技術:有監督精調、RLHF和提示構建。
有監督精調,尤其指中文方面的數據精調。百度基于對中國語言文化和中國應用場景的理解,篩選了特定的數據來訓練模型。
至于人類反饋的強化學習(RLHF)和提示構建,操作上也與ChatGPT大差不差。
隨后是百度提出的、用于進一步改善模型效果的技術。
知識增強,包括知識內化和知識外用兩個部分。其中,知識內化即將知識滲透進模型參數中;知識外用指的是模型可以直接使用外部的知識。
檢索增強,則與百度搜索引擎積累的檢索技術有關。
百度將把檢索技術和生成技術結合起來,先對內容進行檢索后,將比較有用的部分用于生成,再整合輸出結果:
最后是對話增強部分,包括之前百度積累的記憶機制、上下文理解和對話規劃等技術:
概括來看,文心一言表現出的能力,被李彥宏稱為智能涌現:當參數達到千億量級,訓練語料達到足夠多的情況下,這種現象就會發生。
目前,百度擁有的AI技術可以分為四個部分,芯片(昆侖芯)、框架(飛槳)、模型(文心)和應用。
之所以軟硬件都要布局,百度稱,是為了降低成本:生成式AI需求的算力非常高,費用相當昂貴。
因此,如果在四層架構之間相互進行協同優化,就能讓它的效率比別人更高,從而顯著降低成本。
李彥宏認為,這也正是百度的優勢所在:四層都有領先產品的公司,絕無僅有。
這次文心大模型背后的硬件算力,也是通過百度智能云提供服務。
目前,文心一言已經接入百度搜索,目的在于提升搜索資源效率。
同時,包括小度和自動駕駛Apollo等產品,以及愛奇藝等公司也已經接入百度的文心一言模型。
網友:看來還不用提前退休
截至發稿,百度港股股價在一波明顯下跌之后,有所回彈。
發布會結束,網友反應最多的是提前錄制有點敗好感:
對于這一點,李彥宏的解釋是,給出的問題都比較長,為了節約現場時間,所以才用了提前錄制的形式。
還有不少網友對文心一言展示出的能力不太滿意。有人調侃,看完之后感覺提前退休的日子看起來還可以緩一緩:
離GPT-4還差了20個老胡。
還有網友感覺,文心一言的發布會像極了畢業答辯的自己(doge):
不過也有網友表示,希望能給國產產品一點時間一點耐心。
發布會末尾,王海峰宣布,文心一言將從今天開始對外進行測試,包括個人用戶和企業用戶。
是騾子是馬,相信接下來,會得到更多驗證。
對了,有網友表示,已經拿到了文心一言的內測資格:
你好,感謝您體驗文心一言,體驗地址: https://yiyan.baidu.com/welcome,希望您在體驗當中給予更多意見,文心一言邀請碼:KFCVME50RMB,2023年3月16日24:00前有效。
嗯,萬物瘋狂星期四。
量子位
個人專欄
閱讀更多
金色財經 善歐巴
金色早8點
白話區塊鏈
Arcane Labs
Odaily星球日報
MarsBit
歐科云鏈
深潮TechFlow
BTCStudy
作者:Maverick 在 Arbitrum 空投的隔天,另一個被戲稱為四大天王的 Layer 2 項目 zkSync 正式發布了其 V2 網絡 zkSync Era.
1900/1/1 0:00:00NFT 市場平臺 MOOAR 今日正式上線了 Web3 AIGC 工具 GNT V1 公測版,這是一款生成式 NFT 工具,目前只在 Solana 網絡可用.
1900/1/1 0:00:00金色周刊是金色財經推出的一檔每周區塊鏈行業總結欄目,內容涵蓋一周重點新聞、礦業信息、項目動態、技術進展等行業動態。本文是其中的新聞周刊,帶您一覽本周區塊鏈行業大事.
1900/1/1 0:00:00DeFi數據 1、DeFi代幣總市值:488.29億美元 DeFi總市值及前十代幣 數據來源:coingecko2、過去24小時去中心化交易所的交易量18.
1900/1/1 0:00:00按照是否隔絕中心化風險來劃分陣營,穩定幣可分為中心化穩定幣與去中心化穩定幣。只要不是完全去中心化風險,穩定幣就一定面臨由中心化帶來的違約風險.
1900/1/1 0:00:00TL;DR ?Offchain Labs、Arbitrum基金會和Nansen共同設計了一個代幣分配模型.
1900/1/1 0:00:00