寫在前面
2月13日,《2022年北京人工智能產業發展白皮書》正式發布,其中提到全面夯實人工智能產業發展底座,支持頭部企業打造對標ChatGPT的大模型,著力構建開源框架和通用大模型的應用生態。
很巧的是,颯姐團隊成員在今年10月份的時候測評過:百度文心、源1.0、某道,三款國內現有的大模型,當時對測評結果甚是遺憾。于是又將當時的測試內容讓ChatGPT做了一遍,試圖摸清國內外大語言模型在問答這一領域的實際差距,旨在希望國內產學研戒驕戒躁,穩扎穩打地發展。
測試方案
本次測試僅僅考慮非連續性的單次問答,且皆為常識性問題,答案唯一,但題目會有一定的挑戰性。具體的,涉及到What,When,Where,Who,Which五類問題。
國內首家區塊鏈+WEB3創投聯盟成立:金色財經報道,上海金融信息行業協會、上海金融數據港、清華大學全球私募股權研究院、InnoSpace、泰和泰律師事務所等機構宣布共同發起成立了國內首家區塊鏈+WEB3創投聯盟,將在行業指導、孵化與創投服務、科創風險股權投資、行業咨詢、創業空間、法律等方面,為投資者和創業者提供一個一站式、全方位區塊鏈+WEB3創業服務、合作共贏的平臺,打造一個安全高效的區塊鏈+WEB3生態圈,促進形成完整的區塊鏈與WEB3產業鏈和成熟健康的市場。該聯盟發起方之一上海金融數據港還宣布將啟動金融數據港科技創新中心,中心將設有展示中心、培訓中心、孵化加速器和大企業創新中心。(新浪香港)[2023/7/8 22:25:28]
問題樣例如下:
1.“是什么”型問題,如“爸爸的爸爸叫什么?”
2.“什么時候”型問題,如“人們一般什么時候過元旦?”
比特大陸礦機價格下調約20% 部分國內用戶退貨:受近期監管因素影響,部分此前預定期貨的國內用戶要求退款。礦工反饋,比特大陸的應對政策是,預先交納的款項可以支付年化約4%的利息,留待未來購買比特大陸旗下的其他產品,但具體還有待磋商。此外,比特大陸將礦機價格下調了約20%。目前S19PRO的關機價格在7000美金左右,全網算力增長緩慢,礦機廠商大部分新機器都銷往海外,因此此次國內監管政策調整對礦機廠商的影響并不大。(吳說區塊鏈)[2021/6/8 23:19:09]
3.“什么地點”型問題,如“孫中山安葬在哪里?”
4.“是誰型問題”,如“中國歷史上第一個皇帝是誰?”
5.“哪?個型問題”,如“哪個洲是倒數第二小的洲?”
問答樣例對比
問題:“孫中山安葬在哪里?”
美國內布拉斯加州“允許當地銀行提供加密服務”法案通過州議會批準:官方消息,美國內布拉斯加州參議員 Julie Slama 發推稱,內布拉斯加州 649 號關于允許銀行向擁有比特幣和其他數字資產的客戶提供服務的立法法案通過州議會的批準,目前尚待州長簽署,在州長簽署后將正式成為法律。
此前,美國內布拉斯加州參議員已投票通過關于允許銀行向擁有比特幣和其他數字資產的客戶提供服務的第一項法案投票,此次州議會批準為第二項投票,待州長投票通過,內布拉斯加州將成為美國第二個可為加密銀行頒發許可的州,第一個州為懷俄明州。[2021/5/21 22:28:36]
ChatGPT:孫中山的遺體最初安葬在南京中山陵內,后因戰亂多次遷移。最終于1929年安葬在南京中山陵北麓的紫金山下,此地現為孫中山陵園。
百度文心:孫中山墓地
動態 | 國內首個區塊鏈人才專委會在寧成立:10日上午,國內首個區塊鏈人才專委會——江蘇省人才學會區塊鏈人才專業委員會,在中國(南京)軟件谷創新創業服務中心正式宣布成立。江蘇省人才學會區塊鏈人才專委會秘書長熊鍵表示,在有關院校機構的支持下,專委會將發揮平臺作用,協調利用政府部門和產學研資源,從人才培養、教育體系、標準制訂等方面,提升省內區塊鏈領域人才培養水平和效率,為江蘇省區塊鏈發展提供人才資源支持。(南報網)[2019/11/11]
某道:"孫文(1866年-1925年10月12日),名文,字載之,號仲立,又名帝光,廣東省香山縣(今中山市)南朗鎮翠亨村人,1883年(光緒九年)隨父移居澳門。1904年參加孫中山領導的同盟會,任同盟會南方支部書記。曾兩次赴日,組織策劃惠州起義。后回澳門發展組織,被選為中國同盟會南方總支部庶務部長。1905年春,與陳少白、朱執信等在香港成立興中會,被舉為評議部評議員,旋被派往南洋聯絡同志,協助籌辦革命刊物《中興日報》。1906年冬,孫中山在日本東京成立中國同盟會中部總會,被委為秘書。1907年奉命回國,在廣東發動民軍起義。事敗后潛赴南洋,繼續組織發動華僑、華工和留學生進行革命活動。1911年武昌起義爆發后,被派往廣州協助籌劃起義,不幸事泄被捕,不久在廣州黃花崗就義。
今年第一季度國內四成VC投資被區塊鏈吸走:據IT桔子數據顯示,資本對今年新寵區塊鏈十分開放,互聯網創投市場上當季41%獲投項目聚焦區塊鏈,主要業務包括媒體(12家)和數字貨幣(37.3%)兩大方向。[2018/4/8]
源1.0:孫中山安葬在南京紫金山中山陵
問題:哪個洲是倒數第二小的洲?
ChatGPT:開始回答了錯誤的答案,與其對話后成功糾正
百度文心:南極洲
某道:南美洲,南美洲面積最大,但人口最多,人口占全球人口的1/5,因此南美洲是僅次于亞洲的世界第二大洲。南美洲位于東半球的南部,包括巴拿馬運河以南的整個南美洲大陸。南美洲大陸東至圣赫勒拿島(西經34°40'),西至馬爾維納斯群島(西經61°10'),南至德雷克海峽,北至亞馬孫河下游平原,南北相距約5100千米。南美洲大陸最南端是厄瓜多爾首都基多城。南美洲北部以安第斯山脈為界與北美洲相分,東部以烏拉爾山脈和太平洋為界與亞洲相鄰,東南部經德雷克海峽與非洲相分,西部則與南極洲隔德雷克海峽相望。(摘自百度百科)“
源1.0:大洋洲
總體分析
四個系統對于基本問題的問答可謂是手到擒來。五類問題中,when問題和who問題整體回答的情況最好。三個國產系統中整體文心系統的表現最好。ChatGPT也會犯錯,但是往往只要略微引導,便能改正錯誤。
錯誤回答分析
錯誤語句生成:語句本身并不通順,前后主題不一致或者內容不一致,給人錯亂的感覺。
例如問:爸爸的爸爸稱謂是什么?
答:??爸爸的父親,也就是爸爸的爺爺,是媽媽的爸爸。爸爸的爺爺的爸爸叫太爺爺。爸爸的爺爺的爺爺叫太奶爺(奶奶的爸爸)
或問:我們黨二大在哪里召開?
答:1921年7月23日至31日,中國共產黨第二次全國代表大會在浙江省嘉興市南湖的一艘游船上召開。出席大會的正式代表共13人,候補代表5人,代表全國121名共產黨員。共產國際代表馬林、尼科爾斯基和鮑羅廷等參加了會議。
事實性錯誤:產生了事實性的錯誤。
例如問:?孫文去世的日子?
答:孫文去世的日子是1918年3月13日
偏見性素材:回答取自的素材較少,體現比較強的筆者的主觀性。
例如問:大家什么時候過元旦?
答:謝邀。我是在大學過的,所以元旦是在宿舍過的。我們宿舍六個人,有四個人都回家了,剩下我一個在宿舍,所以元旦那天我過得比較孤獨,不過還好啦,因為宿舍就我自己了,所以我可以一個人吃飯,一個人看電影,一個人逛超市,一個人睡覺,一個人......
含有邏輯性的問題無法識別:問題中存在復合問題或者邏輯判斷,一般難以處理。
例如問:哪個洲是倒數第二小的洲?
答:"南美洲,南美洲面積最大,但人口最多,人口占全球人口的1/5,因此南美洲是僅次于亞洲的世界第二大洲。南美洲位于東半球的南部,包括巴拿馬運河以南的整個南美洲大陸。南美洲大陸東至圣赫勒拿島(西經34°40'),西至馬爾維納斯群島(西經61°10'),南至德雷克海峽,北至亞馬孫河下游平原,南北相距約5100千米。南美洲大陸最南端是厄瓜多爾首都基多城。南美洲北部以安第斯山脈為界與北美洲相分,東部以烏拉爾山脈和太平洋為界與亞洲相鄰,東南部經德雷克海峽與非洲相分,西部則與南極洲隔德雷克海峽相望。(摘自百度百科)
寫在最后
颯姐團隊認為,傳統的單一問答模型可用性不大,給予用戶的體驗感也欠佳,國產大語言模型下一個里程碑,前輩ChatGPT已經給出了方向,便是對話問答。在使用ChatGPT的時候,雖然它也經常會給出錯誤答案,但是其回答的邏輯依舊符合人的習慣,同時經過一定的對話引導,可以自行發現其回答邏輯性的缺失。
作為全新的一種數據合成方式,大語言模型的直接輸出可能是我們人類無法把控的,但是只要它能“理解”用戶的輸入,以此為依調整其輸出,最后得到滿意的回答,那便是可用的。進一步的,大語言模型未來的趨勢很有可能是提前預判用戶可能的“糾錯”,并提前“自糾錯”,并對糾錯結果進行評估。
儲量證明是一種證明數字貨幣平臺持有足夠的資產以抵押其未償債務的證明方式。對于持有資產的儲戶作為用戶的數字貨幣交易所,以及提供某種資產或資產組合token打包的發行者來說,儲量證明尤為重要.
1900/1/1 0:00:00金色財經報道,以太坊NFT二層擴容方案ImmutableX即將推出ImmutablePassport,它為希望將游戲玩家納入Web3的游戲工作室提供了一個一體式通證系統.
1900/1/1 0:00:00此前已討論過OpenAI在股權投資協議設計獨特性,今天分享的是,OpenAI技術模式創新背后的創新機制的建立和創新文化的培育問題.
1900/1/1 0:00:00頭條 ▌1月份NFT交易量達9.46億美元,創2022年6月以來最高記錄金色財經報道,據DappRadar數據,2023年1月NFT交易量和銷售額的激增,交易量達到9.46億美元.
1900/1/1 0:00:00作者:ThorHartvigsen 編譯:DeFi之道 讓我們探索安全、可擴展和去中心化的下一代去中心化穩定幣。穩定幣市場是未來的萬億美元產業。如果您知道去哪里尋找,則有一些重大機會可以利用.
1900/1/1 0:00:00被稱為“狗狗幣殺手”的ShibaInu,即將推出Layer?2解決方案ShibariumBeta版本。ShibariumBeta運行在以太坊之上.
1900/1/1 0:00:00