以太坊價格 以太坊價格
Ctrl+D 以太坊價格
ads
首頁 > NEAR > Info

ETA:在元宇宙里怎么交朋友?Meta發布跨語種交流語音模型 支持128種語言無障礙對話

Author:

Time:1900/1/1 0:00:00

改名Meta之后,Facebook的元宇宙愿景正在一點點實現。這一次,Facebook把目光投在了元宇宙社交上。

Meta發布語音處理模型XLS-R

近日,Meta正式發布XLS-R——一套用于各類語音任務的新型自監督模型。據悉,XLS-R由海量公共數據訓練而成(數據量是過去的十倍),能夠將傳統多語言模型的語言支持量增加兩倍以上。目前,XLS-R共支持128種語言。

Meta認為,語音交流是人們最自然的一種交互形式。“隨著語音技術的發展,我們已經能夠通過對話同自己的設備及未來的虛擬世界直接互動,由此將虛擬體驗與現實世界融為一體。”

服裝品牌Hiroko Koshino將在元宇宙平臺發布可穿戴NFT系列:3月11日消息,日本服裝品牌小筱弘子(Hiroko Koshino)將在元宇宙平臺XANA上發布名為“HIROKO KOSHINO ANOTHER ONE”的可穿戴NFT系列,價格未定,此外,其將在NFT市場開設品牌商店。小筱弘子3D設計的時尚單品被將轉換成的NFT將在在NFT市場XANALIA上出售,購買的NFT可以被元宇宙平臺XANA內的3D化身穿戴。(WWD)[2022/3/11 13:50:56]

這與扎克伯格此前宣稱的“公司業務將以元宇宙優先”不謀而合。此前,扎克伯格曾概述了他建立“元世界”的計劃:一個建立在我們自己的數字世界之上的數字世界,包括虛擬現實和增強現實。“我們相信元宇宙將會接替移動互聯網”。

游戲巨頭EPIC Games申請Megaverse商標,計劃在元宇宙內容市場投資10億美元:2月7日消息,游戲巨頭EPIC Games已申請“Megaverse”商標,其中描述除了與游戲內容相關之外,更結合各類虛擬實境內容應用,旨在擴大布局元宇宙市場。

不過,目前還無法確認EPIC Games將會如何使用Megaverse商標,也無法確認此商標名稱是否與EPIC Games前身EPIC MegaGames有關。另據EPIC Games首席執行官Tim Sweeney透露,該公司還計劃在元宇宙內容市場投資 10 億美元,除了將《堡壘之夜》(Fortnite) 銜接各類元宇宙應用,更預期藉由其 Unreal Engine 打造更多元宇宙應用發展。[2022/2/7 9:35:05]

而XLS-R作為元宇宙社交中必不可少的一環,可以幫助母語不同的人在元宇宙無障礙對話。

涂子沛:在元宇宙里每個人都不會死:12月6日消息,由南方日報社主辦的“數據新價值”2021南方智享會主題沙龍在廣州舉行,大數據專家、科技作家涂子沛現場作《數據價值的歷史、未來和想象》的主題分享。涂子沛表示,\"盡管這個世界已經沒有新的大陸空間可以被發掘,但人類正在打造一個新的空間,即數據空間,甚至可以稱之為“元宇宙”。在元宇宙里每個人都不會死,你的孫子的孫子也可以跟你對話,因為你留下了數據,甚至可以請教問題。元宇宙就變得有生命,它是基于數據孿生之上的一個空間。\"(南方日報)[2021/12/6 12:52:53]

值得一提的是,為了通過單一模型實現對多種語言的廣泛語音理解能力,Meta對XLS-R進行了微調,使其獲得語音識別、語音翻譯及語言識別等功能。據介紹,XLS-R在BABEL、CommonVoice以及VoxPopuli語音識別基準測試,CoVoST-2的外語到英文翻譯基準測試,以及VoxLingua107語言識別基準測試中都取得了不錯的成績。

調查:65%的韓國首爾人更想在元宇宙辦公空間工作:10月19日消息,韓國首爾女性勞動力發展研究所Seoul Woman Up發布的最新調查顯示,65.1%的首爾人更愿意使用虛擬形象進入元宇宙辦公空間工作,34.9%更愿意在實體辦公空間工作。這項調查開展于8月10-19日,共有4,476名首爾市民(3,473名女性和1,003名男性)參與調查。選擇元宇宙辦公空間的原因包括:可以兼顧工作與家庭生活,包括照顧孩子(53.1%),更喜歡通過虛擬形象進行交流(19.9%),以及在虛擬環境中工作更方便(17.4%)。(韓國時報)[2021/10/19 20:39:50]

為了盡可能降低功能訪問門檻,目前,Meta與HuggingFace聯手發布了模型本體,并通過fairseqGitHubrepo全面開放。

試用地址:https://huggingface.co/spaces/facebook/XLS-R-2B-22-16

XLS-R工作原理

據介紹,XLS-R在wav2vec2.0訓練集上接受了超過43萬6千小時的公開語音錄音訓練,從而實現了對語音表達的自監督學習方法。這樣的訓練量已經達到去年發布的當時最強的模型XLSR-53的10倍。利用從會議記錄到有聲讀物的多種語音數據來源,XLS-R的語言支持范圍擴展到128種,涵蓋的語種量達到前代模型的近2.5倍。

作為Meta打造的有史以來最大模型,XLS-R中包含超過20億個參數,性能遠高于其他同類模型。Meta表示,事實證明,更多參數能夠更充分地體現、數據集中的各類語種。此外,Meta還發現,規模更大的模型在單一語言預訓練方面的性能也同樣優于其他較小模型。

Meta在四種主要多語言語音識別測試中對XLS-R做出評估,發現它在37種語言上獲得了超越以往模型的效能。具體測試場景為:BABEL中選取5種語言,CommonVoice中選取10種語言,MLS中選取8種語言,以及VoxPopuli上選取14種語言。

BABEL上的單詞錯誤率基準測試結果。XLS-R較前代模型實現了顯著改進。

此外,Meta還評估了語音翻譯模型,即將錄音資料直接翻譯成另一種語言。為了打造一套能夠執行多種任務的模型,Meta同時在CoVoST-2基準測試的數個不同翻譯方向上對XLS-R進行了微調,使其能夠在英語與多達21種語言之間實現內容互譯。

在使用XLS-R對英語以外的其他語言進行編碼時,獲得了顯著的效能提升,這也是多語言語音表達領域的一次重大突破。據Meta介紹,XLS-R在低資源語言學習中實現了顯著改進,例如印尼語到英語的翻譯,其中BLEU準確率平均翻了一番。BLEU指標的提升是指模型給出的自動翻譯結果與處理同一內容的人工翻譯結果間重合度更高,代表著模型在改進口語翻譯能力方面邁出了一大步。

以BLEU指標衡量的自動語音翻譯準確率,其中較高值表示XLS-R從高資源語言(例如法語、德語)、中資源語言(例如俄語、葡萄牙語)或低資源語言(例如泰米爾語、土耳其語)語音記錄翻譯至英語時的準確率。

Meta認為,XLS-R證明擴大跨語言預訓練規模可以進一步提高低資源語言的理解性能。它不僅提高了語音識別率,同時也將由外語到英語的語音翻譯準確率提高了一倍以上。

“XLS-R是我們朝著以單一模型理解多種不同語言(語音)目標邁出的重要一步,也代表著我們在利用公共數據推進多語言預訓練方面做出的最大努力。我們堅信這是一條正確的探索方向,將讓機器學習應用更好地理解所有人類語音、并促進后續研究,大大降低語音技術在全球范圍內、特別是服務匱乏社群中的使用門檻。我們將不斷開發新方法,通過低監督學習拓展模型的語言理解能力、逐步使其覆蓋全球7000多種語言,實現算法的持續更新。”Meta提到。

https://ai.facebook.com/blog/xls-r-self-supervised-speech-processing-for-128-languages/

Tags:XLS元宇宙METAETAPIXLS價格元宇宙投資騙局MetaLandmapXMETA

NEAR
NCE:Nansen 2021年加密產業報告中文版全文

原文標題:《Nansen:2021年加密產業報告》從商業角度來說,2021年或許是加密世界誕生以來最重要的年份之一,這里不再只有敘事與投機,也有了由真實需求支撐起來的眾多產業與生意.

1900/1/1 0:00:00
WEB3:朱嘉明:元宇宙的商業前景、技術路徑和治理規則

2022年1月19日,橫琴數字金融研究院學術與技術委員會主任朱嘉明教授接受第一財經記者曲莉莉專訪,就元宇宙的商業前景、技術路徑等問題進行了解答和治理規則.

1900/1/1 0:00:00
TER:金色前哨|Terra成立生態基金會LFG

金色財經報道,1月20日消息,Terra公鏈宣布成立非盈利基金會LunaFoundationGuard,成員由Terra創始成員和專家委員會組成.

1900/1/1 0:00:00
Uniswap:Uniswap第四季度總結:交易量創新高、穩定幣市場交易份額攀升

以下報告由MessariHub成員UniswapLabs委托編寫。有關更多信息,請參閱文章后面的免責聲明.

1900/1/1 0:00:00
DOGE:2021年加密貨幣洗錢金額增長三分之一 但仍低于最高水平

Chainalysis一份新的報告顯示,2021年加密貨幣洗錢金額為86億美元。這標志著比2020年增長了25%,但仍遠低于2019年的高水平。2019年,加密貨幣洗錢金額為109億美元.

1900/1/1 0:00:00
LIBRA:Meta穩定幣項目Diem出售給Silvergate銀行

新浪科技北京時間2月1日早間消息,據報道,數字貨幣項目Diem協會發布聲明,確認將其知識產權及其它與支付網絡相關的資產出售給了加州的特許銀行SilvergateBank.

1900/1/1 0:00:00
ads