以太坊價格 以太坊價格
Ctrl+D 以太坊價格
ads

AGEN:谷歌AI繪畫4大牛攜手創業 天使估值7個億

Author:

Time:1900/1/1 0:00:00

圖片來源:由無界版圖AI工具生成

最近的谷歌像個大漏勺,這不,又有AIGC核心成員聯手跑路咯!

量子位獨家獲悉,這回跟谷歌say byebye的,是文生圖核心團隊——AI繪畫模型Imagen論文的四位核心作者,出走目的是要搞自己的AI公司。雖然公司名稱暫未對外公布,但新公司將一以貫之的路線是很清楚的:

以Imagen為基礎,沿著原來的項目做下去,不僅繼續做文生圖,還要做視頻方向。

核心人才創業,自然少不了VC塞錢——已經按1億美元的驚人天使估值完成了首輪融資,而且更多VC想給錢而趕不上、投不進。

這也算是文生圖、文生視頻、AIGC賽道上,最知名的研究團隊之一了。

新公司聯創四人,Chitwan Saharia、William Chan、Jonathan Ho以及Mohammad Norouzi,都出自谷歌。

他們之前精力重點放在AIGC的文生圖板塊,是谷歌用來對抗DALLE-2的大殺器Imagen的論文共同作者,位置都挺重要的那種。

谷歌報告:越南民眾對股票、加密貨幣的搜索興趣上升超過100%:2月20日消息,根據谷歌的《2021年度搜索:越南明日搜索》報告,從購物到服務,越南人正在選擇一種數字優先的生活方式,以受益于網絡世界的快速、便利和低成本。報告指出,越南民眾對在線購物的搜索興趣增長了42%,與大型雜貨店在線購物相關的搜索也在增加。除此之外,與網上銀行和在線申請信用卡有關的搜索分別超過58%和76%。與此同時,與數字錢包和電子錢包相關的搜索量增加了100%。自疫情爆發以來,越南新增了800萬數字消費者,其中一半以上來自非大都市地區。人們正在學習如何投資,對股票的搜索興趣增長了106%以上,農村人口對投資表現出特別強烈的興趣,而對加密貨幣的搜索興趣仍然很高,增長了115%。(Vietnam Plus)[2022/2/20 10:04:14]

先來介紹一下Chitwan Saharia,也是Imagen的共同一作。

Chitwan本科畢業于孟買理工學院計算機科學與工程專業,在孟買理工學院和蒙特利爾大學都當過程序和算法方面的研究助理。2019年加入谷歌,base多倫多,花了3年時間從二級軟件工程師做到高級研究科學家,去年12月從谷歌離職。

谷歌云添加惡意加密挖礦軟件威脅檢測服務“VMTD”:金色財經報道,谷歌云宣布正在添加虛擬機威脅檢測(VMTD)服務。VMTD是來自主流云提供商的首個市場檢測功能,提供無代理內存掃描,以幫助檢測在谷歌云運行的虛擬機中的惡意加密挖礦軟件等威脅。VMTD還將能夠保護谷歌云平臺客戶免受數據泄露和勒索軟件等攻擊。

谷歌表示,該功能正在作為“公共預覽版”推出,將在未來幾個月內將VMTD與其服務的其他部分集成。該公司此前曾表示,86%的“惡意行為者”使用受攻擊的谷歌云賬戶來挖掘加密貨幣。(coindesk)[2022/2/8 9:37:24]

Chitwan有語音識別、機器翻譯的經驗,在谷歌工作時,主要負責領導image-to-image擴散模型的工作。

第二位William Chan,也是Imagen論文共同一作。他同樣出身計算機工程,先后就讀于加拿大滑鐵盧大學、卡內基梅隆大學,中間在新加坡國立大學當過1年交換生。

在卡內基梅隆大學拿下博士學位后,William還在加拿大最大的社區學院之一喬治布朗學院,主攻烘焙和烹飪(?),學了3年。

Willian從2012年起加入谷歌,于2016年成為谷歌大腦的一份子,去年5月離職時,他已經是谷歌大腦多倫多的研究科學家了。

谷歌關閉感染100多萬臺電腦的加密劫持僵尸網絡:金色財經報道,谷歌周二采取行動,關閉了一個復雜的加密劫持僵尸網絡,該網絡利用比特幣區塊鏈來躲避網絡安全官員。谷歌在對Dmitry Staroviko和Alexander Filippov以及15名身份不明的個人提起的民事訴訟中說,這個被稱為 \"Glupteba \"的僵尸網絡已經感染了全球超過100萬臺機器。谷歌稱,被告利用這個僵尸網絡在受害者的電腦上挖掘加密貨幣,竊取受害者的賬戶信息出售給第三方,使用資金不足的信用卡購買商品和服務,并將被攻擊機器的訪問權出售給第三方。此外,該僵尸網絡本身以一種獨特的方式利用區塊鏈技術,努力確保其不受旨在破壞這些類型惡意活動的傳統工具的影響。(coindesk)[2021/12/8 12:58:09]

然后要介紹的是Jonathan Ho,UC伯克利博士畢業。

他不僅是Imagen論文的core contribution,還是Diffusion Model奠基之作《Denoising Diffusion Probabilistic Models》的一作。

博士畢業于UC伯克利計算機科學專業的Jonathan,之前在OpenAI當過1年的研究科學家,后來在2019年加入谷歌,共工作了2年零8個月,去年11月以研究科學家的身份從谷歌離職。

谷歌支付工程師:BCH、EOS等主流幣市值為YFI數倍是不合邏輯的:根據加密市場數據,DeFi協議Yearn.finance(YFI)的市值為9.6億美元,而EOS、Cardano、Tron、BSV等主流幣則擁有數十億美元的市值。谷歌支付工程師Tyler Reynolds認為,XRP、BCH、BSV、EOS、ADA和XLM的市值是YFI的“兩倍多”,這是不合邏輯的。對于Reynolds和DeFi領域的其他許多人來說,區塊鏈“沒有未來”,因為到目前為止還沒有被廣泛采用。至于這些區塊鏈網絡“宣稱”擁有數十億美元市值,他列舉了三個因素:循環供應量受限、市場操縱以及針對輕信者的營銷。(CryptoSlate)[2020/9/11]

新公司的最后一位聯創叫Mohammad Norouzi,也是Imagen論文的共同一作。

他在多倫多大學計算機科學博士就讀期間,拿到了谷歌ML博士獎學金。畢業后他加入谷歌大腦,在那兒工作了7年,在谷歌的最后title是高級研究科學家,工作重點是生成模型。

同時,Mohammad也是谷歌神經機器翻譯團隊的原始成員,SimCLR的聯合發明人。他在GitHub主頁上小小地透露了自己的最近動態:

這句話以外,關于新公司的更多信息,四人在任何社交平臺都沒有更詳細的透露。

金融技術律師:谷歌加密貨幣禁令令人感到不安:據bitcoin.com消息,Burges Salmon的金融技術律師Gareth Malna對谷歌禁止加密貨幣廣告表示擔憂。他表示,鑒于谷歌龐大的商業力量,這可能會是一項潛在的,令人不安的事態發展。對于谷歌來說,阻止這一市場可能聽起來像消費者保護,但可能超出了它作為信息守門人的職責。[2018/6/7]

這已經是谷歌最近漏出去的第n波人了。

就拿剛剛過去的2個月來說,先是包括顧世翔(Shane Gu,‘讓我們一步一步地思考’研究者)在內的至少4名谷歌大腦成員加入OpenAI;情人節時,Hyung Won Chung和CoT最早的一作Jason Wei攜手組團叛逃OpenAI。

本周三,您猜怎么著?嘿,又跑了一個:

OpenAI狂喜,只有谷歌大漏勺本勺受傷的世界誕生了。

了解完谷歌漏走的這四個人,回頭來說說為他們職業生涯贏得掌聲的Imagen項目。

Imagen是谷歌發布的文生圖模型,發布時間在DALL-E 2新鮮出爐一個月以后。

本文開頭放的熊貓震驚表情包,就是朝Imagen輸入“一只非常快樂的毛茸熊貓打扮成了在廚房里做面團的廚師的高對比度畫像,他身后的墻上還有一幅畫了鮮花的畫”后,得出的一張要素完備的AI生成畫作。(不好意思,請自行斷句)

在Imagen出現之前,文生圖都共用一個套路,那就是CLIP負責從文本特征映射到圖像特征,然后指導一個GAN或Diffusion Model生成圖像。

Imagen不走尋常路,開辟了text-to-image新范式:

純語言模型只負責編碼文本特征,具體text-to-image的工作,被Imagen丟給了圖像生成模型。

具體來講,Imagen包含一個凍結的語言模型T5-XXL(谷歌自家出品),當作文本編碼器。T5-XXL的C4訓練集包含800GB的純文本語料,在文本理解能力上比CLIP強不少,因為后者只用有限圖文對訓練。

圖像生成部分則用了一系列擴散模型,先生成低分辨率圖像,再逐級超采樣。

依賴于新的采樣技術,Imagen允許使用大的引導權重,所以不會像原有工作一樣使樣本質量下降。這么一來,圖像具有更高的保真度,并且能更好地完成圖像-文本對齊。

概念說起來簡單,但Imagen的效果還是令人大為震撼的。

生成的狗子飆車技術一流:

比起爆火的DALLE-2,Imagen能更準確地理解同時出現兩個顏色要求的情況:

一邊繪畫一邊寫字這種要求,Imagen也成功完成,不僅寫得對,還能加光影魔術手般的煙花特效(不是)。

以及對后來研究更有幫助的是,谷歌通過Imagen的研究,優化了擴散模型。

首先,增加無分類器引導(classifier-free guidance)的權重可以改善圖文對齊,同時卻會損害圖像保真度。

為了解決這個bug,在每一步采樣時引入動態閾值(dynamic thresholding)這個新的新的擴散采樣技術,來防止過飽和。

第二,使用高引導權重的同時在低分辨率圖像上增加噪聲,可以改善擴散模型多樣性不足的問題。

第三,對擴散模型的經典結構U-Net做了改進,變成了Efficient U-Net。后者改善了內存使用效率、收斂速度和推理時間。

后來在Imagen上微調,谷歌還推出了能“指哪打哪”版本的文生圖模型DreamBooth。只需上傳3-5張指定物體的照片,再用文字描述想要生成的背景、動作或表情,就能讓指定物體“閃現”到你想要的場景中。

比如醬嬸兒的:

又或者醬嬸兒的:

大概是Imagen效果太過出色,劈柴哥后來親自宣發的谷歌AI生成視頻選手大將,就叫做“Imagen Video”,能生成1280*768分辨率、每秒24幀的視頻片段。

啊,等等,谷歌有Imagen Vedio,這和四人的新公司不是撞方向了嗎?

仔細看了下論文,無論是Imagen還是Imagen Video,各自都有大篇幅涉及風險、社會影響力的內容。

出于安全、AI倫理和公平性等方面考慮,Imagen和Imagen Vedio都沒有直接開源或開放API,甚至連demo都沒有。

哪怕市面上出現開源復刻版本,也不是最正宗的味道。

此前就曝出過在谷歌每年的內部員工調查“Googlegeist”中,員工表示對谷歌執行能力不佳的質疑。也許,這四人出走,繼續做Imagen,并做Imagen的視頻版,說不定就是為了想把項目放到一個更開放的AI環境。

而且這種出走創業,也是熱錢大錢向AIGC洶涌的結果。

所以既然AIGC的創投熱潮已經在太平洋那頭開啟,那應該在太平洋這頭也不會悄無聲息。

或許你已經聽說了一些同樣的大廠出走創業,歡迎爆料說說~~

來源:“量子位”(ID:QbitAI),DeFi之道

作者:衡宇

DeFi之道

個人專欄

閱讀更多

金色財經 善歐巴

金色早8點

Odaily星球日報

歐科云鏈

Arcane Labs

MarsBit

深潮TechFlow

BTCStudy

澎湃新聞

Tags:MAGEMAGAGENGENImage Generation AImemag幣團隊AGENTSHIBAINUProof Of Degen

比特幣交易
ALA:以太坊上海升級即將來臨 你能把握新的投資機遇嗎?

撰文:veDAO 研究院所謂以太坊上海升級 (EIP-4895) 是以太坊在開發和更新中的一個技術升級的版本命名.

1900/1/1 0:00:00
加密貨幣:6個讓你生活更輕松的人工智能工具(不包括ChatGPT)

試用了 ChatGPT 好幾周之后,我突然想知道,是否有其他人工智能工具也能像 ChatGPT 一樣,讓我的生活更輕松?人工智能正在改變我們的工作和生活方式,我不想錯過充分利用它的機會.

1900/1/1 0:00:00
NFT:NBA Top Shot 跌落神壇

撰文:湯圓,元宇宙日爆 近日,美國職業籃球聯盟(NBA)授權的 NFT 項目「NBA Top Shot Moments」被紐約法院初步裁定為「可能符合證券的定義」.

1900/1/1 0:00:00
BLU:反思 Blur 狂熱:剔除文化而放大金融投機 Blur 是否把 NFT 帶偏了?

來源:Aaron 推文編譯:念青,ChainCatcher由于空投預期,Blur 的熱度一直在持續.

1900/1/1 0:00:00
DAO:Web3.0時代創作者經濟與DAO的融合發展

文:尚治、徐鵬 清華大學互聯網產業研究院隨著互聯網技術的興起與迭代,過去幾十年里,創作者經濟作為一種全新經濟形態萌芽并迅速發展.

1900/1/1 0:00:00
加密貨幣:金色觀察 | Vitalik:我使用以太坊的一些用戶體驗及經驗教訓

文/Vitalik,以太坊創始人;譯/金色財經0xnaitive2013年,我去了舊金山互聯網檔案館旁邊的一家壽司店,因為我聽說它接受比特幣支付,我想試試。到了付賬的時候,我要求用BTC支付.

1900/1/1 0:00:00
ads