以太坊價格 以太坊價格
Ctrl+D 以太坊價格
ads
首頁 > BNB > Info

FLO:Stable Diffusion 團隊放大招!新繪畫模型直出 AI 海報,像素級生成

Author:

Time:1900/1/1 0:00:00

來源:量子位

開源AI繪畫扛把子,StableDiffusion背后公司StabilityAI再放大招!

全新開源模型DeepFloydIF,一下獲星2千+并登上GitHub熱門榜。

DeepFloydIF不光圖像質量是照片級的,還解決了文生圖的兩大難題:

準確繪制文字。

以及準確理解空間關系。

LSD協議Stader Ethereum主網上線質押代幣ETHx:6月7日消息,LSD 協議 Stader Ethereum 主網上線質押 Token ETHx。按照計劃,ETHx 上線主網將分三階段進行。[2023/6/7 21:21:28]

網友表示,這可是個大事,之前想讓Midjourneyv5在霓虹燈招牌上寫個字AI都是瞎劃拉兩筆,對于鏡子理解的也不對。

使用DeepFloydIF,可以把指定文字巧妙放置在畫面中任何地方。

StarkNet發布性能路線圖,Mainnet alpha已升級到 v0.10.2:11月29日消息,以太坊擴容方案 StarkNet 宣布其 Mainnet alpha 已升級到 v0.10.2,并發布性能路線圖,StarkNet 稱路線圖中一些步驟已經在 StarkNet Alpha 0.10.2 中實現。未來的性能路線圖中包括定序器并行化、Cairo-VM 的新 Rust 實現、Rust 中的定序器重新實現,該路線圖旨在為改進 TPS 做好準備。[2022/11/29 21:10:23]

霓虹燈招牌、街頭涂鴉、服飾、手繪插畫,文字都會以合適的字體、風格、排版出現在合理的地方。

Astar先行網Shiden與Moonriver間開通HRMP通道,可轉移MOVR:8月5日消息,波卡平行鏈Astar Network宣布其先行網Shiden Network與Moonriver之間已開通新的HRMP通道,可將MOVR從Moonriver轉移到Shiden Network,新的流動性可以在其EVM環境中使用,也可以與WASM智能合約一起使用。Shiden Network表示,將開放更多通道,正準備啟動WASM項目。[2022/8/5 12:05:08]

這意味著,AI直出商品渲染圖、海報等實用工作流程又打通一環。

還在視頻特效上開辟了新方向。

DeFi應用平臺Unagii發布Beta版本并啟動KyberNetwork的Staking質押服務:由新加坡區塊鏈基礎設施公司StakeWith.US推出的DeFi應用平臺Unagii宣布發布Beta測試版并支持KyberNetwork代幣KNC的Staking質押服務。Unagii同時表示,目前在質押KNC的初始階段不會收取任何手續費。

此前報道,StakeWith.US于今年5月宣布與去中心化鏈上交易和代幣互換項目KyberNetwork建立新的合作關系,將在Katalyst協議升級后和StakeWith.US合作提供代幣和投票權抵押服務。[2020/8/14]

目前DeepFloydIF以非商用許可開源,不過團隊解釋這是暫時的,獲得足夠的用戶反饋后將轉向更寬松的協議。

動態 | Bitstamp成為SEN Leverage啟動合作伙伴:金色財經報道,加密貨幣交易所Bitstamp已成為Silvergate銀行新產品SEN Leverage的啟動合作伙伴。Silvergate Exchange Network(SEN)由Silvergate銀行開發,可實現實時、全天候的美元存款和提款。據悉,自推出以來,一系列大牌交易所已加入SEN,包括Kraken和Gemini。SEN Leverage使用SEN全天候(24/7)進行貸款和處理還款。該產品面向機構客戶,允許他們用比特幣擔保的杠桿進行交易。[2020/1/15]

有需求的小伙伴可以抓緊反饋起來了。

像素級圖像生成

DeepFloydIF仍然基于擴散模型,但與之前的StableDiffusion相比有兩大不同。

負責理解文字的部分從OpenAI的CLIP換成了谷歌T5-XXL,結合超分辨率模塊中額外的注意力層,獲得更準確的文本理解。

負責生成圖像的部分從潛擴散模型換成了像素級擴散模型。

也就是擴散過程不再作用于表示圖像編碼的潛空間,而是直接作用于像素。

官方還提供了一組DeepFloydIF與其他AI繪畫模型的直觀對比。

可以看出,使用T5做文本理解的谷歌Parti和英偉達eDiff-1也都可以準確繪制文字,AI不會寫字這事就是CLIP的鍋。

不過英偉達eDiff-1不開源,谷歌的幾個模型更是連個Demo都不給,DeepFloydIF就成了更實際的選擇。

具體生成圖像上DeepFloydIF與之前模型一致,語言模型理解文本后先生成64×64分辨率的小圖,再經過不同層次的擴散模型和超分辨率模型放大。

在這種架構上,通過把指定圖像縮小回64×64再使用新的提示詞重新執行擴散,也實現以圖生圖并調整風格、內容和細節。

并且不需要對模型做微調就可直接實現。

另外,DeepFloydIF的優勢還在于,IF-4.3B基礎模型是目前擴散模型中U-Net部分有效參數是最多的。

在實驗中,IF-4.3B取得了最好的FID分數,并達到SOTA。

誰是DeepFloyd

DeepFloydAIResearch是StabilityAI旗下的獨立研發團隊,深受搖滾樂隊平克弗洛伊德影響,自稱為一只“研發樂隊”。

主要成員只有4人,從姓氏來看均為東歐背景。

這次除了開源代碼外,團隊在HuggingFace上還提供了DeepFloydIF模型的在線試玩。

我們也試了試,很可惜的是目前對中文還不太支持。

原因可能是其訓練數據集LAION-A里面中文內容不多,不過既然開源了,相信在中文數據集上訓練好的變體也不會太晚出現。

OneMoreThing

DeepFloydIF并不是StabilityAI昨晚在開源上的唯一動作

語言模型方面,他們也推出了首個開源并引入RLHF技術的聊天機器人StableVicuna,基于小羊駝Vicuna-13B模型實現。

目前代碼和模型權重已開放下載。

完整的桌面和移動界面也即將發布。

DeepfloydIF在線試玩:

https://huggingface.co/spaces/DeepFloyd/IF

代碼:

https://github.com/deep-floyd/IF

StableVicuna在線試玩:

https://huggingface.co/spaces/CarperAI/StableVicuna

權重下載:

https://huggingface.co/CarperAI/stable-vicuna-13b-delta

參考鏈接:

https://deepfloyd.ai/deepfloyd-if

https://stability.ai/blog/deepfloyd-if-text-to-image-model

https://stability.ai/blog/stablevicuna-open-source-rlhf-chatbot

https://stable-diffusion-art.com/how-stable-diffusion-work/

Tags:STAFLODEEPPFLSTARLNK價格AIFLOKIDeeper NetworkPFL幣

BNB
BNB:熊市并未結束?12張圖解讀加密行業“迷之四月”

在經歷了表現不俗的2023年一季度后,加密行業并未繼續高歌猛進,4月份再次陷入低迷,有人認為熊市并未完全結束,但也有人認為或許只是暫時市場修正,并不會影響長期發展.

1900/1/1 0:00:00
ROM:幾行代碼,GPT-3變ChatGPT!吳恩達高徒、華人CEO震撼發布Lamini引擎

來源:新智元編輯:Aeneas好困快速定制模型的LLM引擎Lamini來了,開發者狂喜!ChatGPT雖好,但始終有門檻。通常,只有擁有AI博士學位的大型機器學習團隊,才能這樣訓練一個模型.

1900/1/1 0:00:00
人工智能:巴比特 | 元宇宙每日必讀:抖音發布11條AI生成內容的平臺規范,要求發布者對AI生成內容進行顯著標識,虛擬人需在平臺進行注冊

摘要:今日,抖音發布關于人工智能生成內容的平臺規范與行業倡議,分別對創作者、主播、用戶、商家、廣告主等平臺生態參與者提出了要求.

1900/1/1 0:00:00
加密貨幣:美國銀行危機再起 助推比特幣強勢反彈

隨著投資者擔憂美國銀行業危機進一步深化,比特幣引領加密市場強勢反彈。比推終端數據顯示,比特幣打破了連續五天的下跌趨勢,突破2.9萬美元,盤中一度觸及3萬美元,市值第二大加密貨幣以太坊上漲4.5%.

1900/1/1 0:00:00
ASH:AI中的明牌與暗牌

明牌與暗牌 今天任何能輕易想到的idea,都是明牌,上來就攤牌比經驗值,武力值,和血條了,比如大家討論最多的AI助手,虛擬老師,AI客服,文案生成等等.

1900/1/1 0:00:00
以太坊:項目周刊 | 長期比特幣持有者11個月來首次回到盈利狀態

金色周刊是金色財經推出的一檔每周區塊鏈行業總結欄目,內容涵蓋一周重點新聞、行情與合約數據、礦業信息、項目動態、技術進展等行業動態。本文是項目周刊,帶您一覽本周主流項目以及明星項目的進展.

1900/1/1 0:00:00
ads