簡述
近期“AI+Web3”的熱度上升,相關概念Token也迎來了一波漲幅,由于很多加密圈的朋友并不是非常了解AIGC,這可能會導致投資失誤或者錯過潛在的機會。我從去年1月份開始關注AIGC,親身經歷了2022年AIGC技術和產業的高速發展,今天我就跟大家簡單解讀一下現在AIGC的發展格局、AI+Web3項目的現狀以及如何使用AIGC工具創作Web3資產。
AIGC
AI模型分類
從模型功能上區分,目前AIGC主要涉及文字、圖片、音樂和視頻的生成。
文字
文字模型現象級應用當屬OpenAI的ChatGPT,續寫文字、創作故事、寫代碼、修BUG、寫詩、做表......你所有能想象到的與文字相關的內容它都可以做。它可以極大程度上減少人的工作量,使用得當將會是文字工作者的利器。現在媒體平臺上很多文章都是用AI寫的,這一領域有很多潛在的機會,解決實際問題,創造新的工作流,打造商業閉環是我們這些使用工具的人需要去考慮的事情。
ChatGPT可以幫助開發人員完成大量的代碼編寫工作,還可以查找修改錯誤,當然它有可能出錯,在使用中需要留意,盡信書不如無書。
此外,各類建議、策劃、編撰等文字工作是它最擅長的,對于文字工作者來說,ChatGPT絕對是超強的輔助工具。
但是ChatGPT不是萬能的,你可以將其定義為一個什么都懂一些的“全才”,但它卻不是精通一切的“專家”。對于某些比較專業的知識,它的回答可能會出錯,這包括但不限于編程細節、密碼學、數學、歷史等領域,所以在使用ChatGPT的時候最好對內容再復核一遍,以免出現嚴重錯誤,在最近的版本更新中,ChatGPT很多錯誤點已經得到了修正,隨著模型的逐步完善,未來的想象力是無限的。
圖片
AI生成圖片是AIGC領域發展最快的賽道,2021年最火的技術還是生成對抗網絡,但是它距離產品化還有很長的距離;到了2022年初,DiscoDiffusion橫空出世引發了第一波AIGC爆點,DiscoDiffusion擅長對場景的刻畫,出圖場面恢弘大氣,但是畫面不夠清晰,作圖速度慢,要以10分鐘計數;4月份,OpenAI的DALLE2上線,7月份Midjourney開放公測,使用Discord端作畫,1分鐘之內可以同時出4張圖,藝術性超高,在11月份發布V4版本后進一步穩固了自己最強AI作畫工具的地位;8月份,StableDiffusion正式發布,作圖速度縮短至10秒之內,圖片細節、清晰度都有極大的提升,并且奉行開源主義,所有代碼都開源,這也誕生了龐大的社區,是之后世界范圍內AIGC流行的火種,包括后面基于StableDiffusion訓練的專門生成二次元圖像的NovalAI。
ConsenSys Layer 2網絡Linea擬于本周上線主網:金色財經報道,ConsenSys計劃將于本周將Layer2網絡Linea上線以太坊主網,應用開發人員將能夠在周五將他們的項目部署到Linea Alpha網絡,用戶可以從下周開始訪問。Linea是一個Layer 2網絡,利用ZK-Rollups進行擴展,并與以太坊應用程序兼容。[2023/7/11 10:48:26]
如今AI作圖領域呈現Midjourney+StableDiffusion的雙巨頭局勢,DiscoDiffusion和DALLE2在技術更新上已經離開了第一梯隊,其余產品大多都是基于StableDiffusion的開源框架調整的。
音樂&視頻
AI生成音樂和視頻是一個發展相對較慢的賽道,至今還沒有現象級應用,市場上存在的產品均不太成熟,其在技術難度上比生成圖片和文字要大,但是已經有很多公司準備在2023年攻克這個難題,或許我們馬上就能看到比較成熟的視頻和音樂生成平臺。下面我挑選幾個相對優秀的產品簡單介紹一下。
AI生成音樂最常見的玩法是用戶輸入一段文字或者一張圖片,模型根據內容輸出一段音樂,對應的產品可以關注Riffusion,它除了實現以上功能外還能在不同風格輸入之間自然轉換。
AI生成視頻可以體驗產品QuickVid,它可以在很短的時間內根據文字描述生成一段流暢的視頻,你還可以選擇不同使用場景下的視頻風格,視頻質量較高,與人為剪輯的效果差別不大。
AIGC+Web3玩法
AIGC可以助力Web3項目更快更好的完成文字和圖片的設計工作,這在NFT和GameFi項目中應用最為廣泛,但是這也需要一定的技巧,使用恰當的Prompt使AIGC輸出可用的圖片,并使用ChatGPT完成項目文案相關工作,描述詞的使用有很多講究,成為一名AI藝術家需要很多的前期學習,為了讓大家快速完成需求,下面我簡單說幾種使用AIGC輸出Web3可用圖像的方法。
PancakeSwap 與 MoonPay 集成:6月27日消息,去中心化交易協議 PancakeSwap 宣布與加密支付提供商 MoonPay 集成,支持使用信用卡、借記卡或銀行轉賬購買加密貨幣。[2023/6/28 22:04:11]
特殊Prompt
有一些特殊的Prompt可以控制模型輸出特定風格的圖片,這些圖片可以直接拿來作為NFT或者GameFi內素材使用,版權屬于創作者自己。下面我使用StableDiffusion做一些示范。直接復制我下面的描述詞,自己定義括號中的內容。
塑料雕像
注:只需要改變括號中的內容就可以得到相同類型的圖片,示例文字順序=圖片順序,圖片內角色依次為Yoda、Superman、ironMan、MaiShiranui、shark、batman、Bumblebee和wizard。你可以嘗試所有其他可能性。
Funkypopfigurine,madeofplastic,productstudioshot,onawhitebackground,diffusedlighting,centered
這類圖片直接發一個NFT項目綽綽有余,每個都是1/1,你只需要告訴AI想要什么。
模塊建筑
這段描述詞中的temple可以改也可以不改,都可以做出不錯的效果圖。
Tinycuteisometrictemple,softsmoothlighting,softcolors,softcolors,100mmlens,3dblenderrender,trendingonpolycount,modularconstructivism,blueblackground,physicallybasedrendering,centered
這類圖片可以構建一個土地NFT項目或者游戲中的建筑。
3D矢量風格動物
通過改變粗體內容,生成不同的矢量動物形象
kawaiilowpolypandacharacter,3disometricrender,whitebackground,ambientocclusion,unityengi
分析:美國交易時段成為比特幣看漲主要推手:3月21日消息,加密服務提供商Matrixport的分析表明,美國買家避險需求是推動比特幣上漲的重要原因。研究和策略主管Markus Thielen表示,自3月10日下跌以來,比特幣上漲了44%。其中31%的漲幅是在美國交易時段推動的,這表明美國人正在購買比特幣。美國銀行業的壓力還沒有結束。
此外,根據Matrixport的數據,自今年年初以來,比特幣上漲集中在哦美國股市的工作時間。BTC今年迄今為止上漲了66%:在美國交易時段,比特幣上漲了47%;而在亞洲交易時段,只上漲了16%;在歐洲交易時段幾乎沒有大的波動,只上漲了3%。(Coindesk)[2023/3/21 13:17:10]
3D游戲風格房間
可改變粗體內容,生成不同的房間
Tinycuteisometriclivingroominacutawaybox,softsmoothlighting,softcolors,purpleandbluecolorscheme,softcolors,100mmlens,3dblenderrender
通過以上案例我們可以看到,AIGC可以在圖片設計上輔助甚至取代畫師,你可以創造出獨一無二的藝術風格、角色,而不需要掌握繪畫的技巧,這是生產力的極大進步。
模型訓練
以上工作流使用的是開源的StableDiffusion通用模型,它無法生成模型素材中不存在的東西,比如你無法讓它生成一只無聊猿,模型本身也不知道什么是無聊猿,所以它存在局限性和時效性。為了解決以上提到的問題,我們可以訓練自己的模型,將需要的素材都放進去,從而使模型輸出內容符合我們的預期,這在NFT二創、擴展,GameFi輔助設計等方面都有很大的應用潛力。
展示幾張我訓練的無聊猿模型二創成圖效果,從左到右分別是蝙蝠俠風格,黏土風格,畢加索抽象風格和黃金材質:
當然也可以控制生成與原本項目圖片相似度極高的圖片,下列四張圖片有兩張原圖,兩張用無聊猿模型生成的圖,幾乎很難分辨,你可以猜一下,后面我會揭曉答案。
Ankr在BNB Chain上為ankrBNB推出新Midas流動性池:據官方消息,ankrBNB的新Midas池現已上線,標志著BNB Liquid Staking與Ankr的下一階段。BNB/ankr BNB Midas池將允許用戶每次以最佳價格提供跨多個流動性來源(中心化和去中心化)的流動性。
Midas是一種跨鏈貨幣市場解決方案,可為EVM兼容的區塊鏈帶來隔離和可定制的貨幣市場。通過與Midas合作,可以激勵礦池為ankrBNB提供初始流動性,質押BNB的流動性質押Token用戶從其持有的資產中獲得收益。[2023/2/10 11:58:23]
模型訓練原理很簡單,用自己提供的圖片訓練出一個專屬模型,但是讓普通人從零開始訓練一個AIGC模型是很困難的,好在StableDiffusion給我們提供了一些比較簡單的模型訓練方法。
現在常用的技術方案有三種:Fine-Tuning、DreamBooth、Textual-Inversion
特性解釋:
Fine-Tuning--模型訓練、原生框架
優點:功能最全,效果最好,prompt控制精確,是優質精細模型的統一技術方案
缺點:訓練復雜,硬件要求高,訓練時間長,訓練圖片需要標記詞
DreamBooth--模型訓練、簡易框架、添加特殊標識符
優點:訓練簡單、速度快、硬件要求相對低、不需要精確的圖片標記詞,能較好地生成不同風格的圖片,開放模型最常用方案
缺點:受限于的表示方式,訓練SD模型中不存在的類效果會差一些,整體出圖質量低于Fine-Tune,模型文件:2-4G
Textual-Inversion--新定義特征向量,不改變模型本身
優點:需要圖片數量少:3-5張,訓練文件小:幾十KB
缺點:對于原SD中不存在的創新的物體、畫風等出圖效果不好,暫無商業用例
綜合考慮成本與難度,新手推薦使用DreamBooth訓練自己的模型,這里我給大家找了一個最簡單的Colab版本,它可以使用谷歌免費的服務器訓練模型并生成圖片,前期需要處理的素材也最少。
訓練模型之前,你需要訓練使用的準備圖片,初次嘗試最好在10張左右,尺寸512*512,如果圖片尺寸不合適可以使用BIRME等工具調整。
數據:交易所錢包近24小時有5,679.9枚BTC流入:金色財經報道,數據顯示,交易所錢包余額近24小時流入5,679.9枚BTC,近7天流入19,587.4枚BTC,近30天流出79,298.62枚BTC。目前全網交易所錢包余額總計為1,947,205.30枚BTC。(coinglass)[2022/11/7 12:23:54]
打開上面的鏈接,也就是:https://colab.research.google.com/github/TheLastBen/fast-stable-diffusion/blob/main/fast-DreamBooth.ipynb
主頁顯示如下,這是一個即時更新的頁面,它不會保存你的更改,你可以直接在這個頁面使用,或者點擊“文件”選擇“在云端硬盤中保存一份副本”,打開副本頁,這個頁面會保存你的所有更改。
之后我們開始模型訓練,首先點擊第一行的運行按鈕,連接Google云端硬盤,安裝到gdrive。
運行完成后在按鈕前面會出現綠色的對勾,右上角RAM/磁盤也出現綠色對勾,后面每段程序運行完成的標志都是這個小對勾。上一段程序運行結束后,點擊下一段的按鈕繼續運行。
接下來安裝依賴,下載模型
開始正式訓練,首先為你的模型起個名字。
上傳圖片,點擊運行后會出現“選擇文件”按鈕,選定圖片后上傳,我這里選擇了八張CloneX的圖片作為訓練素材,并為它們命名為CloneX1-8,這里對圖片的命名不要與已有單詞相同,它是對你訓練素材的特殊標記。圖片命名方式可以參考下圖。
運行Captions,并跳過Conceptimages
開始訓練,訓練步數設置為圖片數量*100,我是用了八張圖片,這里選擇800,其他參數暫時不需要調整,等后面熟練掌握了模型訓練方法再進行更精準的訓練。
點擊運行,出現以下界面表示訓練開始,等待訓練完成。這里有兩個訓練過程,一個是訓練文字,一個是訓練圖片。
訓練完成后直接運行測試模型,這里不需要調整參數。
程序運行完后會出現一個鏈接,點擊打開到可以作圖的WebUI界面。
WebUI的主頁如下,1處選擇使用的模型,2處輸入描述詞,也就是你對想要輸出圖片的內容,3處輸入負面描述詞,也就是你不想要圖片出現什么內容,3可以空著不填。填寫完描述詞后點擊生成圖片。
因為我們對圖片的標記是CloneX,所以我們生成圖片時前部分要指定主體,這里推薦固定句式“apictureofclonexwith+......”,with后面加對圖片的描述,每個描述詞之間用逗號隔開。
簡單測試,這里輸入提示詞“apictureofclonexwithbeautifulgirl,redhair”,結果應該會出現一個紅色頭發的女生CloneX形象,效果如下圖:
測試2,輸入提示詞:“apictureofclonexwithbeautifulgirl,Longgreenhair,blackcoat,yelloweyes”也就是綠色長發、黑色外套、黃色眼鏡的女CloneX,生成效果如下
從以上兩個簡單測試來看,用10張以內的素材圖片訓練的模型就可以很好的生成想要的圖片,而且這些CloneX是原本不存在的,是你創造了它們!以后喂10張圖給AI,它可以給你10,000張圖,這是生產力質的提升。
我把這個訓練的模型上傳到了Huggingface,有興趣的朋友可以拿去玩,在訓練過程中遇到什么問題也可以聯系我。鏈接:https://huggingface.co/wheart/clonexnft
揭曉答案,無聊猿那四張圖片,前兩張是AI生成的,后面兩張是原圖。
現有AI+Web3項目簡析
隨著AIGC的興起、ChatGPT的爆火、微軟對AI百億投資等事件的鋪墊,Crypto很多AI項目也得到了更多的關注,諸如AGIX之類的AI概念Token都迎來了一波不錯的漲幅。但是就目前這些AI+Web3的項目來看,我并沒有發現真正有想象力的產品。這段時間受到關注的項目大都是很久之前的老項目,所以只能看作是版塊輪動帶動了它們,長線來看沒有好的標的。如果后面出現基于新AI技術做的產品或許可以關注。
目前很多Crypto大佬,像CZ、Vitalik都對AI技術產生了興趣,所以對于AI+Web3之后的發展,我個人認為還是值得期待的。
總結
綜合來看,目前AIGC在Web3的應用還處于非常初級的階段。現階段利用好AI工具可以對項目的設計、開發、運營工作提供極大的便利,下一階段肯定會出現更多優秀的產品,我們要做的就是學習、使用、分析、發現,比大部分人多走一步,不錯過AIWeb3這趟車。
作者:Aave 編譯:DeFi之道,Kyle一文速覽AaveV3四大重要特征。1月27日,DeFi借貸協議Aave宣布其V3版本已部署在以太坊主網上.
1900/1/1 0:00:00撰文:康水躍,FoxTech與WayNetwork創始人,丹陽投資董事長“偉大的設計看起來都是非常簡單的,但是設計它的過程其實是極其復雜的”.
1900/1/1 0:00:00提前預判一切可能性,是為了讓它變得更好自去年底首次推出以來,爆火的ChatGPT已成為互聯網的新寵,迅速積累了驚人數量的用戶,用戶們通過這個基于網絡的聊天機器人.
1900/1/1 0:00:00Jan,?2023,DanielDataSource:StatsaboutGameFifrom2022這份年度報告著眼于區塊鏈行業的跨鏈數據,概述了2022年GameFi中最重要的指標和趨勢.
1900/1/1 0:00:00Web3?是一個動態的生態,其創始人、通證持有人、開發者和用戶聚在一起,創造出一個真正屬于用戶的去中心化互聯網.
1900/1/1 0:00:00撰文:ChainCatcher在歲尾年初之際,Layer2擴容板塊持續出現在各家機構的總結和預測報告中.
1900/1/1 0:00:00