原文標題:《硬核丨如何利用機器學習識別加密項目風險?》
撰文:PengtaiXu
翻譯:Sherrie
加密貨幣是一種存在于數字世界的交易媒介,依靠加密技術使交易安全。加密貨幣背后的技術允許用戶直接向他人發送貨幣,而不需要通過第三方,如銀行。為了進行這些交易,用戶需要設置一個數字錢包,而不需要提供身份證號碼或信用評分等個人細節,因此可以讓用戶偽匿名。
對于普通的加密貨幣用戶來說,這種匿名性可以讓他們放心,因為他們的個人信息或交易數據不會被黑客竊取。然而,這種交易匿名性的提高,也容易被犯罪分子濫用,進行洗錢、恐怖融資等非法活動。這種非法活動給區塊鏈錢包用戶以及加密貨幣實體都造成了巨大的損失。雖然金融行動特別工作組等監管機構已經在這些實體的監管中引入了標準化的指導方針,但由于每天都有大量的加密貨幣實體和交易發生,監控加密貨幣空間是一項具有挑戰性的任務。
39,121枚ETH從Compound轉移到未知錢包:金色財經報道,北京時間15:31分左右,39,121枚ETH(價值75,783,529 美元)從Compound轉移到未知錢包。[2023/7/15 10:57:04]
解決方案
圖片來源:?https://dribbble.com/shots/2723032-Needle-in-a-Haystack
因此,人們有興趣利用開源信息,例如新聞網站或社交媒體平臺,來識別可能的安全漏洞或非法活動。在與LynxAnalytics的合作中,我們已經致力于開發一個自動工具,以刮取開源信息,預測每篇新聞文章的風險分數,并標記出風險文章。這個工具將被整合到?Cylynx平臺?中,這是LynxAnalytics開發的一個工具,用于幫助監管機構通過使用各種信息源監控區塊鏈活動。
2023年Q1美國加密貨幣相關商標申請同比減少三分之二:金色財經報道,盡管就美國加密貨幣行業相關的商標申請而言,2022年是非常成功的一年,但2023年的開局要慢得多,因為這一數字比去年同期低了約三分之二。
根據Michael E. Kondoudis律師事務所的商標和專利律師Michael Kondoudis 4月5日分享的數據,2023年第一季度美國與加密貨幣相關的商標申請達559件,比2022年第一季度的1649件下降了66.1%。
在進一步分析美國專利商標局(USPTO)的數據后,如圖表所示,2023年1月有196個新的加密商標申請,2月只有160個,而3月這些商標申請比前兩個月略有改善,有203個申請。
值得注意的是,2022年是破紀錄的一年,美國與加密貨幣相關的商標申請總數為5383件,而2021年為3570件,2020年僅為1137件,盡管形勢動蕩,但由于機構和個人興趣的增加,加密貨幣行業繼續增長。(Finbold)[2023/4/6 13:48:31]
開源信息的數據獲取
Input Output推出EVM側鏈概念證明公共測試網:2月7日消息,Cardano開發團隊Input Output發推宣布推出EVM側鏈概念證明公共測試網,此前曾推出用于在Cardano上開發自定義側鏈的工具包。該公共測試網允許在測試環境之間測試代幣傳輸,連接錢包并部署智能合約和 DApp。官方文檔顯示,該EVM側鏈測試網環境由兩個網絡組成,分別為EVM側鏈測試網和專用的Cardano測試網。[2023/2/7 11:52:39]
我們確定了3類開源數據,這些數據可以提供有價值的信息,幫助檢測加密貨幣領域的可疑活動。這些類別是:
傳統的新聞網站,如谷歌新聞,它將報告重大的黑客事件。加密貨幣專用新聞網站,如Cryptonews和Cointelegraph,它們更有可能報道小型實體和小型安全事件的新聞。社交媒體網站,如Twitter和Reddit,在官方發布黑客新聞之前,加密貨幣所有者可能會在那里發布有關黑客的消息。
Web3金庫管理基礎設施Coinshift集成資金流協議SuperFluid:9月20日消息,Web3金庫管理基礎設施初創公司Coinshift宣布集成資金流協議Super Fluid,允許用戶直接在Coinshift創建和管理實時工資流。Coinshift為DAO和Web3公司提供金庫管理平臺,建立在多簽名智能合約平臺Safe(原Gnosis Safe)之上。
此前5月份,Coinshift完成1500萬美元A輪融資,TigerGlobal領投,紅杉資本印度、Alameda Ventures、Spartan Group、Ethereal Ventures、Polygon Studios等參投。[2022/9/21 7:09:29]
檢索文章和社交媒體帖子的內容,然后建立情緒分析模型。該模型為文章中提到的實體分配了一個風險活動的概率。
數據:最近一周,以太坊網絡新增232萬枚NFT資產:金色財經報道,NFTScan數據顯示,最近一周,以太坊網絡新增232萬枚NFT資產,平均每天新增鑄造33.14萬枚NFT資產。[2022/7/14 2:12:08]
情緒分析模型
我們嘗試了四種不同的自然語言處理工具進行情緒分析,即VADER、Word2Vec、fastText和BERT模型。在通過選定的關鍵指標對這些模型進行評估后,RoBERTa模型表現最佳,被選為最終模型。
圖片來源:?https://www.codemotion.com/magazine/dev-hub/machine-learning-dev/bert-how-google-changed-nlp-and-how-to-benefit-from-this/
RoBERTa模型對新聞文章或社交媒體帖子的文本進行處理,并為特定文本分配一個風險分數。由于該文本在數據收集過程中已經被標記為實體,我們現在已經有了加密實體的相關風險指標。在后期,我們將多個文本的風險分數結合起來,給出一個實體的整體風險分數。
RoBERTa原本是一個使用神經網絡結構建立的情感分析模型,我們將最后一層與我們標注的風險分數進行映射,以適應風險評分的環境。為了提高模型在未來文本數據上的通用性,我們進行了幾種文本處理方法,即替換實體、刪除url和替換hash。然后我們使用這個表現最好的模型進行風險評分。
風險評分
現在,每篇文章都有一個相關的來源,一個風險概率和一個計數,指的是文章被轉發、分享或轉發的次數。為了將這些風險概率轉換為加密貨幣實體的單一風險得分,我們首先將文章的概率值縮放到0到100的范圍內,并獲得每個來源的加權平均值,結合文章的風險得分和計數。加權平均數用于對計數較高的文章給予更大的重視,因為份額數量很可能表明文章的相關性或重要性。
在計算出各來源的風險得分后,我們對各來源的風險得分進行加權求和,得到綜合得分,公式如下:
傳統的新聞來源被賦予了更高的權重,因為這些來源更有可能報道重大的安全漏洞。
該解決方案的有效性
我們在2020年1月1日至2020年10月30日的174個加密貨幣實體的名單上測試了我們的解決方案,并將結果與該時間段內的已知黑客案例進行了比較。我們發現,我們的風險評分方法表現相當出色,在37個已知的黑客案例中識別了32個。我們還分析了我們的解決方案對單個實體的有效性。下圖顯示了Binance從2020年1月1日至2020年10月30日的風險評分。虛線紅線代表已知的黑客案例。從圖中我們觀察到,我們的解決方案報告了5個已知黑客中的4個黑客的風險得分增加。也有幾個峰值與已知黑客案例不一致。然而,這并不構成一個主要問題,因為對我們的模型來說,更重要的是識別盡可能多的黑客,減少未識別的黑客數量。
有趣的發現
在風險評分過程中,我們注意到,與規模較小的實體相比,規模較大的實體的風險評分往往有較大比例的假陽性記錄。這是因為大型實體被談論得更多,因此會有更多的負面帖子和虛假謠言,從而導致更高的不準確率。
另一個值得強調的有趣趨勢是,圍繞著黑客攻擊通常有幾個明顯的高峰。這是由于不同數據源的反應時間不同。社交媒體網站Twitter和Reddit通常是第一個看到高風險事件發生時的高峰,因為用戶會發帖提出他們觀察到的異常情況,比如一個實體的網站在沒有事先通知用戶的情況下宕機。官方消息一般是在官方聲明之后,稍后才會發布。
局限性
我們發現,我們的解決方案有兩個潛在的局限性,首先是需要不斷地維護收集器。網站設計可能會隨著時間的推移而改變,這些網站的刮擦器需要更新,以確保相關信息仍能被檢索到,從而達到風險評分的目的。
第二個限制是,驗證一篇文章是否已被正確地標記為加密貨幣實體是具有挑戰性的。例如,一篇報道?Bancor?可疑活動的文章可能也會因為一個不相關的事件提到Binance。我們的解決方案會錯誤地將新聞標記為兩個實體,并將Binance標記為風險,即使它不是文本中的關鍵主題。然而,這并不是一個主要的限制,因為我們只使用新聞文章的標題和摘錄來進行風險評分,這通常只包含文章的關鍵信息。
結語
我們的項目讓監管機構可以輕松挖掘開源信息,更好地識別加密貨幣領域發生的風險事件。我們提供了一個分析文章并預測風險分數的語言模型,以及根據實體和來源信息匯總這些分數的方法。這些方法都被編織成一個可以端到端運行的自動化流水線。將該項目整合到Cylynx平臺中,將對其現有功能進行補充,并為監管機構識別高風險加密貨幣實體提供巨大的幫助。
Tags:加密貨幣OINCOINCOI加密貨幣是什么意思哪里最流行toncoin幣未來怎么樣yuanchaincoinKIWI Coin
原文標題:《觀點?|?比特幣:讓儲蓄成為儲蓄》?撰文:Parker?Lewis?翻譯:阿劍你有沒有遇到過那種投資顧問,諄諄教導你要讓自己的錢增值?這個觀念.
1900/1/1 0:00:00在以太坊創新高以后,價格有回調,并且整個市場回調也較多。從日線上來看,比特幣的走勢并不樂觀。在這種情況下,風險比較高的倉位,應當執行紀律,鎖定已有收益,應對好不確定性.
1900/1/1 0:00:00評估一個新產品或技術,需要回答一個重要問題:「是否會有人或公司接受這個產品?」我發現回答這個問題的最好方式就是回答另個問題:「其他替代品是否特別差或不存在?」如果回答「是」.
1900/1/1 0:00:00行情分析: 以太坊日內至反彈上攻未能突破1400位置后,行情開始一路下行,截至到目前跌幅已經達到210點,且低位打破昨日支撐位置,行情緩慢下行逼近1190一線,后續若再度破位.
1900/1/1 0:00:00為加強貝邦國際文化建設,增強團隊凝聚力與員工金融素質,1月17—19日,貝邦國際開展了2021年三亞培訓季會游活動。2021年1月18日上午9點,貝邦國際培訓季會游培訓直播開始.
1900/1/1 0:00:00只要方向對了就不要怕路遠,昨日晚間給到32800附近布局空單入場很明顯一直在盈利中,最低點31900,也是比較遺憾沒有達到我們的預期,也是我們的空軍籌碼過重,過多軍師紛紛表示看空.
1900/1/1 0:00:00