我年少時遇到過一個非常風趣博學且經常引經據典的數學老師,她在課上給我們講過很多讓人印象深刻的數學發展史小故事,其中就包括了著名的“柯尼斯堡七橋問題”。
作為一個關注中國科技發展和前沿技術應用的作者,每年國內最重要的幾個科學技術獎項一直都是我關注的重點。我之所以在這個時間節點上,想起了這位老師和她的故事,源自于一張“2022中國電子學會科學技術獎”的獲獎名單。
這個獎項是由國家科學技術獎勵工作辦公室批準設立的,已連續評選了19屆,是國內電子信息領域最高獎項,也一直被認為是國內電子信息技術發展的風向標,獲一等獎及以上的項目,可以擇優提名中國國家科學技術獎的評選。
在今年公布的科技進步一等獎名單里,就有一個叫做“大規模復雜異質圖數據智能分析技術與規模化應用”的項目。
這個項目引起我的注意,主要有兩個原因。一是這個項目所涉及的,正是現在科技界炙手可熱的“圖技術”,這是個大眾十分陌生,但在科技界已經成為各大巨頭們兵家必爭之地的前沿技術,而且其應用早就已經滲透到了普通人日常生活之中。
二是這個項目,是由北京郵電大學和螞蟻集團等團隊合作完成的。它所代表的高校+民營企業的科研合作模式,在這些年越來越受到歡迎和重視,它代表著中國民營企業在中國科技創新領域正在成長、甚至已經成長為了一支極為重要的力量。
螞蟻集團對圖技術的研發也只是這支力量的一個縮影,向其身后望去,看到的或許將是未來中國民營科技創新的星辰大海。
01
圖:理解世界的全新方式
現在的俄羅斯,有個飛地叫加里寧格勒,位置在波蘭和立陶宛之間。
三百年前,這里還叫柯尼斯堡,一條名叫普列戈利亞的河流橫穿這座城市,并將城市分割成了中心兩個小島和其他河岸陸地的布局,當地人為了方便交通,在河上建了七座橋。
在蘇聯還沒將這里收入囊中之前,這里曾是德國東部最著名的文化中心之一,也曾是條頓騎士團和普魯士的“龍興之地”。無數游客與行人們穿行在這個忙碌而又繁華的城市,久而久之便有人在游覽這里時提出了一個問題:
聲音 | 中國科技產業化促進會副理事長:區塊鏈在金融服務等領域有著廣泛的應用價值:金色財經報道,近日,“中國區塊鏈賦能新時代高峰論壇”在江蘇連云港市舉行。中國科技產業化促進會副理事長周華表示,從行業層面來看,區塊鏈作為一種新興的應用模式,在金融服務、供應鏈管理、健康醫療、文化娛樂、智能制造、社會公益和教育就業等領域有著廣泛的應用價值。[2019/12/26]
一個步行者,要怎樣才能不重復、不遺漏地一次游覽完七座橋,最后還能回到出發點呢?
這個謎題被提出后始終沒能解決,以至于一度成為了當地人十分熱衷的一項消遣運動,許多人曾聲稱找到了解決方案,但被要求按照規則再走一遍時卻都失敗了。直到1736年,29歲的天才數學家歐拉寫下了一篇名為《柯尼斯堡七橋問題》的論文。
他將每一塊陸地視為一個“點”,連接陸地的橋梁視為“線段”,將德國的“龍興之地”抽象成了一個簡單明了的數學模型,并將柯尼斯堡七橋問題提煉為了一個典型的一筆畫問題,最終得出了準確的結論:這是一個無法一筆完成的圖形,人們不可能不走重復路段并一次性游覽完七座橋再回到出發點。
我每次想起這個故事,都深覺時間于人類科技傳承之間的美妙與宏大。
彼時,距離世界上第一臺計算機的誕生還有兩百年的時間,做夢都不會有人能想到,歐拉的論文將要開辟的,是未來計算機科學領域最重要、最有趣,也幾乎是最容易被誤解的一個基礎理論體系:圖論。
更不會有人知道,三百年后,以圖論為基礎的圖技術,在今天這個百年未有之大變局的時代,將會成為整個科技界最前沿最受關注的風口技術,甚至成為再下一個百年里科技競賽的兵家必爭之地。
用Gartner在《2021年十大數據和分析技術趨勢》報告中的預測來說,到2025年,也就是從現在開始到兩年后,圖技術就將會應用于80%的數據和分析創新。
今天大家對大數據、AI、算法推薦這些名詞已經熟悉得不能再熟悉了,而你今天聽到的幾乎所有用得到大數據分析和AI算法相關的應用,無論是支付寶的移動支付,還是抖音的算法推薦,亦或者精準地預測天氣預報、電網復雜的故障分析和保障、各大電商平臺上的智能推薦,甚至是你在螞蟻森林偷個能量……
聲音 | 中國科學院張景中:要在人工智能領域實現更大發展 需通過區塊鏈等解決信息安全問題:據人民網消息,數學家、中國科學院院士張景中表示,目前人工智能在蓬勃發展的同時,也還面臨一些難題,比如缺乏法律保護,數據融合共享還不夠,數據爆發式增長帶來信息安全問題等。在他看來,要在人工智能領域實現更大發展,需要構建嚴格的法律保護體系,打破政府、企業、機構之間的信息“孤島”,并且通過區塊鏈、加密技術、人工智能算法等解決信息安全問題,創造新的增長點。[2019/11/10]
到兩年后,至少將有80%都是由圖技術在背后進行支撐的。
柯尼斯堡七橋問題的解決,成為了計算機科學發展史上一個重要伏筆。在英文中,圖片是“image”,圖形叫“graphics”,而圖技術的“圖”與圖論的“圖”一脈相承,寫為“Graph”,它指代的是一種結構模型,一種以“節點”和“關系”解構和看待問題的系統。
在我看來,這是一種以“思維導圖”的方式理解這個世界的全新視角、全新體系。
柯尼斯堡七橋問題的解決過程,就是這種新視角最好的詮釋。歐拉將每一塊陸地視為節點,每一座橋梁視為連接這些節點的“邊”,這種建模方式天然就關注“鏈接”和“事物之間的聯系”,而且對這種聯系的方向和屬性都有更出色的描述能力。
相比傳統的方式,以“圖”的結構形式來認識世界,尤其是認識事物之間的聯系,顯然更加直接和先進。
就拿社交平臺的關系網絡來說,不知道大家有沒有在其他朋友的關注列表里尋找共同好友的經歷,傳統的方式,是把兩個人的好友都列出來,然后尋找其中重合的部分。
而圖數據本身就是通過事物間的聯系組織的數據結構,所以想要尋找“共同好友”,甚至都不需要檢索,因為一切關系在圖上完全就是一目了然的,你只需要定位就行了。
聲音 | 中國科學院何積豐:區塊鏈的應用范圍超乎大家的想象:據中國經濟網消息,中國科學院何積豐院士在日前于上海舉辦的第三屆區塊鏈開發大會上表示:“區塊鏈的應用范圍超乎大家的想象,在很多行業如支付網絡、電子錢包、反欺詐、供應鏈、智能制造等展開了應用,并創造了很多經典的商業案例。盡管區塊鏈面臨很多挑戰,但未來值得期待。”[2018/12/21]
進入信息爆炸的大數據時代之后,人工智能、機器學習開始越來越強調相關性和因果性。而“圖”這一數據構建方式,恰恰就關注,甚至基于相關性和因果性。這種數據結構幾乎天然就是為了AI時代而生的,它讓很多過去看上去十分復雜的問題,在這種理解世界的全新視角之下都變得迎刃而解。
02
圖技術里的產業鏈未來
圖技術應用最典型的案例,是金融風控。
我早年做一二級市場并購研究的時候,有個私心覺得十分迷人卻也十分糟心的活,就是研究股權關系和資金鏈,其中很重要的一個環節就是研究擔保鏈。
比如A企業要貸款,說我找B企業擔保,B企業又找了C企業,C企業找D企業。D企業說好啊,但你一查,發現D企業可能又找B做了擔保。最后大家形成了一個閉環,這樣的擔保根本是無效的。風控就是要找出擔保鏈上的這類問題,避免把錢貸出去收不回來。如果用“圖”的方式來理解,其實就是在擔保的關系網絡里尋找和定位“成環”的部分。
傳統的方式不是不能做,但排除風險所需要的時間和資源需求都很高,而且也沒有那么準確全面,能力有限。比如有些銀行用MapReduce大數據處理的方法,但在企業擔保場景里,它大概只能找到長度為6的環,再長的就找不到了。
套現交易檢測相比擔保的場景對時效性的要求就更高,同時不僅時效性要求高,還需要綜合考慮多種信息來提高檢測精度。因為在套現交易檢測里雖然也需要識別閉環,但簡單地檢測交易閉環所得出的結果,往往是不夠精準的。
舉個例子,A轉賬給B,B轉賬給C,C再轉賬給A,這是一個交易閉環,意味著可能存在套現交易。
但如果A轉賬給B后半個月,B再轉賬給C;C再過半個月,才轉賬給A。這雖然也形成了一個閉環,但因為黑灰產作案需要考慮時間成本,所以在現實生活中這種情況往往不是在進行套現。
聲音 | 中國科學院院士王小云:沒有哈希函數的概念就不可能有區塊鏈的概念:人民網北京12月18日電,中國科學院院士、中國密碼學家王小云今天下午做客人民網強國論壇“改革開放 巾幗力量”網絡訪談。王小云的主要研究領域是哈希函數,哈希函數是區塊鏈最為核心的密碼技術。王小云說:“沒有哈希函數的概念就不可能有區塊鏈的概念。全球計算機網絡、計算機系統電子簽名,還有眾多的密碼系統都使用哈希函數,沒有哈希函數,這些算法和系統就會產生安全問題,出現安全漏洞。”[2018/12/19]
要更加確地判斷這類交易的性質,就需要在圖上融入時間信息。這就是所謂的“動態圖”。
再比如,同一個閉環中,如果B是一個大企業賬戶,那大概率不會認為A->B的交易存在問題。但如果A/B/C之間本就互相認識,且都是通過線下掃碼支付進行的交易,那存在套現風險的可能性就明顯很高。
在圖上融入比如節點的類型、邊的類型等信息,這就是所謂“異質圖”的概念。
傳統方式尋找閉環本身已經比較吃力,更不要提在尋找閉環的基礎之上,還需要綜合考慮其他信息。所以必須得做圖技術。
真實應用中的圖數據都很復雜,既包含動態性,又包含異質性,需要對這些特性同時進行建模,才可以有更高的識別精度。
螞蟻開始研究圖技術,最初就是源于業務需求的驅動。2020年雙11的最高交易數是每秒58萬筆,在如此之高的并發下,要求在極短的時間內極高精度地檢測出風險,還要保障交易能夠按時完成,以傳統的形式幾乎沒有可能。所以一直以來有人說中國的移動支付能夠發展起來純粹得益于人口紅利帶來的高頻應用場景,缺乏技術含量,我都是極不贊同的。
在軟件界,越是易用、淺白,卻還功能齊全的軟件,就意味著越高的開發難度。支付領域也一樣,用戶越是能簡單、快速、便捷、安全地完成支付,就意味著背后需要越強大的硬核技術實力進行支撐。
拿這次獲獎的“大規模復雜異質圖數據智能分析技術與規模化應用”項目來說,北郵和螞蟻等團隊合作攻堅了十年,期間累計拿了43項國內外的發明專利,51篇CCF-A類論文等知識產權成果,還參與了2項行業標準的制定。
動態 | 區塊鏈項目入選2018年度中國科協學科發展項目:科學網7月23日消息,7月20日,中國科協學會學術部公布了2018年度中國科協學科發展項目入選項目,共75個。其中包括中國自動化學會的《區塊鏈技術前沿熱點綜述》項目。[2018/7/23]
過程不可謂不艱辛,當然成果也不可謂不豐碩。
根據官方發布的信息,近兩年來,該技術項目已為金融、互聯網、通信、電力等行業的十多家企業節省了7億左右的成本。作為項目實踐案例的網商銀行“大雁系統”將核心企業上下游的小微商家貸款可得率從30%提升至了80%。支付寶如今可以在0.01秒內完成對一筆交易的風險判定,2021年資損率小于億分之0.98——即平臺上每1億人民幣的資金流轉中,只有不到1塊錢的損失風險。
人類社會的進步,本質建立在生產力提升的基礎之上,而生產力提升的本質則是效率的提升。二十年前一筆交易的判定可能要1分鐘,二十年后只需要0.01秒,并且對上萬億動態的、異質的數據進行分析和識別,能支撐這種效率和精度提升的圖技術毫無疑問是未來推動社會進步和科技創新的一項重要基礎技術。
它的應用場景也不止在金融領域,在能源、交通、醫療領域也有大量應用。
比如天氣預報,其原理是將地球按照“經度-緯度-氣壓層”劃分成超100萬個小網格,并在網格上確定天氣狀態。一個網格天氣的變化,可能會受到很遠的網格的影響,預測天氣的難點就在于如何建模如此大量的網格之間高效且稀疏的交互影響。
開發過AlphaGo的DeepMind和谷歌新研究出了一種基于機器學習的天氣模擬器GraphCast,這個模型用多尺度網格圖的方式建模了這些小網格,利用了一個16層的圖神經網絡,即可實現局部和全局的信息傳播,可以捕捉到比傳統方法更長的空間互動,從而極大地提高了天氣預測的準確率。
對未來于4至10天內天氣變化趨勢的預報,被稱為“中期天氣預報”,其準確性對于農業、建筑業、旅游業等行業的政策制定來說至關重要。目前GraphCast可以在60秒內預測未來10天內的天氣,而且準確率極高。
大型制造業比如半導體行業、新能源行業,也是圖技術應用的重要場景。這些工藝路線長,設計設備多,參數復雜,產品數據量極大的產業,每一個環節和數據之間往往都有很復雜的關聯性,而圖技術特別適合處理復雜關系、發現隱藏的特殊關聯,不僅可以分析風險,甚至可以預測潛在的設備、工藝、供應鏈風險。只要是需要體現關聯性的地方,圖技術的處理方式就有時效性和精確性的天然優勢。
社交媒體和電商的推薦系統這些極為日常的場景,已經被圖技術深入滲透,在新藥研發、智慧交通、工業物聯網、傳統產業數字化升級改造層面,圖技術都有極為廣闊的應用前景。
03
民營企業的創新活力
“大規模復雜異質圖數據智能分析技術與規模化應用”項目,只是中國民營企業和高校合作推動中國科技創新的一個縮影。
根據2020年數據,我國的民營經濟貢獻了50%以上的稅收,60%以上的國內生產總值,和70%以上的技術創新成果。
2021年我國全社會研發投入27900億元,其中76%來自企業投入;2021年國家重點研發計劃中的79%是由企業牽頭或企業參與的,而民營企業的投入還在增長,2021年,我國企業研究與試驗發展(R&D)經費支出21500億元,比上年增長了15.2%。
我特意拉出了中國電子學會科技進步一等獎從2012年到2022年十年來所有的獲獎名單。早年間這個名單上獲獎項目的主要完成單位,大多是各大高校和相關專業的研究所,出現在名單上的民營企業則主要是一些通訊設備硬件和服務的提供商,比如中興、華為等等。
而隨著時間的推移,這個名單上開始出現越來越多各行各業的民營企業,阿里、百度、騰訊、網易、奇安信、OPPO、TCL、海信、京東方、螞蟻集團……這些互聯網巨頭和各自領域的龍頭企業,都開始出現名單里。
根據國家知識產權局知識產權發展研究中心發布的《中國民營企業發明專利授權量報告》,截至2021年年底,研發投入前1000家民營企業的研發費用總額已經達到了1.08萬億元,占全國研發經費投入的38.58%,占全國企業研發經費支出的50.16%;同比增長23.14%,增速比全國高8.5個百分點,比全國企業高7.9個百分點。
中國民營企業500強國內外有效專利合計為633922項,較上年增幅53.60%。其中,國際有效專利134657項,增幅為474.65%。在《國家中長期科學和技術發展規劃綱要(2006-2020年)》指導下發展的近20年里,正在涌現出越來越多源自民營企業的科技成果。
在不知不覺間,全球經濟競爭格局已經發生了轉變,國家間的綜合國力競爭,演變成了以科技創新為核心的發展競爭。
卡脖子是一件很痛的事,這些年一直埋在每個中國人的心里。但能讓人好受一點的是,這樣的國際環境,也進一步促進了中國企業自主創新意識的提升,迫使企業走上了國際科技競爭的舞臺。其中大量都是民營企業。
以前的很多技術空白正在被一點點填補起來,手機操作系統有華為的鴻蒙,人工智能我們也有了百度自主研發的深度學習平臺,云計算領域阿里有著深厚的技術積累,新能源汽車領域從比亞迪到蔚小理,都已經走在世界前列。中國的民營企業正在成為我國參與國際科技競爭和掌握國際科技創新話語權的代表者,以超乎想象的科技創新活力,成為全球市場上不可忽視的一支力量。
結語
2011年,北京郵電大學計算機系教授石川因為一個契機,最早接觸到了圖智能技術中的重要概念,異質圖。
這個概念最早由國際數據挖掘權威韓家煒和俞士倫在2009年提出。彼時,業內對這個概念的接受度還很低,一些該領域的奠基之作投稿頂會論文,也被拒了好幾次。
但好的技術會發光,石川不甘這樣的技術被埋沒,踏上了長達十多年的布道之路。后來,石川遇到了產業界做圖技術領先的螞蟻集團,雙方一拍即合搭建了科研小組。經歷過大規模工業級場景的考驗,螞蟻已對圖技術游刃有余,與學術界的雙劍合璧,催生出了開篇提到的圖智能研究成果,將圖智能水平提升到了新的層次。
圖這樣的技術,發展到一定程度就需要一個自身規模就夠大,應用場景就夠多的平臺做舞臺,才能進一步的進化迭代,這種事小型創業團隊很難做得了,過去二十年里成長起來的中國科技產業巨頭們,就成了前沿技術大規模推廣應用的重要力量。
而還有更多的企業,雖然未必像大平臺一樣能量巨大,但也逐漸成長為了產業鏈上的關鍵技術企業。
工業和信息化部自2016年發布《制造業單項冠軍企業培育提升專項行動實施方案》以來,共計公布了六個批次的“單項冠軍”評選結果,這些企業在細分產品市場中實現了生產技術或工藝的國際領先,共計848家“單項冠軍”里,有400多家是民營企業。
去年我們盤點過中國航母相關的供應商,山東艦的配套單位一共532家,其中非軍工的社會配套單位就有412家,其中民企占了半壁江山。
我寫這篇文章之前,剛剛去二刷了《流浪地球2》,片子的導演郭帆經常被人調侃為全中國最會“化緣”的導演,拍球1的時候帶著個草臺班子,拍球2就已經建立起來了一套完全屬于中國電影工業自己的標準化管理體系,實現了云端的5G媒資管理和現場拍攝的直播推流。
5年左右的時間,試圖給中國科幻電影趟出一條路的《流浪地球》主創團隊,就從草臺班子變成了現代化、工業化的電影制片廠,成為了中國文化先進生產力的代表。
而所有這些為人知、不為人知的公司,看得見、看不見的努力下,中國的民營企業已經成為我國科研創新和社會進步的重要力量,爆發出超乎想象的科創力。
Tags:Graph人工智能CCFGraph幣是什么幣人工智能技術應用學人工智能后悔死了人工智能考研考哪些科目CCF幣CCF價格
2023年歷經多輪牛熊的加密貨幣,在元宇宙和NFT的影響下,再次引起越來越多人關注這個領域。而在香港,不同的人更是成為了加密貨幣網紅,引起加密貨幣熱度的提升.
1900/1/1 0:00:00一、新加坡是個什么樣的國家?新加坡位于馬來半島南端,距離赤道很近,是一個東南亞熱帶島國。新加坡國土面積不大,資源也相對匱乏,但其經濟發展堪稱世界經濟發展史上的奇跡,人均GDP8萬美元,是亞洲經濟.
1900/1/1 0:00:00USDC發行公司Circle將資金存放在硅谷銀行,該銀行已停止運營。USDC交易價格最低為0.8799美元。在硅谷銀行破產后,人們對這種加密貨幣的支持產生了懷疑.
1900/1/1 0:00:004月4日,Twitter首席執行官馬斯克在他的個人主頁上做了一個驚人的舉動:他將公司網站上原本代表著Twitter品牌形象的藍鳥圖標換成了一張數字貨幣標志柴犬的圖片.
1900/1/1 0:00:00近日,歌手林俊杰曬出一個“空錢包”引發無限猜想。有消息稱,林俊杰購買的虛擬地產浮虧超90%。再加上今年以來,不少科技企業收縮元宇宙業務戰線,元宇宙要“涼涼”了嗎? 虛擬地產價格扛不住了 據多家媒.
1900/1/1 0:00:00隨著科技的快速發展,許多新興行業和職業逐漸受到關注,以下是幾個適合男生學習掌握的熱門技能,掌握它們可以為你未來的職業發展提供更多的機會。更多熱門技能及考試考證資格免費查詢↓↓↓1、人工智能.
1900/1/1 0:00:00