背景介紹
我叫小明,是一個每天喜歡胡思亂想的打工人。
隨著年輕人的創業熱潮的到來,我有一種創業的沖動。經過長時間的探索,我現在萌生出了一個極具創造性的點子,如果以此為依據進行創業的話一定會引起熱潮。
首先,為了確定我的想法是不是獨一無二的,我必須先通過搜索引擎進行查詢。這里有一個我很在意的問題——我在搜索引擎里搜索了我的創意,瀏覽器會將我的創意直接發送給搜索引擎的服務器,如果我的創意確實是獨一無二的,那這樣直白的搜索方式一定會把我的創業完全暴露出來,這對我來說非常致命,我絕對不能讓任何人有竊取我創意的可能。
如何才能保證在不讓搜索引擎知道我具體要查詢什么東西的情況下獲得我想要的數據是我亟待解決的難題。
美國與“創作者經濟”相關的初創公司今年內共籌集超 37 億美元資金:11月1日消息,據 The Information 創作者經濟數據庫的數據,截至 10 月中旬,今年約有 101 家專注于創作者的美國初創公司籌集了超過 37 億美元的資金。雖然第三季度的資金比第二季度有所下降,但連續兩個季度超過 10 億美元的投資使該行業有望在年底前籌集超過 50 億美元的新資金。[2021/11/1 6:24:21]
簡單做法
我的第一個主意是將搜索引擎中所有的數據全部下載下來,將原來的在線查詢轉換成為本地查詢。這就意味著我不用將我的點子發送給服務器端,我就可以充分地保護好自己的隱私了。
不過我還得考慮到另外一個問題,搜索引擎的服務器可是有pb級別的數據量,我下載下來就得花費我幾天的時間,另外我還得專門再去買幾塊大容量的硬盤,這對我來說實在是太過于昂貴。
Huobi “創新區”于5月12日上線新幣LAT (PlatON):據官方消息,Huobi Global“創新區”定于2021年5月12日上線LAT (PlatON)。目前Huobi已開放LAT的充幣業務;充值量滿足市場交易需求時開放LAT幣幣交易(LAT/USDT、LAT/BTC)。具體時間將以公告形式提前通知。[2021/5/12 21:51:57]
分?桶
我換了一個想法,既然沒機會直接把搜索引擎的數據庫都給扒下來,我就試著扒下來一部分數據,然后我再本地查詢,這樣對我來說,準備的硬盤也可以少一點。
比如說,我本來想要查詢的數據是“小明是大帥哥”,這樣無疑就向搜索引擎公司暴露我是帥哥的隱私了,那我就可以換一種方式,我就查詢“大帥哥”,這樣我收到的數據雖然有很多都是我不想要的,但是里面卻會包含“小明是大帥哥”的搜索內容。這樣,我就將全部的數據庫下載換成了部分數據庫的下載。獲取部分數據庫內容以后我就可以本地再去查詢了。
Coinbase承諾將10%的資源用于“創新押注”:Coinbase首席產品官Surojit Chatterjee在一份聲明中表示,Coinbase正在采取一種新的創新方法。Chatterjee表示,該交易所將投入10%的資源支持“顛覆性創新押注”。(The Block)[2021/4/22 20:45:27]
這里用到了數據“分桶”的預處理技術,用于減少次要觀察誤差的影響,是一種將多個連續值分組為較少數量的“桶”的方法。
隱私性保護
分桶的做法雖然很好,但是無疑向數據庫泄露了部分隱私,比如“大帥哥”這個信息,雖然服務器沒有獲知“小明是大帥哥”這個隱私,但是無疑泄露了我對“大帥哥”相關信息比較感興趣,我不想為了保護我的具體隱私讓服務器產生其他的誤解。
我只能換一種方式,傳統的隱私查詢技術給了我一點提示。
▲?背景說明
SushiSwap核心開發者發起“創建NFT交易所NATTO”的新提案:SushiSwap核心開發者levx.eth發起新提案,提議創建NFT交易所和Launchpad——NATTO(納豆)。除了為UniswapV3NFTLP代幣持有者提供無縫銷售解決方案外,該方案還將為Sushi社區提供一個gas費優化的NFT交易平臺,通過專營店和個人畫廊launchpad支持NFT藝術家和收藏家。主要細節如下:-支持任何ERC721/1155代幣交易,無需許可。默認貨幣為ETH和SUSHI,但是支持任何SushiSwap上線的ERC20代幣作為支付方式;-有三種訂單類型:固定價格、荷蘭拍賣以及英式拍賣;-對UniswapV3LP代幣(TLDR,即NFT)提供原生支持。當UniswapV3LP代幣出售時,賣家可以選擇自動轉換Sushi的對等代幣對(如果有的話);-包含NFTLaunchpad,用戶可以在NATTO上開自己的專營店;-交易費用為2.5%,所有費用歸xSUSHI持有人所有。[2021/3/26 19:20:11]
傳統的隱私查詢技術對于數據保存結構有特殊的要求:首先數據庫得是公開的,即我可以隨時調取查看服務器里的任何數據;其次,在很多個服務器上都得部署完全相同的數據庫;再者,這些部署了數據庫的服務器互相之間不能溝通;最后,假設數據庫擁有n個數據X?、X?…?Xn,那么在數據庫中其存儲形式為一個n維向量。
動態 | 火幣高管刷屏告別Hadax照片為事件營銷 Hadax或將改名為“創業板”:9月10日晚7點左右,火幣眾多高管,包括火幣COO朱嘉偉、火幣高級商務總監魯邁等,在微信朋友圈發布拆掉“HADAX”牌子的照片,表示“再見,HADAX!”。經媒體報道,今日火幣高管刷屏告別Hadax照片,實際原因系Hadax將于明日更名,據傳新名稱為“創業板”。[2018/9/10]
▲?簡單技術方案
如果我現在需要的是數據Xi,那么其實我應該做的事情很簡單,就是自己生成一個n維向量,只在第i個位置放1,其余的所有位置都放0,很明顯的,這個時候我生成的這個向量和數據庫里的向量內積就可以獲得結果Xi。
但是這樣會存在一個問題,我如果直接將我的向量發送給服務器,他們明顯就知道我需要的是什么數據了,那我只能通過另外一種方式來保護我的隱私,將我的向量拆分。如果我把我生成的向量記為r,假設有k個服務器,注意這里k≥2,那么我只用將r拆分成為k個向量即可。更具體的,我可以拆分為:
然后將每個分量ri發送給一個服務器。然后服務器自己本地求內積,將結果發送給我,我收到k個結果后求異或就可以復原出Xi的值了。
通過算法描述,相信大家也能理解為什么服務器一定需要大于兩個,而且這些服務器之間還不能互相溝通。如果服務器之間互相可以溝通的話就可以復原出我的查詢r了。
這個算法有一個很致命的問題,就是我生成的查詢r其實是和服務器的數據大小一樣大的,如果服務器有幾千億的數據,我的r就得有幾千億維,并沒有降低網絡消耗,而且更糟糕是,我得生成很多份分量,而每個分量的大小都和數據庫一樣大,這種方式無疑比直接下載數據更加龐大。
▲?優化技術方案
因為巨大的傳輸量,我們現在可以對服務器的數據保存方式進行改進,原先的保存方式為向量,現在可以改進為矩陣,假設數據庫有25個數據,那么數據將會變成如下形式
我們此時生成的向量就可以從原來的25維縮減到5維,例如我們需要的數據是,在矩陣的第一行,那我們就可以生成查詢,此時服務器內積后會將第一行返回給我們。
同之前的方案,我們不能直接將查詢r發送給服務器,還是需要進行拆分,然后發送給服務器。同樣的流程過后我們就能第一行元素。這樣對每個服務器我們上傳的數據量為一個5維向量,下載量也同樣是一個五維向量,同時,對于每個服務器來說,他們并不知道我們最后拿到的是哪一行。
這個方案的數據總傳輸量為2k√n,這里的n為服務器擁有的總數據量,k為服務器個數,通常,只需要兩個服務器就能達到安全性的要求,故總傳輸量4√n。
在數據量大于16的情況下,這個策略的數據傳輸量已經小于直接傳輸整個數據庫的數據量了。
▲?再進階做法
我按照之前的想法在搜索引擎里查詢了一下我的創意,發現里面并沒有相關內容。我正準備慶幸沒有別人做了和我相同的事情的時候,我的朋友張三麻子和我說我用的搜索引擎查詢的結果可能不會很準,推薦了一個相關的收費網站給我,這個網站可以查詢到全球所有公司以及其具體業務模式。不過他們是按照查詢條數收費的,故不可能像搜索引擎那樣隨便讓我下載資源了。這個時候我的查詢數據需要隱私,同時他們的數據庫內容也需要隱私。
這個時候可以對之前的算法進行進一步升級,將服務器從2個擴展為4個,我同時發起行查詢和列查詢。比如我需要的數據,在矩陣里的第一行第三列,那么我就會進行第一行與第三列的查詢。行列查詢都分別拆分兩個分片,這樣總共有4種組合可能,四個服務器分別選取其中一種組合本地進行計算。這樣服務器便只會發送混淆后的一個元素回來,不會暴露自己的任何額外信息。
討論及總結
以上的算法有一個很關鍵的問題,即我知道我需要的數據是數據庫中的第幾個元素,但是通常情況下,這樣的查詢方式是不現實的。更為普遍的查詢方式為k-v查詢,即我依據某個k去數據庫查詢其對應的v。
例如,我去搜索引擎里搜索“我是大帥哥”,此時k就是“我是大帥哥”,百度返回的搜索結果就是其對應的v。如何將傳統的隱私查詢技術進行升級以配適現實生活中的實際場景仍需要進一步的探索。
數據安全是現在從個人到國家都非常重視的領域,如何將我們的隱私數據安全的使用起來也是我們一直以來努力的方向。
作者簡介
劉毅恒
來自趣鏈科技數據網格實驗室BitXMesh團隊,一個鮮為人知的程序員
分析師|Carol?編輯|Tong?出品|PANews本月,BTC橫盤后開始下跌,從4月1日的開盤價58926.56美元下行至4月27日的收盤價55033.12美元,跌幅約為6.61%.
1900/1/1 0:00:00幾個月前,Doge在整個鎮子中獨領風騷,而現在則要拿著放大鏡才能找到他。新的資金可以帶來新的流動性。Doge曾希望這種流動性能將街道上的臟東西清理干凈。 但他弄錯了。 且大錯特錯.
1900/1/1 0:00:005月27日晚間,著名美術史論學者、2003年起執教UBC美術史系曹星原坐客《8問》大事件,獨家解讀NFT加密藝術的價值.
1900/1/1 0:00:00https://shiden.plasmnet.io今天,我們很高興的跟大家介紹我們新提出的核心功能X-VM.
1900/1/1 0:00:00本文大概6500字,讀完共需10分鐘編者按:5月10日,中國人民大學重陽金融研究院高級研究員、北京航空航天大學教授,清華長江講座教授,北航數字社會與區塊鏈實驗室主任蔡維德.
1900/1/1 0:00:00灰度的比特幣信托作為衡量機構對比特幣興趣的基準,是有原因的。灰度不再是投資者的唯一選擇灰度的數字貨幣投資產品是唯一為對沖基金、捐贈基金、養老基金和家庭辦公室提供的一種接觸到比特幣,而不需要他們自.
1900/1/1 0:00:00