IOSG Ventures:為什么FHE在Web3會有更好的應用前景?
隱私是人類和組織的基本權利。對個人而言,它幫助人們自由表達自己,而不必向第三方透露任何不想分享的信息。對於當今的大多數組織而言,數據被視為主要商品,數據隱私對於保護這一商品至關重要。密碼朋克運動和數據商品化加速了密碼學原語的研究和發展。
密碼學是一個相當廣泛的領域,當我們在計算的背景下看待密碼學時,我們已經看到許多不同的方案,例如零知識證明、同態加密、Secret 共享等,這些方案自 1960 年代誕生以來一直在不斷改進。這些方案對於解鎖私人計算方法至關重要(數據之所以是是主要商品,那是因為人們可以從中發現生成洞察)。直到今天,Private 計算領域在多方計算和零知識證明方面有了顯著發展,但輸入數據本身始終存在隱私問題。
當最重要的商品公开時,任何數據所有者要在沒有法律協議的情況下將此數據的計算外包出去是非常困難的。今天,每個人都依賴於數據隱私的合規標准,如針對健康數據的 HIPAA 和專門針對歐洲地區數據隱私的 GDPR 等。
在區塊鏈領域,我們更相信技術的完整性,而不是監管機構的完整性。作為去許可和所有權最大化的信徒,如果我們相信用戶擁有數據的未來,就需要無信任的方法來對這些數據進行計算。在 2009 年 Craig Gentry 的工作之前,在加密數據上執行計算這一概念一直沒有突破。這是第一次有人能夠在密文(即加密數據)上執行計算(加法和乘法)。
1. 全同態加密 (FHE) 的工作原理
那么,這種允許計算機在不了解輸入的情況下執行計算的「魔法數學」到底是什么呢?
全同態加密(FHE)是一類加密方案,它允許在加密數據(密文)上執行計算而無需解密數據,為隱私和數據保護打开了一系列用例。
在 FHE 過程中,當數據被加密時,會向原始數據添加稱為噪聲的額外數據。這就是加密數據的過程。
每次執行同態計算(加法或乘法)時,都會添加額外的噪聲。如果計算過於復雜,每次都添加噪聲,最終解密密文就會變得非常困難(這在計算上非常繁重)。這種過程更適合加法,因為噪聲呈线性增長,而對於乘法,噪聲呈指數增長。因此,如果有復雜的多項式乘法,解密輸出將非常困難。
如果噪聲是主要問題,並且其增長使 FHE 變得難以使用,就必須加以控制。這催生了一種稱為「Bootstrapping」的新過程。引導是一種使用新密鑰對加密數據進行加密並在加密中解密的過程。這非常重要,因為它顯著減少了計算开銷以及最終輸出的解密开銷。雖然 Bootstrapping 減少了最終的解密开銷,但在過程中會有大量的操作开銷。這可能既昂貴又耗時。
目前主要的 FHE 方案有:BFV、BGV、CKKS、FHEW、TFHE。除了 TFHE,這些方案的縮寫都是其論文作者的名字。
可以將這些方案視為同一國家中講的不同語言,每種語言都針對不同的優化。理想狀態是統一這個國家,即所有這些語言都能被同一臺機器理解。許多 FHE 工作組正在努力實現這些不同方案的可組合性。像 SEAL(結合 BFV 和 CKKS 方案)和 HElib(BGV + 近似數 CKKS)這樣的庫幫助實現 FHE 方案或不同計算的方案組合。例如,Zama 的 Concrete 庫是一個針對 TFHE 的 Rust 編譯器。
2. FHE 方案比較
下面是查爾斯·古特、迪米特裏斯·穆裏斯和奈克塔裏奧斯·喬治·楚索斯在其論文《SoK:通過標准化基准對全同態加密庫的新見解》SoK: New Insights into Fully Homomorphic Encryption Libraries via Standardized Benchmark(2022)中對不同庫的性能比較。
Web3 用例
當我們今天使用區塊鏈和應用程序時,所有數據都是公开的,所有人都可以看到。這對大多數用例是有利的,但完全限制了許多需要默認隱私或數據保密的用例(例如機器學習模型、醫療數據庫、基因組學、私人金融、不被操縱的遊戲等)。FHE 支持的區塊鏈或虛擬機本質上允許整個鏈的狀態從起點开始加密,確保隱私,同時允許在加密數據上執行任意計算。所有存儲或處理在 FHE 支持的區塊鏈網絡上的數據本質上是安全的。Zama 有一個 fhEVM 方案,允許在完全同態環境中進行 EVM 計算。這在執行層面為任何使用此庫構建的 L1/L2 項目確保了隱私。盡管隱私鏈一直是很酷的技術,但採用率和代幣表現並未顯著提升。
在外包通用計算方面,FHE 本身並不是要取代 ZK 和 MPC。它們可以相互補充,創造一個無信任的私人計算巨頭。例如,Sunscreen 正在構建一個「隱私引擎」,這基本上允許任何區塊鏈應用程序將計算外包到他們的 FHE 計算環境,並可以將計算結果反饋回來。生成的計算可以通過 ZK 證明進行驗證。Octra 正在做類似的事情,但使用的是一種不同類型的加密方案,稱為 hFHE。
ZK 證明擅長在不透露數據的情況下證明某事,但證明者在某個時間點仍然可以訪問這些數據。ZK 證明不能用於私有數據的計算;它們只能驗證某些計算是否正確完成。
MPC 將加密數據的計算分散到多臺機器上,平行執行計算,然後將最終計算結果拼接在一起。只要進行計算的大多數機器是誠實的,就無法檢索原始數據,但這仍然是一個信任假設。由於 MPC 中需要各方之間的不斷通信(數據需要不斷拆分、計算和重新連接),通過硬件進行擴展變得困難。
在 FHE 中,所有計算都在加密數據上進行,無需解密數據,而且這可以在單臺服務器上完成。FHE 的性能可以通過更好的硬件、更多的計算資源和硬件加速來擴展。
目前,FHE 在區塊鏈領域的最佳用例更多是在外包通用計算,而不是構建內置的 FHE L1/L2。以下是 FHE 可以解鎖的一些有趣用例:
-
第一代(加密原生):鏈上 DID、賭場、投注、投票、遊戲、Private DeFi、私有代幣、dark pools、2FA、備份、密碼。
-
第二代(模塊化):「隱私鏈」(Chainlink for privacy)、外包私人計算、區塊鏈與合約之間的端到端加密、加密的數據可用性、可驗證的安全數據存儲。
-
第三代(企業級):復雜的消費者應用程序、加密和分散的 LLM、人工智能、可穿戴設備、通訊、軍事、醫療、隱私保護的支付解決方案、Private P2P 支付。
當前基於 FHE 的業內項目
完全同態加密(FHE)的發展激發了多個利用這一技術增強數據隱私和安全的創新區塊鏈項目。本節深入探討了 Inco、Fhenix 和 Zama 等值得注意的項目的技術細節和獨特方法。
Inco
Inco 正在开創 FHE 與區塊鏈集成的先河,創建一個平臺,使得數據計算既安全又私密。Inco 使用基於格 (lattice-based) 的加密技術來實現其 FHE 方案,確保對密文(加密數據)的操作可以在不暴露底層明文的情況下進行。該平臺支持隱私保護的智能合約,允許直接在區塊鏈上處理加密數據。
-
Lattice-Based 的 FHE:Inco 利用基於格的加密進行其 FHE 實現,因其後量子安全特性而著稱,確保對未來可能的量子攻擊具有彈性。
-
隱私保護智能合約:Inco 的智能合約可以對加密輸入執行任意函數,確保合約和執行合約的節點都無法訪問明文數據。
-
噪聲管理和 Bootstrapping:為了處理同態操作過程中噪聲增長的問題,Inco 實施了高效的 Bootstrapping 技術,刷新密文,保持解密性,同時進行復雜計算。
Fhenix
Fhenix 專注於為隱私保護應用程序提供強大的基礎設施,利用 FHE 提供端到端加密解決方案,以保護用戶數據。Fhenix 的平臺旨在支持從安全消息傳遞到隱私金融交易的廣泛應用,確保在所有計算過程中數據隱私。
-
端到端加密:Fhenix 確保數據從輸入點到處理和存儲的整個過程中都保持加密狀態。這是通過結合 FHE 和安全多方計算(SMPC)技術實現的。
-
高效密鑰管理:Fhenix 集成了先進的密鑰管理系統,便於安全密鑰分發和輪換,這是在 FHE 環境中保持長期安全的關鍵。
-
可擴展性:平臺使用優化的同態操作和平行處理來高效處理大規模計算,解決了 FHE 的主要挑战之一。
-
協處理器:Fhenix 還率先开發了專門的協處理器,旨在加速 FHE 計算。這些協處理器專門處理 FHE 所需的密集數學運算,顯著提高了隱私保護應用程序的性能和可擴展性。
Zama
Zama 是 FHE 領域的領先者,以其开發的 fhEVM 方案而聞名。該方案允許在完全同態環境中執行以太坊 EVM 計算,確保任何使用該庫構建的 L1/L2 項目在執行層面上的隱私。
-
fhEVM 方案:Zama 的 fhEVM 方案將 FHE 與以太坊虛擬機集成,實現加密的智能合約執行。這允許在以太坊生態系統中進行保密交易和計算。
-
Concrete 庫:Zama 的 Concrete 庫是一個針對 TFHE(FHE 的一種變體)的 Rust 編譯器。該庫提供了同態加密方案的高性能實現,使加密計算更加高效。
-
互操作性:Zama 致力於創建能夠與現有區塊鏈基礎設施無縫協作的解決方案。這包括支持各種加密原語和協議,確保廣泛的兼容性和易於集成。
3. FHE 在 Crypto 和 AI Infra 與應用中的關鍵角色
如今,密碼學與人工智能的交匯正如火如荼。盡管不深入探討這一交匯,但值得注意的是,新模型和數據集的創新將由多個參與方的开源合作推動。除了計算之外,最終最重要的是數據,這些數據是這個合作管道中最重要的部分。AI 應用和模型的有用性最終取決於其所訓練的數據,無論是基礎模型、微調模型還是 AI 智能代理。保持這些數據的安全和私密性,可以為开源合作打开一個巨大的設計空間,同時允許數據所有者持續從訓練模型或最終應用中獲利。如果這些數據本質上是公开的,將很難進行貨幣化(因為任何人都可以訪問有價值的數據集),因此這些數據更可能被嚴格保護。
在這種情況下,FHE 可以發揮關鍵作用。在理想狀態下,它可以在不透露底層數據集的情況下訓練模型,這或可以解鎖數據集的貨幣化,極大地促進數據集所有者之間的开源合作。
Source: Bagel Network
FHE 如何增強隱私保護機器學習(PPML)
-
數據隱私:通過使用 FHE,敏感數據如醫療記錄、財務信息或個人標識符可以在輸入 ML 模型之前加密。這確保即使計算環境遭到破壞,數據仍然保持機密。
-
安全模型訓練:訓練 ML 模型通常需要大量數據。使用 FHE,這些數據可以加密,從而在不暴露原始數據的情況下訓練模型,對於處理高度敏感信息並受嚴格數據隱私法規約束的行業至關重要。
-
機密推理:除了訓練,FHE 還可用於加密推理。這意味着一旦模型訓練完成,可以在加密輸入上進行預測,確保用戶數據在整個推理過程中保持隱私。
-
FHE 的 PPML 應用領域:
-
醫療保健:在保護隱私的前提下訓練 ML 模型,可導致更個性化和有效的治療,而不會暴露敏感的患者信息。
-
金融:金融機構可以使用 FHE 分析加密的交易數據,實現欺詐檢測和風險評估,同時保持客戶隱私。
-
物聯網和智能設備:設備可以收集和處理加密形式的數據,確保位置數據或使用模式等敏感信息保持機密。
FHE 的問題:
如前所述,FHE 方案之間沒有「統一」。方案之間不可組合,且多次需要為不同類型的計算組合不同的 FHE 方案。對同一計算實驗不同方案的過程也相當繁瑣。正在开發的 CHIMERA 框架允許在 TFHE、BFV 和 HEAAN 等不同 FHE 方案之間切換,但目前遠未達到可用狀態。這引出了下一個問題,即缺乏基准測試。基准測試對於开發者採用這項技術非常重要。這將有助於節省許多开發者的時間。考慮到計算开銷(加密、解密、Bootstrapping、密鑰生成等),許多現有通用硬件並不非常適用。需要某種形式的硬件加速,或可能需要創建特定芯片(FPGA 和 / 或 ASIC)以實現 FHE 的更主流應用。這些模式的問題可以與 ZK(零知識)行業的問題進行比較。只要一群聰明的數學家、應用科學家和工程師對這個領域感興趣,我們將繼續看好這兩個領域:FHE 用於隱私和 ZK 用於可驗證性。
4. FHE 驅動的未來會是什么樣子
會有一個 FHE 方案統治所有嗎?業內還在進行這樣的討論。盡管理想狀態是有一個統一的方案,但不同應用的多樣化需求可能總是需要針對特定任務優化的專門方案。方案之間的互操作性是最佳解決方案嗎?互操作性確實可能是一個實際的方法,允許靈活處理多樣化的計算需求,同時利用各種方案的優勢。
FHE 何時可用?可用性與減少計算开銷、改進基准測試標准以及开發專用硬件的進展密切相關。隨着這些領域的進展,FHE 將變得更加可訪問和實用。
總結來說,FHE 為數據隱私保護和安全計算提供了強大的工具。盡管目前在互操作性、計算开銷和硬件支持方面仍存在挑战,但 FHE 在區塊鏈、隱私保護機器學習以及更廣泛的 Web3 應用中的潛力不容忽視。隨着技術的不斷發展和創新,FHE 有望在未來的隱私保護和安全計算領域發揮關鍵作用。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。
Hack VC:模塊化是個錯誤嗎?以數據為依據審視以太坊的這一战略
撰文:Alex Pack 及 Alex Botte,Hack VC 合夥人 編譯:Yangz,Te...
除了 TON, 哪些公鏈在爭奪 Telegram 用戶?數據表現如何?
作者:Stella L ( [email protected] ) 在 2024 年...
從 Beacon Chain 到 Beam Chain,速讀 Justin 的以太坊共識層新提案
撰文:Tia,Techub News 在昨日泰國 Devcon 的 Mainstage 中,以太坊...
星球日報
文章數量
7104粉絲數
0