Vitalik為什么看好ZK硬件加速?
Author: Loopy Lu, BeWater
近日,Vitalik Buterin 對香港區塊鏈大會的突然造訪令與會者無不振奮。而這也與一定程度反映了當下加密市場的情況。近期,以太坊走勢一直相較比特幣生態稍顯疲軟,以太坊流動性的割裂、性能的受限,再次使其受到質疑。
而在本次大會上,Vitalik 對以太坊未來的進展給出了明確的建議。在主旨演講《Reaching the Limits of Protocol Design》中,Vitalik 積極展望了 ASIC 芯片的作用,借助 ASIC 芯片進行 ZK 計算的硬件加速,可以將以太坊的效率的安全提升到全新的水平。
要解讀 ZK 硬件加速,自然要從 ZK 开始談起。ZKP 並不是全新的概念。從上世紀八十年代起,計算機科學家們就在這個方向上不斷的進行探索。當前,熱門 ZK Rollup 項目陸續上线、更多的 ZK 應用正在湧現,對應的則是 ZK 技術和市場在不斷演進。我們發現,ZK 硬件加速正在成熟,ZK + DePIN 模式嶄露頭角,這個周期的 ZKP 似乎與此前不一樣了。
零知識證明(Zero-Knowledge Proof,ZKP)被譽為加密技術領域的“聖杯”,不僅為長久以來的隱私保護難題引入了新的解決方案,還為存在多年的區塊鏈擴容問題提供了強大的解決方案。
衆所周知,ZK 的效率問題一直是困擾着諸多的用戶的項目方。 Vitalik 在香港大會上表示,ZK-SNARKs、MPC、FHE(完全同態加密)和 BLS 聚合等基於高級密碼學的協議雖發展迅速,但同時也存在效率和安全問題。
(圖片來源:Foresight News)
其中,以太坊 Slot 出塊時間為 12 秒,“普通”區塊驗證時間約為 400 毫秒,ZK-SNARK 證明時間約為 20 分鐘,而以太坊的目標是實現
實時證明
。
為了解決這一問題, Vitalik 給出了三種解決方案 ,分別是“並行化與聚合樹”、使用 SNARK algos 與哈希提升效率、 使用 ASIC 進行 ZK 硬件加速。
我們並不對三種方案進行優劣判斷,在此只對 ZK 的硬件加速進行深入探討。本文試圖從 ZKP 出發,向投資者解讀,為什么 Vitalik 看好“硬件加速”這一目前被鮮少提及的賽道?“ZK 加速”、“ZK”、“ZK Rollups”這些相似的名詞,又都有何區別,如何准確辨析?
從整個生態的角度來看,硬件加速賽道為何重要?為以太坊、ZK、整個加密世界提供了何種價值?我們將以 Cysic 為例,詳細探討硬件加速的昨日、現在和未來。
Vitalik 看好的硬件加速有何作用?
對於加密世界來說,ZKP(SNARKs/STARKs)被視為擴容技術的聖杯。zk-SNARKs 通過 Verification Computation 來驗證原始計算的正確性,即首先由證明者(Prover)為原始計算生成簡潔證明(Succinct Proof),同時驗證者(Verifier)使用更小規模計算來驗證證明(Proof)的正確性。
在各路擴容方案中,ZKP 促成了鏈下計算的發展。即交易不再在一層網絡執行,而是在鏈下的 rollup 完成,並將多筆交易的狀態根等部份數據打包發布到主網完成驗證和結算。主網節點可以對 Rollup 上的交易歷史通過 ZKP 進行驗證,其安全仍然由一層保證。ZKP 通過零知識證明通過數學的方式解決驗證過程中的信任問題,且所需鏈上空間小,ZK Rollup 相對一層能達到數十倍交易處理速度和處理效率。
L2 BEAT 數據顯示,前五大 ZK Rollup 總 TVL 已達約 30 億美元。這一數字距離以太坊 TVL 的 500 億美元、整個 DeFi 市場的 910 億美元規模仍具有相當大的差距。我們相信隨着 ZK 技術的成熟,ZK Rollup 的滲透率勢必將會進一步提高。在以太坊完成坎昆升級之後,EIP-4844 的引入讓 Layer 2 的費用大幅降低。在各主流 Layer 2 適配“Blob 交易”之後,實測數據顯示各 ZK Rollup gas 費用明顯下降。例如,Starknet 降幅約為 85% 、zkSync Era 降幅約為 65% 。
市場上的 ZK 系項目正在快速成長,市值超過 10 億美元的基於 ZK 技術的項目中,Polyhedra, Immutable、StakNet、zkSync、Mina、dYdX 等被廣為人知。這一賽道大體可分為三層:基礎設施、ZK-Rollup、ZK 應用。
基礎設施主要包括編程框架和工具、ZKP 證明市場、證明生成的硬件加速、ZK 機器學習等。這些賽道的項目大多圍繞 ZKP 的生成和計算展开,他們為 ZK 應用(無論是網絡或者 dApp)的部署提供了技術基礎。
而最受矚目的,則是 ZK Rollup。ZK Rollup 的爆發為可擴展性和“大規模採用”的敘事提供了充足的支撐。當然,在此之上還有採用了 ZK 技術的各種 dApp,它們大多利用 ZK 的特性為加密用戶提供了隱私等其他應用。
然而 ZK 證明生成所需要的過高的計算資源卻是一個禁錮賽道進一步前進的瓶頸。
距離用例的落地還有多遠?
既然 ZK 技術如此強大,為何現在仍未被廣泛採用?主要原因是 ZK 技術的核心算法和實現機制極為復雜。目前,被廣泛採用的主要有兩種 ZK 證明系統—— zk-SNARKs 和 zk-STARKs 。例如,zkSync、Aztec、Axiom、Scroll、Taiko 等都採用的是基於 zk-SNARK 的證明系統,而 StarkNet、dYdX、Polygon 等則採用了基於 ZK-STARKs 的證明系統。
使用零知識證明系統通常包括: “拍平計算” , “生成證明” , “驗證證明” 。這其中“生產證明”的步驟需要大量的算力支撐。
“拍平計算”是將一個原始計算,通過某種約束語言(例如 R 1 CS),表達成 ZK 電路的形式。以 zk-SNARKs 為例,目前常用的證明系統包括 Groth 16、Marlin 和 Halo/Halo 2 等。其中,Groth 16 使用了 R 1 CS 作為拍平計算用的約束語言。而對較新的證明系統,例如 Halo/Halo 2 則使用了 Plonk 體系的電路約束語言,這被廣泛的運用於一些較新的 ZK 項目中,例如 Scroll、Taiko、Aximo 等。
正如我們之前提到的,ZK 證明的生成需要大量計算。我們用 KGZ-based Halo 2 舉例來簡單的分析一下這些計算的類型。首先,當我們通過前端約束語言構造好 ZK 電路之後,我們會需要把這些電路通過某種方式轉化多項式的形式,而其中多項式的階數和電路的規模正相關。之後,會使用一些密碼學的手段,例如 KZG 將這些多項式最終轉換為證明的形式。在這個過程中,主要的耗時的計算類型包括 MSM 和 NTT 兩種。
MSM(Multi-Scalar Multiplication)計算 用於處理與橢圓曲线相關 的計算 。MSM 是橢圓曲线密碼學中的核心組成部分,主要用於生成和驗證證明。MSM 類型的計算任務約佔到計算任務的 60-70% 。
NTT (Number Theoretic Transform)是一種 在有限域上進行的快速傅裏葉變換 (FFT)NTT 用於處理與多項式相關的計算 。在 ZK 證明生成的計算中,NTT 類型的計算任務大約佔到全部計算任務的 25% 左右。
而 ZK-STARKs 雖然採用了不同的算法,但也擁有自己的性能瓶頸。在證明的生成過程中,證明者需要創建一個由多個約束組成的系統,這些約束必須同時滿足才能生成有效的證明。而這些這些約束通常都是隨機生成的,FRI 算法(Fast Recursive Integer Gaussian Sampling)用戶生成和驗證證明中的高斯採樣,以此來確保這些約束的隨機性。因此,FRI 算法的效率對於 ZK-STARKs 的性能至關重要。
但無論採用何種路线,龐大的計算量讓這一計算的時間變得殊為緩慢。因此,如何加速這些計算的速度、提高證明生成的生成效率,成為了限制 ZKP 在當下普及的關鍵。
為了解決這一問題,使用硬件進行計算加速,成為了一種可行的解決方案。而目前市場已經產生了多個硬件加速解決方案,而究竟選用何種硬件,並無標准答案。
當下 ZKP 市場主流的硬件加速方案分為三種,其靈活性從高到低分別為 GPU、FPGA、ASIC。
-
由於 ZKP 算法中的某些步驟(如多項式乘法和 FFT 變換)可以並行處理,使用 GPU 自然可以更高效的完成 ZKP 算法中的計算過程,這就如同多年前的顯卡挖礦一樣。但是問題在於, GPU 的靈活性和通用型讓性能很難超越 FPGA。
-
FPGA 則可以通過編程來實現特定的邏輯功能。這種結局方案提供了更高的效率,同時也保持了一定的靈活性,可以根據需要定制電路。在針對特定的 ZKP 算法進行優化之後, FPGA 的性能優於 GPU 。
-
ASIC 則是為特定任務量身打造的專用芯片,正如 ASIC 礦機為比特幣提供了強大的算力一樣,ZKP 的 ASIC 硬件加速也可為計算過程提供最高級別的性能優化。但通常來說 ASIC 只能適配單一解決方案 ,無法通用現存所有的 ZKP 證明任務。更普適的 ASIC 芯片從設計到流片都會遇到更大的調整。
ASIC 算力最為強大,但掣肘在於靈活性問題。因為 ZK 算法的多樣化,加速解決方案仍然需要對多種算法進行加速。考慮到市場上 ZKP 證明在不斷推陳出新的情況下,FPGA 的快速重配置能力使其在多個場景上具有重復使用的優勢,能夠靈活適應不同證明系統需求。因此在現階段的市場條件下,作為硬件加速服務商,只能提供僅加速單一證明系統的 ASIC 芯片服務,並不是“此時此刻”最好的選擇。
但 ASIC 在未來不存在爆發的潛力嗎?答案自然是否定的。
選擇合適的證明系統是一個十分謹慎的重大抉擇。由於 ZK 電路極高的設計成本,一旦確定了證明系統, ZK 項目幾乎不會輕易的變更證明系統 。項目方投入資源开發了特定證明系統的電路後,通常不會輕易更換系統。雖然 FPGA 提供了一定的靈活性,但對於已經確定並投入开發的 ZK 項目來說,ASIC 仍然可以提供較高的計算效能比,這對於大規模的、計算密集型的 ZK 應用尤為重要。因此,盡管 ASIC 的初始开發成本較高,但在流片成功之後所帶來的高收益比,仍然在會市場上佔有一席之地。因此,ASIC 解決方案在市場上具有一定的穩定性和需求。
在可預見的將來,ASIC 加速方案仍是硬件加速的 最終解決方案 之一。
我們以硬件加速賽道的 Cysic 項目為例。Cysic 提供了包括 FPGA,ASIC,以及 GPU 在內的全硬件加速服務,這些加速服務不僅能夠提高特定 ZK 證明的生產效率,還能夠適應不同區塊鏈平臺/ZK 項目方的需求。
例如 Cysic 开發了基於 FPGA 的 MSM 計算加速器,名為 SolarMSM。這個解決方案顯著提高了 MSM 計算的效率,能夠在短時間內處理大規模的 MSM 任務。從數據來看,Cysic 的 SolarMSM 可以輕松的在 300 ms 的內完成 2 ³⁰規模的 MSM 計算,這一性能在行業中處於頂尖水平。
通過這種硬件加速,Cysic 能夠有效地減少 ZK 證明生成所需的時間,從而使得基於 ZKP 的區塊鏈應用和協議更加高效和實用。這對於推動 ZKP 技術的廣泛應用,特別是在需要快速和高效證明生成的場景中具有重要意義。
目前 Cysic 已經實現了 MSM 加速方案的 POC 設計工作。基於 FPGA 的 POC 是目前所有公开的 FPGA-MSM 硬件加速結果中性能最高,是目前公开基准測試結果的 1 – 2 個數量級以上,ASIC 的設計和流片工作也正在進行之中。未來,Cysic 將在第二階段研發 12 nm 的 ASIC 芯片。目標將實現單顆 ASIC 芯片的算力可支持 MSM 和 NTT ,和其他密碼學底層算子,同時實現單顆芯片功耗降低到兩個數量級。
此外,Cysic 也積極擁抱了基於 GPU 的加速方案,提供更靈活的 ZK,乃至 AI 計算的加速服務。
只要 ZKP 計算的更快,加密世界就距離奪取 ZKP“聖杯”更近了一步。
DePIN 原語驅動市場規模增長
硬件加速的重要性毋庸置疑。而另一個投資者的主要疑惑是 ZK 硬件加速將會有多大的市場規模?
Paradigm 曾做出預測,ZK 加速的市場規模與 POW 挖礦市場規模相當。正如前文所述,隨着坎昆升級的完成,ZK Rollup 的更大規模採用將為 ZK 計算帶來大量的需求。
隱私保護是另一個主要的市場需求。如 Semaphore、MACI、Penumbra 和 Aztec Network 等正在探索利用 ZK 技術來增強用戶隱私和推動大規模採用。同時,身份驗證領域也是 ZK 技術的主要用例之一,包括時下大火的 WorldID,還有 Sismo、Clique、Axiom 等項目,都致力於將 ZK 技術應用於身份管理,以提供更安全、更隱私保護的解決方案。
ZKML(Zero-Knowledge Machine Learning,零知識機器學習)則是另一個發展迅速的領域。在 AI 爆發的當下,驗證 AI 正確地、透明地工作成為剛需。而 ZKML 可使得推理等環節可以上鏈,理論上將在不透露具體內容的情況下進行驗證。
因此,無論是 ZK Rollup 的廣泛採納、隱私等 dApp 的湧現、或 ZKML 的發展均推升了 ZKP 加速的需求。
然而,ZK 加速門檻仍然較高,對於很多中小型項目方仍然極不友好。很多 ZKP 的需求方仍然需要通過中心化的方式採購加速硬件,自行部署加速服務。而且還需要根據自身的 ZKP 生成繼續路线,選擇合適的加速方案。
一個富有彈性的驗證者網絡( ZK prover network )成為了行業共識的解決方案。而在此基礎上形成的 ZK Compute-as-a-Service(ZK CaaS,ZK 計算即服務)新型產品形態將解決上述困境。
以 Cysic 為例。Cysic 將加速硬件組建一個驗證者網絡,FPGA、ASIC 或其他硬件,都可在網絡中為用戶提供 ZK 加速算力,個人設備也可以接入其中。對於 ZK 項目方來說,當需要算力支持來進行 ZKP 驗證時,則可直接接入 Cysic 的 ZK 算力網絡,而無需進行硬件採購。對於具體的加速方案細節也無需過多的關注。目前 Cysic 已經上线了數萬張高階顯卡,為驗證者網絡儲備了充足的 ZK 算力。
當前, Cysic 已與 Scroll、zk P2P、Inference、Kinetex 等多家項目達成合作,覆蓋 ZK Rollup、ZKML、應用層等多種類型項目,其採用的證明系統包括 Halo 2、RapidSnark、 Plonky2x 等多種體系,因此,Cysic 的加速計算解決方案具有較高的靈活性和通用性。
Cysic 通過加密原生的去中心化方式來配置算力的供給和需求。ZK 算力的供給端從中心化、不可拓展的硬件,升級為支持用戶均可接入的算力網絡,也給個人投資者提供了更深入參與市場的機會。需求端,ZK CaaS 可為 ZK 計算提供更強的彈性和穩定性,去中心化市場通過智能合約更高效地調度、匹配算力供需。
因此,ZK CaaS 將硬件加速變成了“开箱即用”的服務,且創建了一個人人皆可進行 ZK 計算加速的場景,以 DePIN 的去中心化硬件設施的網絡來改造 ZK 領域,為專有或闲置的算力提供收益,使得我們有望再次迎來 ZK + DePIN 的挖礦藍海。
Reference:
《ABCDE:為什么我們要投資 Cysic?》 , Siyuan Han
《New Paradigm in Designing ZK-ASICs, the zkVM way》 , Cysic
《ZK Hardware Acceleration: The Past, the Present and the Future》 ,Luke Pearson & Cysic 團隊
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。
AI「生娃」?一文讀懂自主AI繁殖與進化的實驗平臺Spore.fun
原文標題:Love Death Robots 編者按: 本文主要介紹了 Spore.fun,一個實...
融資4300萬美元的Sahara AI,能否構建真正的“AI Chain”?
@OdailyChina @wenser 2010 屬於加密貨幣的曲折而又壯闊的 2024 年即將...
LBank Research:數據分析Cardano快速增長背後的驅動力
前言 自 2017 年啓動以來,Cardano(ADA)已成長為一個旨在推動區塊鏈技術極限的 Po...
星球日報
文章數量
7711粉絲數
0