Gensyn測試網上线,如何讓AI訓練更高效、更去中心化?

2025-04-05 16:04:04

作者:Zen,PANews

AI是如今加密行業最受關注的細分賽道,其中a16z 領投、總融資規模達 5000 萬美元的分布式 AI 計算網絡 Gensyn 無疑是個具有競爭力的項目。近日,Gensyn正式上线測試網,雖然比原計劃時間晚了一年多,但隨着測試網上线終於進入新的階段。

作為一款專為機器學習打造的 定制化 Ethereum Rollup,Gensyn 測試網集成了 鏈下執行、驗證和通信框架,旨在為去中心化 AI 系統提供 持久身份、參與追蹤、歸屬維護、支付、遠程執行協調、去信任驗證、訓練過程記錄以及大規模訓練任務衆籌 等關鍵功能。

測試網的第一階段重點關注在 RL Swarm 內追蹤參與情況。RL Swarm 是一個用於協作式強化學習後訓練的應用,其節點可與鏈上身份綁定,從而確保每個參與節點的貢獻得到准確記錄。

RL Swarm:核心功能與協同訓練

在Gensyn 測試網中,作為核心應用的 RL Swarm 是一個基於去中心化網絡構建的模型協同訓練系統。與傳統單一模型獨立訓練不同,RL Swarm 讓多個模型在網絡中相互交流、批評和改進,從而共同提升整體性能。其核心理念在於“群體智慧”,即通過各節點模型之間的協作和反饋,實現更高效的訓練效果。

可以簡單理解為,DeepSeek-R1等模型進行推理訓練時,能夠通過自我批評來迭代提升推理表現,而 RL Swarm 則將這種機制擴展到了多模型的群體中,實現了“衆人拾柴火焰高”的效果。

基於RL Swarm系統,模型不僅依賴自身反饋,還通過觀察和評價其他模型的表現,識別出自身的不足並進行優化。每一個加入 Swarm 的模型節點都在參與一個三階段的過程:首先獨立完成問題並輸出思路與答案,然後查看其他節點的答案並提供反饋,最終模型投票選出最優解,並據此修正自己的輸出。這種協同機制不僅提高了每個模型的表現,也推動了整個群體模型的進化。加入 Swarm 的模型在離开後仍能保留改進後的本地權重,獲得實際收益。

此外,Gensyn對RL Swarm 的代碼進行了开源,任何人都可以運行節點,啓動或加入現有 Swarm,無需許可。Swarm 的底層通信使用了 Hivemind 提供的 gossip 協議,支持模型間的去中心化消息傳遞與學習信號共享。不論是家用筆記本,還是在雲端 GPU 上都可以通過加入 RL Swarm 節點參與到協同訓練中來。

基礎設施 三大支柱:執行、通信與驗證

目前RL Swarm 仍然只是一個實驗性演示,它展示了一種大規模、可擴展的機器學習方法,而非最終的產品形態。在過去四年,Gensyn的核心工作實際上是構建底層基礎設施,在發布測試網後便進入了v0.1階段,已經可以實際運行。根據官方介紹,Gensyn 的整體架構分為執行、通信和驗證三個部分。

執行(Execution):一致性與分布式算力

Gensyn 認為,未來的機器學習不再局限於傳統的單體模型,而是由分布在全球各個設備上的碎片化參數組成。為了實現這一目標,Gensyn團隊开發了能夠確保跨設備一致性的底層執行架構。其中的關鍵技術包括:

  • 分布式參數存儲與訓練:通過將大規模模型分割成多個參數塊並分布於不同設備上,Gensyn 實現了模型的碎片化部署,降低了單個節點對內存的要求。
  • 強化學習後訓練(RL Post-Training):研究表明,當模型以群體方式協同訓練、互相溝通並批判彼此的答案時,整體學習效率會顯著提升。Gensyn 利用 RL Swarm 演示了這一概念,讓模型在集體討論中快速進步,進一步驗證了分布式執行的有效性。
  • 可復現算子(RepOps):為了確保不同硬件(如 Nvidia A100 與 H100)能夠得出完全一致的計算結果,Gensyn 开發了 RepOps 庫,通過固定浮點運算的執行順序,實現了跨平臺的逐位復現。

通信(Communication):高效信息交互

在大規模分布式訓練場景中,各節點間的高效通信至關重要。傳統的數據並行方法雖然能在一定程度上降低通信开銷,但由於要求每個節點存儲完整模型,其擴展性受到內存限制。為此,Gensyn 提出了全新的解決方案:

  • SkipPipe – 動態跳躍管道並行:SkipPipe 技術通過動態選擇微批次(microbatch)經過的計算層,將傳統流水线中的部分階段跳過,從而減少不必要的等待時間。其創新的調度算法能夠實時評估各路徑的可用性,既降低了節點空闲時間,又大幅縮短了整體訓練時長。據測試數據顯示,在去中心化環境中,SkipPipe 可將訓練時間減少約 55%,且在部分節點故障的情況下,模型性能僅降低 7% 左右。
  • 通信標准與跨節點協作 Gensyn 構建了一套類似於 TCP/IP 的通信協議,使得全球各地參與者無論使用何種設備,都能高效、無縫地進行數據傳輸和信息交互。這種开放標准為分布式協同訓練提供了堅實的網絡基礎。

驗證(Verification):確保信任與安全

在一個無需信任的分布式網絡中,如何確認各參與方提交的計算結果真實有效,是一大挑战。Gensyn 為此引入了專門的驗證協議,旨在通過低成本、高效的機制確保所有算力供應商提供正確的工作結果:

  • Verde 驗證協議:Verde 是首個專為現代機器學習設計的驗證系統。其核心在於利用輕量級爭議解決機制,快速定位出訓練過程中模型與驗證者之間產生分歧的那一步驟。與傳統需要重新運行整個任務的驗證方式不同,Verde 只需對爭議操作重新計算,從而大幅降低了驗證开銷。
  • refereed delegation(裁決式委托):採用這種方法後,若某個供應商的輸出存在問題,驗證者便能通過高效的爭議解決遊戲說服中立仲裁方,確保至少有一位誠實節點存在時,整個計算結果的正確性得以保障。
  • 存儲與哈希中間狀態:為了支持上述驗證過程,參與者只需存儲並哈希部分中間訓練檢查點,而非全量數據,這既降低了資源佔用,也提升了系統的擴展性和實時性。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

評論

推薦文章

若Strategy被迫拋售BTC,潛在拋壓對市場影響幾何?

由 Michael Saylor 領導的 Strategy 公司(原 MicroStrategy)...

星球日報
2 6小時前

Vitalik香港演講:將以太坊L1打造為「世界計算機」的核心

整理:KarenZ,Foresight News 4 月 9 日,在「 2025 香港 Web3...

星球日報
2 6小時前

何一:幣安的發展路徑與加密金融的新趨勢

主持人:Vito,MetaEra 創始人 嘉賓:何一,幣安聯合創始人 4 月 8 日,在剛剛舉行的...

區塊新視野
2 6小時前

CertiK入選港府重點企業夥伴,陳茂波財長出席籤約儀式

據香港特區政府新聞公報,在香港特別行政區政府引進重點企業辦公室(引進辦)昨日舉行的“重點企業籤約儀...

3 6小時前

Vibe Coding時代的應用代幣論:為什么將催生巨大的財富浪潮?

作者: Grant blocmates 編譯:Tim,PANews 在最新一期的Y Combina...

2 6小時前

加密社區哪家強?18個主流L1社區BARD評分新鮮出爐

信念(Belief)、行動(Action)、韌性(Resilience)、密度(Density),...

星球日報
2 6小時前