Future3 Campus訪談丨資本是如何看待AI+Web3的?

2023-12-08 16:12:30

AI+Web3或將成為未來行業融合創新的一大突破點。Future3 Campus在與Footprint Analytics攜手編撰《AI 與 Web3 數據行業融合的現狀、競爭格局與未來機遇探析》研報期間,也對多位知名投資機構代表進行了採訪。本文根據訪談內容整理,僅代表受訪嘉賓觀點,不代表 Footprint 立場。

如何看待AI+Web3數據的結合?有哪些值得關注的方向?

Hashkey Capital-Harper:我認為AI和web3數據的集合有幾點:一是通過LLM模型將語言轉化生成SQL,比如Dune,還有些項目專門做search engine的,要強化SQL,才能去正確調取數據庫裏的數據,還有利用自然語言就能自動生成SQL,讓开發者復制後去使用。二是聊天對話方式,基於chatgpt改造的聊天agent,主要針對提供聊天窗口的,不那么強調在SQL和搜索優化上,它更隨意點,比如請告訴我哪個KOL喊單了,這個安全事件對token的影響有什么(這個時候可能就是全網搜索出來一個結果,這裏就不會強調調取數據庫的SQL優化)。三是通過AI創建合適的模型將鏈下和鏈上數據進行整理,提取更好的insight。

相比之下,一需要項目方有更強的數據庫搭建能力,因為Web3的數據處理起來很麻煩,不過要達到准確性和速度,這個還是很難的;二是個比較簡單的結合方式,門檻也不太高。

SevenX Ventures-Yuxing:其實數據是AI的養料。Web3的數據公开且可驗證,而AI的問題在於它的黑盒特性,難以驗證。這兩者結合,可以產生一些有趣的化學反應。目前我更傾向於把AI和Web3的結合分為兩類,不是簡單的AI加Web3數據,而是考慮AI如何讓Web3變得更好,以及Web3如何讓AI變得更好。

首先AI對於Web3數據來說,能夠有效利用Web3數據公开可驗證的特性。任何AI都可以使用Web3數據,提煉並產生價值,無論是投資建議還是預警分析,AI能夠幫助Web3數據處理和分析增加效率。另一方面,Web3可以增加AI的可信度,因為Web3本身就是一個新型的信任機制。通過Web3的數據公开可驗證的特性,可以提高AI的透明度,甚至在新聞報道或紀實等重要領域,可以用Web3的方式存儲關鍵信息,這就能夠去避免AI存在的一些問題。

而這些問題中比較常見的就是AI的造假問題,還有AI黑盒問題。AI的算法有些可能比較容易理解,但是有的算法很難解釋,比如像神經網絡這樣復雜的算法,還有GPT,人們可能會質疑他的答案是如何產生的,它的數據和算法都不夠透明,讓人感覺像是魔術。例如,之前的人臉識別算法將黑人錯誤識別成大猩猩,這是因為其數據樣本中黑人的圖片太少。

如果AI模型使用的數據都是可驗證的,我們就可以更容易辨別數據是否有樣本偏差。使用Web3的數據,因為其透明性,整個AI模型的訓練源和結果都會更加明晰。這樣一來,我們就能更公正地看待AI,理解它的決策源,減少偏見和錯誤。

黑盒問題可以粗略分為兩部分。一部分是模型算法本身的黑盒,包括模型怎么訓練,內容怎么生成,不論從訓練過程還是算法機制層面都存在不透明或不可解釋。另一部分是數據的黑盒,不公开數據,訓練集的問題也會導致最終結果偏差。

這個偏差如果說是內容准確性上的問題,我們還可以去持續改善,但如果是一些意識形態方面的問題,尤其是政治或種族歧視等方面的問題,可能就不容易糾正了。這種時候就只能去把控數據輸出了,比如現在很多國家系統或國企系統的 AI 模型,它最重要的一點就是去控制它的輸出,什么不能講,這個是最難做的,這一定程度上跟剛剛的這個意識形態偏差是類似的。

Qiming Venture Partners-唐弈:對於AI和Web3數據結合方面,我個人認為,AI在這個領域可能有些許炒作,噱頭大於實際效用。因為從我看來,Crypto的數據產品還處於相對早期階段,在數據方面的基礎工作還不夠扎實。在這種情況下,過早地引入AI或過多的數據分析可能為時過早。

此外,從用戶角度來看,大部分加密項目和AI結合的場景並不太成立,或者說用不太到AI。因為這波比較火的AI模型,特別是生成模型,是建立在大規模互聯網數據的基礎上的,比如語言處理和圖像生成等能力。盡管有人利用生成式AI改進用戶體驗,提供更好的交互和對話感,但這對於大多數場景而言可能價值有限。我認為如果談論更廣泛的AI(數據分析能力或更簡單的AI模型)可能還有些場景,比如基於數據給NFT進行價格估算,或者專業的交易團隊可以利用數據執行一些交易操作。總體而言,對於目前這波AI浪潮,我暫時還沒有看到可以為 加密貨幣 產業帶來特別短期效益的機會。

當然,我也看了一些早期項目正在嘗試通過AI提高數據處理或分析方面的能力。舉個例子,我看到早期項目正在使用AI能力來解釋智能合約的邏輯或進行分類識別等工作。這些工作在智能合約和加密貨幣領域要求較高的准確性,因為涉及到交易等關鍵動作。因此,我可以想象,使用一些AI能力來進行數據預處理可能是有意義的,但最終可能仍需要人工幹預來確保准確性。如果您希望通過AI能力直接觸發交易,除了專業的交易者外,我認為產品方面還需要取得很大進展。

Matrix Partners-子熹:我們觀察了很多關於Web3的數據項目,比如我們投資了Footprint,起初我也是它的一個忠實用戶,另外還有Dune。Footprint和Dune我覺得主要針對VC、开發者以及一些小型企業的服務,真正的普通和這些服務的聯系並不大。

另外我們也看了一些與加密貨幣交易或者盈利直接相關的數據分析公司,像Nanson、 DeFi lama、token terminal、dappradar,當然還包括Dune和Footprint。這些公司對VC和开發者來說非常有用,但它們的盈利能力似乎有限。原因在於目前VC和开發者對這些數據的總體需求量還不夠大,而且他們的付費意愿也不強,因為即便某些服務不是免費的,也總有其他公司提供類似的免費服務。

我們還看了一些類似於數據雲倉的公司。我們也和騰訊領投了Chainbase。他們其實就像是一個數據平臺,他們提供安全類、交易類、NFT類、DeFi類、遊戲類、社交類數據,還有一些綜合性的數據。开發者可以在這些平臺上組合這些數據來生成自己所需的API。

在熊市中,我們注意到像Chainbase、Block SEC 、footprint這樣的公司,它們的很多客戶實際上是中小型創業公司。例如Chainbase,它的一些大客戶收入並沒有下降,但是中小型客戶的收入在兩三個月後就降為零了。這表明這些項目因為缺乏資金而無法繼續。

因此,對於數據提供商來說,熊市中若沒有新的开發者加入,他們就很難賺錢。這也反映出目前在Web3領域,數據提供商主要是靠那些認為數據有用的开發者和小型企業,他們並內部整合這些數據,然後再進行變現,平衡收入和產出。

核心我們還是覺得,目前無論是ToC還是ToB的Web3數據公司盈利模式都不是很清晰,這導致數據提供商沒有一個強大的穩定的現金流。尤其是對於那些中小型的創業者來說,這是我們覺得目前Web3數據行業最大的一個弊端。

然後再回到AI和Web數據結合的話題。我們最近也看了和投資了一些AI相關的數據公司。我覺得AI數據公司實際上也面臨着同樣的問題,就是數據的銷售。你需要考慮客戶的成本和他們產出的效果之間的平衡。目前來看,我對AI數據公司的盈利前景還是比較樂觀的,但這主要限於海外市場。

如果只瞄准國內市場,我擔心最終的結果可能會和投資Web2 SaaS公司一樣,可能有收入,業務規模不會太大,客戶的付費意愿也不是很強。你可能還需要提供定制服務,這樣你的毛利率也不會很高。所以我對在國內做這個是比較悲觀的,對在海外做這個是比較樂觀的。

您認為AI 能夠給Web3 數據基礎設施和Web3數據公司帶來哪些價值?現在利用AI幫助Web3數據的項目效果怎么樣呢?在商業模式方面是否能有些創新?

SevenX Ventures:我認為AI對Web3數據最大的幫助是效率方面。比如Dune發布了AI大模型的工具來做代碼異常檢測和信息索引,用戶可以去用自然語言去查詢相應的數據,它的代碼就會相應地進行生成,然後還可以去做代碼的優化,這個就是效率方面的一個提升。

另外還有用AI做安全預警的項目,它就是將 AI經過相應的訓練之後,可以去快速的去識別安全問題的一個 AI Robot。比如 AI 算法裏邊就有一個算法叫異常檢測,效果比從純數學統計的方法直接去看數據的分布,檢測出一個異常值要更好,所以這種 AI 可以更有效地去做安全方面的監測。

另外我還有看到一些項目使用AI算法,比如大語言模型來檢索整個Web3的新聞數據(不只是鏈上數據),進行信息聚合和輿情分析,形成一個AI Agent。比如用戶可以直接在對話框裏面去查某個代幣最近30 天或者 90 天的網絡輿情,用戶是更偏向於看多,還是看空,給予相應的分值來體現熱度;它還會有個曲线,通過這個曲线就可以判斷一個代幣它是在大家討論到頂峯的時刻,還是在一個頂峯下降的時刻,還是在一個上升的時刻?這些可以輔助用戶投資,我覺得也是一個挺有意思的應用方式。

但也有些其他的項目宣稱自己的數據是AI的數據源蹭 AI 概念,我覺得這有點牽強,因為任何鏈上數據都可以是AI的數據源,因為它是公开的,所以有點蹭熱點的嫌疑。

Matrix Partners-子熹:商業模式是現在數據領域的一個大問題,要找到一個解決方案很難。可能在ToC端,利用Web3的一些概念,比如token或分布式概念,可以讓AI數據採用不同的商業模式。但如果是AI技術賦能數據,目前並沒有太多亮點。

AI在數據處理和清洗方面可能有輔助作用,但這更多是內部的幫助,比如在產品开發過程中提升功能或用戶體驗。但從商業角度來說,並沒有太大改變。

AI bot確實可以增加一些競爭力,輔助用戶,但目前來說這不是一個很大的優勢點,核心競爭力還是取決於數據源的質量。如果數據源充足,我可以獲取我需要的信息。問題是,如果這些數據要商業化,那么我組合出來的東西必須能變現,我才愿意為數據支付費用。現在的問題是,市場不好,初創公司不知道如何變現數據,也沒有足夠的新進場初創公司。

我覺得目前有意思的反而是一些Web2的公司,它們使用了Web3的技術。比如一個合成數據的公司,他們通過大模型生成合成數據去使用,數據可以主要應用在軟件測試、數據分析,以及 AI 大模型訓練使用。他們在處理數據的時候涉及到很多隱私部署的問題,使用了Oasis 區塊鏈 ,可以有效避免了數據隱私問題。後面他們還想做一個數據交易所,將合成的數據包裝在NFT裏進行买賣,解決確權和隱私問題。我覺得這是一個很好的思路,它用Web3技術來輔助Web2解決問題,不一定局限於Web3的公司。不過,目前合成數據的市場還不夠大,早期投資這樣的公司有風險。如果下遊市場做不起來,或者競爭對手太多,情況也會很尷尬。

在AI+Web3數據的領域,有沒有投過一些比較好的項目,分別是什么方向的,決定投他們的關鍵因素是什么?您認為這類項目的核心競爭力是什么?AI是否會加強這個競爭力?

Hashkey Capital-Harper:我們投的數據項目比較早,基本都是還沒有特別強調ai的時候就投了,比如space and time、0xscope、mind network、zettablock等,投的關鍵是看他們的定位和數據質量。現在這些項目都會有AI的計劃,基本也是先從聊天agent开始。space and time和chainML合作推出了創建ai agent的基礎設施,其中創建的defi agent被用於space and time,也是一種結合AI的方式。

SevenX Ventures-Yuxing:如果項目與AI的結合做得很好,那么我可能會對其更感興趣。決定我是否會投資的關鍵因素之一是項目是否有市場壁壘。我觀察到很多項目宣稱他們與AI結合能夠提升效率,例如快速的數據查詢功能。有些項目可以通過自然語言查詢來快速獲取鏈上NFT數據,比如查詢最近交易最活躍的十大NFT。這樣的項目可能有先發優勢,但市場壁壘可能並不牢固。

真正的壁壘是AI本身的應用以及工程師如何將AI應用到具體場景中。工程師如果能熟練地進行模型微調,通常能夠獲得良好的效果。對於那些提升效率的項目來說,市場壁壘主要在於數據源。不僅僅是鏈上數據,還包括項目方如何處理和解析這些數據。例如之前提到的項目,它們能夠通過AI算法快速檢索重要數據。然而,工程師進行模型微調的效果是有限的,真正的持續優勢在於數據源的質量和其持續優化的能力。這也是為什么一些數據分析公司能夠在市場中脫穎而出的原因,他們不僅提供數據源,還包括數據處理和分析的能力,區別往往在於團隊的技術能力和人才。這些因素直接關系到AI結合應用的最終效果,

另外,我也關注那些能讓AI變得更好的Web3技術項目,因為AI市場非常龐大。如果Web3技術能夠增強AI的能力,那么應用場景將會非常廣泛。這就是ZKML項目受到熱捧的原因。但是,我注意到Web3項目往往容易被誇大或貶低其價值。像ZKML這樣的項目,盡管備受關注,但它們的投資回報並不像人們期待的那樣迅速,退出機制也並不清晰,因為它們發行代幣的難度較大。因此,盡管這些項目富有創意並具有潛在價值,但是否值得現在投資,以及它們最終能帶來多少回報,是投資者需要仔細考量的。

Matrix Partners-子熹:我們投資了一個結合AI和Web3的公司,它是一個數據標注公司,叫Questlab。他們使用區塊鏈技術提供數據標注的衆包服務。數據標注原本是一個直營或者是分包的行業,很難做到知識領域的全覆蓋。

就傳統的數據標注來說,一般分為三個類型:直營、分包和衆包。但實際上做衆包的人比較少。這三種模式的公司在選擇數據標注服務時需要考慮的因素有:價格是否便宜、標注的質量是否高、效率如何。還有一個就是能否覆蓋他們所在的行業。如果你只是做一些通用模型的語言或圖片的標注,其實很簡單,就是識別英文字或圖片。再難一點,比如需要區分貓、狗、月亮、嬰兒車等,這也不是很難。但如果你需要做的是更專業的標注,比如語音機器人社區需要的標注,那就復雜多了。他們可能需要標注各種方言和多種語言,包括中文方言,英文方言、以及各種小衆地區的語言等,很少有傳統的工作室愿意做這樣的工作。

一個更復雜的例子是法律加AI公司,需要標注大量的法律知識來訓練各種模型,要找到既懂法律又能進行專業標注的人非常難,需要同時懂得各國法律,還要了解各種專業法律領域,如合同法、租賃法、民法、刑法等。市場上幾乎沒有一家數據標注公司能夠提供如此專業的服務。法律是專業的,金融、生物、醫療、教育等也是如此。所以,這些領域的標注工作一般只能由內部團隊來完成,他們使用衆包的方法,這樣就能解決知識專業覆蓋的問題。

我們認為,利用區塊鏈進行衆包是一個很好的方向,就像YGG在Gamefi領域做的事一樣。這是我們認為是一個有前景的方向。

另外,我們覺得在开源模型社區裏面,也會有一些很好的機會。比如Polychain投的一個項目是一個類似於web3 的hugging face,用來解決模型內容創造者經濟的問題。

其他的AI和Web3的結合,我覺得ToC方向如果能結合一些token的玩法,提高整個社群的粘性、日活和情感,我們覺得這是可行的。這也方便投資人來變現,但是市場規模如何也不是很確定。這就是我對AI和Web3的一些看法。我覺得如果純ToB的業務,沒必要用Web3,就用Web2的方式做就挺好的。

Qiming Venture Partners-唐弈:目前我們投的有一些數據項目正在通過鏈上數據在安全場景中進行工作。我認為一些AI基本的模式識別或特徵發現工作都有涉及,並且效果還可以。然而,更高級的工作,如將大量活動數據輸入模型並識別多種信息,目前仍在嘗試階段,效果尚需驗證。除了安全領域外,許多其他領域也存在類似情況。

最近的一個例子是我們投的NFTGo,它是一個基於大數據分析去做NFT的定價,具有一定的准確性,並計劃將其用於價格Oracle等用途。雖然這一體系聽起來很有趣,但在產品中以及用戶接受程度方面,仍需要進行驗證。因為即使目前可能能夠達到90分或85分的准確性,用戶可能需要更高水平,比如98分或95分,因此還需要進一步驗證。因此,雖然一些項目正在將數據分析和模式識別等簡單AI能力應用於產品中,但是否成為關鍵因素尚未得到驗證。

而對於投資意愿方面,我個人不會因為項目有一些AI的噱頭就更傾向於投資,因為我認為實際效果和項目是否能實現其目標以及帶來好處更為重要。如果一個項目只是在名字或市場營銷上有亮點,作為一種營銷手段,以吸引更多關注或曝光,我能理解。但在投資決策中,我認為更重要的是實際效果。

像一些項目在做ZKML,這個賽道似乎備受矚目,但是同時也有很大問題,就是它到底用於什么場景。我覺得目前不確定性特別強烈,更多還是很宏大的敘事。

從整體行業發展來看,AI + Web3數據這一賽道未來有哪些潛在的機會或發展方向?未來,AI是否有可能徹底升級數據產品,引入新概念?是否會增強用戶的付費意愿?

Hashkey Capital-Harper:肯定是有潛在機會的。未來發展方向其實還是落後於web2 的AI,那裏的創造力明顯更強,web3這邊的AI大概率也是web2 AI的映射實現吧。

Matrix Partners-子熹: 我覺得最近的妙鴨相機讓大家意識到,其實人們對AI產品還是有付費的意愿的,這不像傳統的SaaS產品或遊戲,人們期望免費才會使用。用戶對AI的付費意愿其實還是挺強的。

未來的話我可以提供一點想法。我們在做數據標注流程中有一個關鍵步驟叫做預標注,就是我們訓練一個模型,讓模型來進行初級標注。這一步非常有價值,可以節約很多人力成本。我們將原始數據投入預訓練的模型進行預標注,然後進行半自動化的數據處理,最終手動進行精確標注。預標注可以顯著提高效率,可能原本需要100人的工作,現在可能只需要50到70人。

另外預標注方面也涉及到AI和人的協作,通過你的反饋可以不斷提高模型的預標注能力,從而減少數據標注團隊的人數需求。隨着AI和人的協作越來越好,原本100人的團隊可能只需要30人。但是,這個過程有一個下限,即使AI協作做得非常好,仍然需要一定數量的人工進行最終的標注和審核。

在其他領域由於我不是數據科學家,我沒有親自清洗過數據或使用數據進行SQL查詢,所以我不清楚AI在這些領域具體能提供多大的幫助。

Qiming Venture Partners-唐弈:我覺得長期內與Web3和AI是應該有一些交集的。比如從意識形態的角度,Web3的價值體系是可以結合到AI上的,很適合作為bot的账號體系或者說價值轉化體系。想象一下,一個機器人擁有自己的账戶,可以通過其智能部分賺錢,以及為維護其底層計算能力付費等。這些概念有點科幻,實際應用可能還有很長的路要走。

第二個可能的方向驗證AI模型的輸出是否基於特定類別或特定的模型,或者特定的數據,並且是否可信。這些領域在可信的AI模型中可能有一些用處。從技術角度來看這些非常有趣,但是否有足夠的市場需求尚不確定。

另外一方面是AI的出現使數據內容生成變得泛濫和廉價。對於數字作品等內容,難以確定其質量和創作者。在這方面,數據內容的確權可能需要一個全新的體系,包括創作者和智能體的角色。但總的來說,這些問題可能仍然有待解決,而故事性的內容可能需要更長的時間來發展。在短期內,我們應該繼續關注數據底層的質量,並期待模型能夠變得更強大。

另外在商業化方面,確實數據產品商業化非常難。但是我認為從商業角度來看,AI可能短期內不是解決數據產品商業化問題的解決方案。商業化需要更多的產品化努力,而不僅僅是數據化能力。因此,這些項目可能需要开發其他產品來實現商業化。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

推薦文章

關於 Crypto + Agent 的終局思考:必然性、結合點和發展階段

本文探討了三個關鍵問題: 在回答這個問題之前,我們首先需要了解人工智能(AI)、大規模AI模型和智...

2 5小時前

Meme日報,一圖了解過去24小時熱門Meme(2025.1.6)

PANews 聯合 GMGN.AI 全新推出「Meme 日報」,一圖速覽 Meme 板塊熱度分布,...

3 5小時前

a16z:2025年值得關注的七大加密核心趨勢

原文標題: 7 Big Ideas for 2025 (and more trends to wa...

星球日報
2 5小時前

BIO Protocol深度研報:幣安傾力支持的去中心化科學(DeSci)平臺

一、項目簡介 1 、項目基本信息 BIO Protocol是一個去中心化科學(DeSci)平臺,旨...

2 5小時前

Vitalik 新文:去中心化加速主義與人工智能一周年展望

文章圍繞去中心化加速(d/acc)理念展开,探討其在技術發展中的應用及面臨的挑战,包括人工智能安全...

2 5小時前

OSL交易時刻:比特幣已從低點反彈,短期或有望衝擊12.5萬美元

1.市場觀察 關鍵詞:ETH、ETF、BTC 羅伯特·清崎近期發出警告,指出不計後果的貨幣政策和過...

3 5小時前