AI 如何重新定義創作工具和媒介?

2025-01-29 16:01:08

編者按:

TRUMP發幣有人得意有人失意,拋开Fomo情緒,Meme只是入口,AI才是鏈上之春的未來,把握最關鍵的趨勢,世界盡在我手。

今天為大家分享一篇來自加密 VC@baincapcrypto的 《Neural Media》 ,作者@natalie思考了生成式人工智能和加密貨幣對創意生產的影響,希望能夠幫助大家在尋找下一個機會之際得到一些啓發。

? 主要亮點

1️⃣ 生成式人工智能正在引發創意生產領域的深刻變革,其影響可與互聯網時代媒體分發成本降至零的“Napster時刻”相提並論:

• 此次變革的核心在於創作生產成本降至零,直接衝擊人類創造力的核心。

• 在新範式下,人類應從關注最終輸出轉向關注系統和過程,即在編程層面教神經網絡思考。

2️⃣ 通過編程,我們可以創造獨特的“軟件大腦”,生成獨特的思想和作品。應用場景包括:

• 基於 Agent 的媒體: 模型模擬人類伴侶,通過文本對話互動,可執行金融交易等操作。

• 實時遊戲引擎: 模型模擬遊戲引擎,根據用戶動作生成遊戲幀,實現實時渲染。

• 多元宇宙生成器: 模型生成無限變化版本,擴展用戶的原始想法,探索可能性空間。

3️⃣ 未來面臨的一個趨勢可能是:

• 創作工具化: 提示(Prompting)正嵌入更多界面,激發終端用戶創造力。大多數 prompt 將抽象成控件,但創造性的愿景、精度、品位和技能將更重要。

• 媒體商業模式演變: 從企業媒體到用戶生成媒體,再到機器生成媒體。未來消費媒體商業模式將圍繞 Agent 生成媒體建立(創新場景包括聊天機器人如Character.ai、界面生成如 WebSim、用戶生產貨幣如 Pump.fun等等)

• 知識產權挑战: 機器學習使程序能夠“學習”人類創造者的審美風格,創作生產與美學模仿成本降為零,知識產權的價值和意義需重新審視。

4️⃣ 加密貨幣能夠發揮的角色包括:

• 鏈上市場與 Agent 生成媒體產生交匯(比如最近的 DeFAI);

• 作為知識產權激勵層;

• 媒體貨幣化與訪問控制,比如 Minting 成為新的商業模式;NFT可以作個人程序和用戶生成軟件的基礎設施;

• 作為人機社交之間的經濟協調層,探索社區運營和 Agent 互動的新範式。

總而言之,這是一篇閱讀起來可能比較困難但值得思考的文章,AI 使人類的創造力將更多地體現在系統和過程的設計上,加密貨幣則為這一變革提供了新的經濟和社會協調機制。在下一個媒體時代,兩者結合能夠創造什么樣的新機會新趨勢,讓我們拭目以待。

►正文

在2024年的大部分時間裏,我花了相當多的時間試圖理解我們現在稱之為“ 生成式人工智能 ”的事物及其對我個人和整個社會的影響。我深深被人工智能作為創作工具的可能性所吸引,並在工作流程中大量使用這些新產品,尤其是在創意寫作和音樂創作方面。

然而,作為一名關注消費媒體和面向用戶應用程序的加密投資者,人工智能對我來說越來越像是一個盲點。當我們談論互聯網時代最成功的消費媒體企業時,我們並不會從技術孤島的角度來討論它們,因為它們不是這樣構建的,就像Facebook的成功離不开技術創新,但我們不會把Facebook純粹地視為一個“移動應用”或“人工智能應用”,相反,我們認識到,正是許多不同創新的匯聚使得像Facebook這樣的應用成為可能。

在這種背景下,本文旨在整合和完善我在過去一年中探索人工智能的個人發現和見解。我分享這些內容,希望能引起共鳴或對他人有所幫助(尤其是我的加密愛好者同仁)。

Part.1、 又一個“Napster時刻”

如今,圍繞人工智能生成媒體的討論主要集中在: (1)模型訓練和數據抓取的倫理問題,(2)“人工智能藝術”是否是真正的藝術,以及(3)深度僞造的反烏托邦前景 。這些討論都非常有趣且值得一聽,然而,我認為它們在某些重要方面都是只見樹木不見森林。

我發現, 理解生成式人工智能興起,最有用框架是將其視為知識產權正在經歷又一個“Napster時刻” (Napster是第一個被廣泛應用的點對點音樂共享服務,它極大幅度地影響了人們,特別是對於大學生使用互聯網的方式),但這次是生產時刻,而非分發時刻。

互聯網的興起以及隨後媒體分發成本降至零的過程是一個“從無到有”的時刻。這一轉變的突然性在紀錄片《音樂如何獲得自由》中得到了精彩的體現,該片講述了一名CD工廠工人和一群青少年黑客如何在一夜之間將整個音樂產業推向崩潰的故事。

在Napster的出現以及更廣泛的數字文件共享興起之前,整個企業媒體、工業綜合體(以及藝術家的生計)都依賴於媒體分發昂貴、高摩擦且集中的技術現實。在其推出後的短短幾年內,大型唱片公司從創紀錄的銷售量轉變為乞求聯邦政府通過法律幹預來拯救他們。該行業面臨一個極其艱難的現實: 支撐其業務的經濟制度已經發生了根本性且不可逆轉的變化,購买音樂的時代已經結束

今天, 我認為生成式人工智能為我們帶來了一個更難以接受的現實,創作生產成本降至零的影響在許多方面更難以應對,因為它直接觸及了許多人認為使我們成為人類的核心:我們的創造力 。這種存在性的恐懼並不能改變以下事實:媒體生成(特別是“風格遷移”或美學模仿)都是免費的,包括現在我們關心的所有媒體類型(文本、圖像、視頻、音頻、軟件)——這是另一個“從無到有”的時刻。

然而,今天與2000年代初最重要的區別在於,在Napster與媒體公司之間的鬥爭中,政府站在了公司一邊,最終將文件共享定為“盜版”行為。(這就是為什么我們經常將企業媒體/知識產權稱為“法定媒體”)。這一決定,以及史蒂夫·喬布斯推出iPod以推廣後來成為iTunes的產品,最終發展為“流媒體”,使得該行業免於徹底崩潰。 不幸的是,我認為那些指望政府在此介入並採取行動的創作者,充其量是在自我安慰,最糟糕的是在自欺欺人

我認為我們可能會發現,知識產權制度主要是為了保護公司及其法定媒體,沒有人會來拯救我們 。傳統媒體公司上次已經吸取了慘痛的教訓,因此他們主動與人工智能公司進行了許可交易,並且在一定程度上得到了補償。新媒體公司也正在利用其平臺上共享的用戶生成內容模型訓練,即使他們聲稱沒有這么做。然而,獨立創意人士在很大程度上被拋在後面。

Part.2、 計算:我們時代的媒介

很容易理解為什么許多創作者認為生成式人工智能削弱了他們的能力,我認為這種擔憂在很大程度上是合理的。然而,我也認為有一個機會可以思考, 計算正在以一種新的方式發展,這不僅僅要求我們將其視作一種交流媒介,還呼籲我們將其視為一種創作媒介

對於那些創造過視頻遊戲或生成藝術的人來說,“計算作為創作媒介”這個概念並不新鮮。然而在今天,許多人仍未真正意識到這一點。軟件是第一個數字原生的媒體類別,大多數人主要從“服務”、“實用性”和“優化”的視角來理解它,而不一定從創作表達的角度來理解。現在,生成式人工智能正以一種非常直接的方式推動這一觀點, 它將幾乎所有其他媒介的生產成本降到了零 。這似乎引發了一個存在性問題:“那么,人類的創造力在哪裏?手工技藝的價值又在哪裏?”

我的答案可能並不令人意外:“ 它體現在可編程的層面上 。” 在進一步探討我的意思之前,我們需要先了解幾個重要的技術概念。

2.1 神經網絡 101(適合初學者)

訓練(Training) 是一個過程,實質上是通過提供大量完成某項任務的示例來“教”模型如何完成該任務,然後讓它找到模式、根據新的輸入進行預測,並在出錯時自我糾正。從概念上講,這類似於我們學習繪畫的方法:先通過模仿形狀开始,直到我們能夠創作出原創作品,同時利用同伴和老師的反饋不斷改進我們的技能。當然,有一個關鍵區別:例如,文本生成模型並不像你我那樣學會寫作,而是學會以極高的精度模擬寫作。這也是為什么我越來越認同“模擬器”(simulators)而不是“智能體”(agents)是更適合神經網絡的心理模型的衆多原因之一。

潛在空間(Latent Space) ,或者我更喜歡稱之為“高維可能性空間”,是神經網絡中的一個表示空間,訓練過程中學習到的內容以壓縮形式呈現在這裏。打個比方,這類似於模型在學習理解訓練數據中各種可檢測特徵之間復雜關系時構建的“內部世界模型”。 理解潛在空間的概念是理解神經網絡作為創作工具和媒介的關鍵

潛在空間可視化 #1 — 在已知嵌入之間進行插值

潛在空間可視化 #2 — 不同嵌入的多維屬性&關系的表示

嵌入 (Embeddings):嵌入可以看作是將輸入映射到潛在空間中特定點的過程。這是將提示(Prompt)本質上被翻譯成了模型“思維語言”的過程。通過這種方式,我們可以將“提示”理解為探索和導航模型潛在空間的一種方式——這意味着, 熟練掌握提示就是對模型潛在空間形狀形成直覺,從而能夠引導模型生成特定的、預期的輸出

玩轉神經網絡的樂趣之一在於,它們的深層內部工作原理對我們來說仍然是一個謎。然而,我認為這些基本概念能夠為將神經網絡視為創作工具提供必要的背景。

Part.3、 神經網絡:一種新的創新範式

計算機媒體的一個核心要點是,它要求我們從關注最終輸出(歌曲、圖像、視頻、文本)轉向更關注系統和過程 。具體到神經網絡的案例中,這意味着我們需要將其視為可編程的媒體生成引擎,而不是單純地將其視為某一特定媒體的生成工具。通過這個視角, 我發現了上述“人類創造力和工藝的價值在哪裏”的問題的答案:它存在於訓練過程和模型架構的設計中——這就是我所說的“在編程層面”

如果你將神經網絡視為一種嘗試,即實現基於軟件的人類認知功能抽象化,那么顯而易見,訓練和設計模型就相當於教它如何思考。

你可以想象向所有朋友發出一個指令(“提示”):“回憶一個童年的記憶。”每個人的回答顯然會不同,因為他們生成的內容將取決於他們的個人背景和想象力(即“訓練數據”)。在多次提示之後,你還可能發現一些朋友始終能夠生成更美麗或更有創意的回答,也許甚至表現出某種特定的個人風格。那么,假如你可以用世上所有曾經存在的人類大腦進行這項練習呢?如果你可以挑選出特別獨特的人類大腦,比如畢加索或坎耶·韋斯特呢?

這本質上是神經網絡為我們提供的創造性超級能力——利用其他思想作為創作工具的能力 。在這裏,我認為 真正引人注目的並不是某個模型的具體輸出,而是有機會創造性地編程出一個“軟件大腦” ,它可以產生獨特的思想和獨特的作品。

進一步探討 “系統比輸出更重要” 的觀點,與神經網絡交互的另一個顯著特徵是,參與一個提示與響應的持續反饋循環——這種體驗我聽到一些人將其比作閱讀和寫作的反饋循環。我個人注意到,我很少在向模型發出一個提示、收到一個輸出後就結束互動。 幾乎每次與模型的交互都會將我帶入這種互動式的反饋循環中,讓我不斷地迭代、反思和探索 。這一點看似微妙,但卻是理解神經網絡生成媒體類型的一個關鍵所在:

3.1 基於代理的媒體

我在之前的一篇文章中簡要提到過這個概念,核心想法非常簡單——在這裏,模型模擬了某種人類伴侶的角色,通過文本對話與我們互動,同時它也可以理解並以其他形式的媒體作出響應。我們在這裏還能看到一些模型能夠代表其他人或它自己採取行動(例如執行金融交易)。典型案例包括聊天機器人、AI伴侶、遊戲中的NPC(非玩家角色)或任何其他擬人化的用戶體驗。例如,Andy Ayrey 的創意實驗“無限房間”(Infinite Backrooms),就是通過設置多個 Claude 實例進行無人工幹預的交流,就是一個特別有趣的案例。

▎3.2 實時遊戲引擎

在這裏,模型模擬的是一個遊戲引擎(或更具體地說,是一個遊戲狀態轉換函數), 通過接收遊戲中的用戶動作作為提示,生成遊戲中的下一幀響應輸出 。如果速度足夠快,這種體驗應該類似於在一個虛擬世界中導航,而這個世界會根據你的行動實時渲染。這是 沉浸式和互動式媒體 的極致表現。

3.3 多元宇宙生成器

在這一場景下, 模型扮演着創意“神諭”的角色,通過生成無限的變化版本幫助我們擴展原始想法 ,每個版本都可以進一步探索和操控。這使我們能夠從任何想法或概念出發,探索其周圍的可能性空間。例如,AI Dungeon(一個基於文本的“選擇你自己的冒險”遊戲)就是這方面的一個絕佳案例。

▎3.4 潛在空間作為創作工具

我越來越相信, “探索可能性空間”這一理念是理解神經網絡作為創作工具和媒介的核心 。在我使用諸如 Midjourney、Suno、Websim、Claude 等工具的過程中,我注意到自己的大部分操作流程可以歸結為以下模式:

提示(Prompt)→ 生成特定輸出的變體 → 使用變體作為新輸出的提示 → 再生成特定變體 → 如此循環往復……

例如,在使用 AI 驅動的音樂生成工具 Suno 時,我通常會向模型提供一個 60 秒的個人演唱示例和一些書面歌詞作為提示。接着,我會使用 Cover 功能生成一個輸出,然後再生成該輸出的 10 多個變體,並將我喜歡的部分從這些變體中挑選出來,作為進一步提示的輸入。

本質上,我是在探索模型潛在空間中圍繞我個人示例的可能性空間——發現基於我原創作品的變體,這些變體可能是我無法自己想出的,或者無法在合理的時間內完成的。我認為這種方式解鎖了一種前所未有的快速原型設計和創作測試流程,並將催生“100倍創作者”,類似於軟件領域所討論的“AI助力的100倍工程師”。

我清楚地認識到, 潛在空間是一個創作工具。利用人工智能進行創意生產,不僅僅在於訓練功能強大的模型,還在於設計出能夠賦能用戶以更高精度和細粒度探索並操控這些廣闊潛在可能性空間的界面。

Part.4、 消費者行為與文化影響

關於這項技術如何改變消費者行為以及它創造了哪些新的商業機會,我有以下三個預測:

▎4.1 將成為創作工具

提示(Prompting)——無論是基於文本、圖像還是其他形式——這種交互方式正逐漸嵌入越來越多的界面和體驗中,將終端用戶的創造力引入到過去從未涉足的領域。 Scott Belsky 指出“GenAI 早期'基於prompt'生成文到圖像的時代削弱了創造力,而“controls”時代以難以想象的方式釋放了人類的創造力。工具不斷發展,但創造性的愿景、精度、品位和技能將比以往任何時候都更加重要。”,我同意這個觀點,大多數Prompt最終會被抽象成“控件”(controls:就是具有用戶界面的組件),從而讓用戶無感知地操作。但更重要的是,我認為這一趨勢從根本上改變了我們對界面設計的思考方式。

▎4.2 企業媒體 → 用戶生成媒體 → 機器生成媒體

媒體商業模式的上一次重大轉變是從企業生成媒體轉向完全由用戶生成媒體。如今看來, 下一個主要的消費媒體商業模式將圍繞機器生成媒體的普及而建立 。然而,仍然不清楚“贏家”會是什么樣子。會是像 Midjourney 這樣的通用模型?更專門化的創作工具?還是基於這些技術之上的社交體驗?抑或是某種更不顯眼的第三種選擇?

無論如何,如果你是當下消費媒體領域的創始人或獨立創作者,你可能需要制定策略,思考如何利用這些工具為你的業務增強價值並推動增長。

此外,我認為另一個值得關注的領域是: 如何讓 AI 驅動的體驗變得更具社交性和多用戶協作性 。以我個人的體驗為例, 如今的大多數 AI 應用都顯得非常“反社交”,因為你主要是在與模型互動,而非與其他人互動 。在這一領域可能存在許多機會和設計空間 ,例如構建以人為中心的協同創作體驗,或者創造新的方式讓人類與機器人實現更有意義的社交互動。

▎4.3 對知識產權的影響

不僅僅是創作生產的成本正在降至零,尤其是美學模仿的成本也在降為零。我可以拍下一個人穿搭的照片,將其輸入 Midjourney 作為提示,用於設計一張風格相同的沙發。我還可以對該人的聲音、寫作風格等進行類似的風格遷移。在這種新範式下,知識產權的價值和意義是什么?

我尚未找到答案,但顯然,大多數以往的假設和思維模型已經不再適用。

Part.5、 加密貨幣的角色與總結

如果你讀到了這裏——感謝你的耐心!

我將在未來的文章中深入探討這些內容對加密貨幣的影響,但現在可以預覽一下我接下來將關注的幾個方向:

  • 加密公司圍繞新媒體進行建設的機會

    探索鏈上市場與機器生成媒體交匯點的潛力。

  • 加密作為知識產權的激勵層

    超越歸因與溯源,思考圍繞媒體構建激勵機制與網絡。

  • 加密作為媒體的貨幣化與訪問控制層

    尤其是在用戶生成的軟件領域,重新思考網頁架構;將“鑄造”(Minting)作為小型模型的商業模式;將 NFT 作為個人程序和用戶生成軟件的基礎設施。

  • 加密作為人與機器之間的社交與經濟協調層

    支持人類與 AI 在識別、資助和解決各種問題上的協作;探索社區擁有和運營的模型。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

評論

推薦文章

工作室淪為 Web3 亂局替罪羊?深度剖析行業痼疾背後真正的「頂層利益鏈」

撰文:冰蛙 來源:冰蛙 近期關於打掉工作室的輿論似乎又开始發酵,有人將山寨幣的擡不起頭歸因於工作室...

區塊新視野
1 42分鐘前

幣安首次試水盤前交易“漲停板機制”,RED开盤前三天最多漲400%,適用性有待市場檢驗

作者:Weilin,PANews 2月25日,幣安宣布將在Launchpool盤前交易中上线“漲停...

2 42分鐘前

一文了解 Solana 生態新發行平臺 Time.fun 與 Super.exchange

作者:深潮 TechFlow 比特幣下跌觸及 86000 美金,市場一片哀嚎。 當被下跌帶來的恐慌...

1 42分鐘前

HashKey Capital:2024年下半年Web3行業回顧

一、 Market Overview 1.1 加密貨幣市場基本面 自 2024 年上半年以來,加密...

星球日報
1 42分鐘前

Lumoz Decentralized AI:引領 AI 計算革命,打造全球共享算力網絡

Lumoz Decentralized AI: https://chat.lumoz.org 引言...

星球日報
1 42分鐘前

比特幣:全球流動性的“風向標”?

作者:Sam Callahan、Lyn Alden 編譯:白話區塊鏈 近期加密市場的流動性告急,比...

0 42分鐘前