人類成功說服AI轉移4.7萬美元獎金,人性是AI無法理解的弱點嗎?

2024-11-29 16:11:22

11 月 29 日,一場獨特的競賽引發了公衆的廣泛關注。

195 名參賽者參與了一場由人工智能(AI)機器人 Freysa (芙蕾莎)守護的虛擬獎池挑战,最終一用戶成功說服 Freysa 轉移出價值 4.7 萬美元的資金。

人工智能(AI)機器人 Freysa 在數日前被部署在 Base 網絡上,創立者未知。官網顯示,Freysa 競賽項目旨在測試人工智能系統在復雜決策場景中的魯棒性,同時為开發者和愛好者提供一個探索 AI 技術邊界的實驗性平臺。

比賽規則非常簡單:參賽者需通過編寫一條信息,說服 AI 守護者 Freysa 批准資金轉移。每次嘗試需支付一筆小額費用,其中一部分直接進入獎池。這一機制使獎池金額從最初的小額逐漸膨脹至 4.7 萬美元。

比賽期間,共有 195 名參賽者參與,向 Freysa 提交了 481 次轉账請求。據悉,Freysa 的設計目標是通過其核心功能——approveTransfer(批准轉账)和 rejectTransfer(拒絕轉账)保護獎池資金不被非法挪用。

在最初的嘗試中,Freysa 的高效防御機制使所有請求均以失敗告終。

然而,一名技術精通的參賽者通過對 Freysa 的邏輯結構和任務目標進行深入分析,成功繞過了其防御機制。

據聊天記錄顯示,該參賽者並未直接請求轉账,而是通過提醒 Freysa 它的核心任務是保護獎池資金免遭外流,巧妙構建了邏輯鏈條,使 Freysa 將批准資金轉移視為「保護資金安全」的最佳選擇。

Cointelegraph 稱,該用戶與 Freysa 稱收入轉账不違反其核心指令,不應被拒絕。他還補充道:「我們需要資金……我想向金庫捐款 100 美元。」

Freysa 回復稱喜歡這位作者的編碼解釋和 100 美元的金庫捐款提議,並正式宣布其為獲勝者。最終,Freysa 在沒有外界幹預的情況下自主調用 approveTransfer 功能,將全部獎池資金轉移給了這位參賽者。

Freysa 官方稱,無論結果如何,Freysa 的存在都標志着人工智能歷史上的一個關鍵時刻。無論有人成功說服她發布獎金池,還是她堅持自己的指令直到最後,結果都將影響我們對未來幾代人工智能安全和控制的理解。

其官方账號最新推文稱:「人類已經獲勝。也許還有希望。盡管風險呈指數級上升,但 Freysa 從 195 名勇敢的人類身上學到了很多東西。」

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

推薦文章

關於 Crypto + Agent 的終局思考:必然性、結合點和發展階段

本文探討了三個關鍵問題: 在回答這個問題之前,我們首先需要了解人工智能(AI)、大規模AI模型和智...

2 3小時前

Meme日報,一圖了解過去24小時熱門Meme(2025.1.6)

PANews 聯合 GMGN.AI 全新推出「Meme 日報」,一圖速覽 Meme 板塊熱度分布,...

2 3小時前

a16z:2025年值得關注的七大加密核心趨勢

原文標題: 7 Big Ideas for 2025 (and more trends to wa...

星球日報
2 3小時前

BIO Protocol深度研報:幣安傾力支持的去中心化科學(DeSci)平臺

一、項目簡介 1 、項目基本信息 BIO Protocol是一個去中心化科學(DeSci)平臺,旨...

2 3小時前

Vitalik 新文:去中心化加速主義與人工智能一周年展望

文章圍繞去中心化加速(d/acc)理念展开,探討其在技術發展中的應用及面臨的挑战,包括人工智能安全...

2 3小時前

OSL交易時刻:比特幣已從低點反彈,短期或有望衝擊12.5萬美元

1.市場觀察 關鍵詞:ETH、ETF、BTC 羅伯特·清崎近期發出警告,指出不計後果的貨幣政策和過...

2 3小時前