看Reflexer如何將PID控制理論應用於加密貨幣
以下為全文翻譯:
這篇作品深入探討了BlockScience團隊與Reflexer實驗室合作开展的工程設計工作,重點是在2021年2月17日主網啓動前對RAI系統進行參數化。涵蓋概念包括PID控制器、治理面、不確定性下的參數選擇、控制器壓力測試和安全系統推出。
前言
web3領域已經成為了許多方向快速進行金融實驗的基礎。許多項目都在為其代幣尋求價格穩定(任何有用的貨幣都應該如此),並且經常以不同的方式進行。從外部貨幣掛鉤到重定價機制,有許多關於 "穩定 "的嘗試,但RAI是第一個使用既有控制理論走向反思性(或自我反思性)穩定價格的代幣系統的此類代幣。與現有的與法幣掛鉤的系統相比,RAI可以 "減震ETH",因為穩定控制器可以減弱基礎資產引起的價格波動,而不需要明確的掛鉤。
更具體地說,通過在系統設計中利用比例-積分-微分控制器(PID)控制器,RAI可以為以太坊DeFi生態系統提供一種不與任何外部資產掛鉤的低波動性儲備資產。在各種設備中部署PID控制器的現有工程實踐深度為我們提供了堅實的工程基礎,因而我們可以從中考慮RAI的設計。
復雜的系統
優化復雜的系統基礎設施以平衡多個利益相關者的需求是工程設計的一項壯舉。它需要對系統目標、約束條件和利益相關者需求的理解,以及對所涉及的權衡進行全面分析。建模和仿真的工具,如cadCAD,可以很好地幫助我們管理復雜性和平衡優化,以確保首選結果。
這就需要我們深刻理解系統目標以及實現這些目標需要應用的機制所涉及的參數。在本節中,我們將研究RAI系統的各種目標,以及涉及哪些參數,包括受控和不受控。
RAI分析儀表盤向最終用戶展示相關的系統指標。這些同樣的指標通過cadCAD模型為設計提供了信息,甚至在RAI系統存在之前,就已經對它們進行了測量。
目標
RAI生態系統的目標是工程設計過程的首要考慮因素。系統目標保證了cadCAD仿真參數及指標與總體目標的一致性。RAI項目的系統目標包括:
在不假設贖回價格掛鉤的情況下,平滑二級市場的價格變動。
在一系列外生衝擊下,控制器的穩定性。
如果二級市場違反流動性要求,可平和地啓動和關閉贖回價格調整(機制)。
系統設計的下一步是確定參數,這些參數可分為兩類:一類是在系統控制下的參數(受控參數),另一類是無法控制的參數(環境參數)。
受控參數規定了系統設計者可以選擇的關鍵特性,以實現系統目標。RAI項目控制參數包括:
控制器專用參數
債務市場具體參數
定價預言機參數
環境參數規定了系統的外部特徵,也影響系統目標的實現。RAI項目的環境參數包括:
ETH價格
二級市場的 "外部 "交易需求(不包括因市價與贖回價錯位而產生的 "內部 "交易需求)。
此外,衡量這些目標實現情況的指標也很重要。我們可以在給定環境參數下,根據反映系統目標的KPI匯總來選擇控制參數。RAI項目針對每個系統目標的KPI包括:
響應性目標:合理的套利器和控制器對不同環境參數脈衝的響應時間。
波動性目標:二級市場價格變化的統計離散性。
穩定性目標:測量穩定與不穩定路徑在模擬中的相對頻率。
流動性目標:二級市場滑點的可控性。
治理面
加密經濟系統和控制系統有一個共同的現象,就是有一組由人類設定的參數,在系統動態中編碼權衡決策。在加密經濟系統中,我們把受到人類監督的參數稱為治理面。
明確治理面很重要,而且在可能的情況下,重要的是,調整這種參數的效果相對直接。通常情況下,治理的概念被用作一個籠統的概念,假設人類將擁有專門知識、規程和協調,以就未來對這些參數的更改達成一致。
在實踐中,目標是保持較小的治理面,以減少治理行動的頻率和復雜性。此外,前期基於模型的系統工程工作可以幫助確定初始參數,以制定推出計劃和(或)最大限度地減少未來變化的規模。
了解並選擇控制器類型
RAI是一種創新的加密經濟系統,它使用PID控制器的變體作為維持市場價格穩定的手段。PID控制器是最常見的一類控制器。它利用比例(P)、積分(I)和微分(D)來影響時間序列的未來值。
PID控制器的一個強大特點是,即使在沒有預測的情況下,它也能不斷地適應,因為誤差的增加往往會使它的適應強度更高。具體來說,P是對眼前測量的一種理解,而I是對過去的理解,D則是與未來的預期變化有關。
對於D而言,通過外推預期變化,有可能降低無噪聲(理想化)穩態誤差率,但代價是對突發變動的敏感性。一般來說,微分對市場價格中經常出現的噪聲和波動測量很敏感。在經濟環境中,D可能成為攻擊向量。
鑑於這些考慮,(我們)決定將分析重點放在P和I上,並將D設為零。下文將簡要介紹用於評價啓動時RAI參數備選方案的分析種類。
探索P和PI變量,為RAI啓動進行預調
迄今為止,RAI僅為了響應動態的簡單性而使用P(Kp);然而,由於已知比例控制器會受到穩態誤差的影響,因此也需要包括一個積分項。雖然積分控制器可以有效地處理穩態誤差,但它們很容易受到wind-up(飽和)的影響,即積分項的累積會導致控制動作的偏差。為了應對這種情況,我們還必須考慮一種抗wind-up(飽和)機制。因此,積分泄漏率被納入我們的參數選擇空間。
惡意鯨魚測試
如果不了解大型代幣持有者('鯨魚')的潛在影響,任何關於價格穩定性的實驗都是不完整的。在下面的場景中,我們將設想一個名為'白鯨'的惡意鯨魚購买了大部分的RAI供應,並利用它強行將RAI的市場價格保持在一個恆定的水平。
在下面的例子中,我們考慮了5種可供選擇的控制器類型的變量(正Ki與負Ki,泄露積分器與非泄露積分器,以及零Ki),並驗證了在合理選擇參數的情況下,長期來看,鯨魚是可能會輸給控制器的。
第一個可視化是看如果白鯨保持市場價格不變,贖回價格會發生什么。從下圖1中可以看到,在所有測試的方案上,除了Ki為負且無泄漏項的方案外,贖回價格在2周的時間內都會趨於零,這就意味着該參數化選擇不可行。
圖1
相對於比例控制,具有正Ki項的PI控制器加速了白鯨誘導的市場暴跌。負Ki項的PI控制器可以緩衝崩潰,使系統恢復。然而,泄漏項是至關重要的,因為如果讓積分項壓倒比例項,就等於控制器向攻擊者投降--這是我們不能容忍的。幸運的是,在泄漏積分項和比例項之間的關系上有一個分析邊界,能夠確保這種情況不會發生。
在RAI經濟動態的背景下,這種情況是如何發生的?發生這種情況的原因是控制器會根據市場價格自動調整贖回率。
當選擇比例控制器(僅Kp)或帶有泄露積分項的PI控制器(Kp & Ki)時,穩態動態能包括恆定的負贖回率,着是我們在RAI生態系統中的目標。值得注意的是,如果我們排除泄漏,積分項就會產生反作用的加速效應。在Ki為正的情況下,贖回率會向負方向加速,而在Ki為負的情況下,贖回率會向正方向加速。這兩種PI(無泄漏)情況都不是特別理想的情況。
在沒有泄漏項的情況下,加入積分項有可能使RAI系統不可持續,因為很明顯,它允許對用戶進行經濟剝削,或者由於越來越大的負利率而使代幣越來越無法使用。考慮到鯨魚攻擊是真實存在的問題,這一分析表明,只有在包含抗windup(飽和)泄漏機制的情況下,P控制器是可行的,PI控制器是可行的。
穩態誤差測試
RAI的另一個關注點是穩態誤差;具體來說,系統有可能在沒有縮小贖回價格與市場價格之間的預期差距的情況下實現某種程度的價格穩定。事實上,在控制設計空間中引入積分項的唯一原因是為了幫助消除穩態誤差。穩態誤差問題往往是在存在噪聲或衝擊的情況下產生的。
在下圖3中,市場按照馬丁格爾過程演變。我們觀察到,Ki項往往會對贖回率產生偏差(見下圖),這種偏差可能很小,但隨着時間的推移,將導致贖回價格的巨大差異。
圖3. 即使參數選擇得當,每小時兌換率的變化幅度很小(<5e-9),但隨着時間的推移,仍會導致較大的累積誤差。
在圖4中,我們可以看到累積誤差隨時間的變化。無泄漏的正Ki傾向於增加絕對誤差(較大幅度的負誤差),而無泄漏的負Ki傾向於減少絕對誤差(較小幅度的負誤差),兩者都是相對於P控制器測量的。負Ki無泄漏的PI控制器實現了最小的絕對誤差,但由於上面討論的惡意鯨魚攻擊,我們已經排除了該設計。
圖4
在我們的例子中,相對於僅有P的控制器,加入泄露積分項的好處很小,因此需要進一步的調整,以便在穩態誤差的基礎上有意義地區分這兩種選擇。就目前而言,這意味着加入I項所增加的復雜性在短期內並不能被系統穩定性的好處所證明,在實施之前還需要在這個方向上進行更多的研究。
另一個重要的觀察是贖回價格的失控趨勢。比例控制器和有抗windup(飽和)的PI控制器能夠實現控制,而沒有抗windup(報個)的PI控制器則會失控。負Ki項會導致贖回價格發散(跑偏到無窮大),而正Ki項會導致贖回價格收斂到0。
圖5.非泄漏的PI控制器會在贖回價格上產生漂移,即使累積價格誤差的大小仍然是有界的。
不確定性下多維系統的參數選擇
在對控制參數進行迭代的同時,還要對RAI系統和交互作用的大量數據和復雜性進行科學分析,這就需要使用新的科學方法。
上面的簡單模型只考慮了P(I)的控制邏輯,下面用於分析的模型則包括了該背RAI的抵押債務頭寸以及作為RAI二級市場(和價格傳感器)的流動性池服務
為此,BlockScience开發了 "不確定性下的參數選擇 "方法,以實現數據驅動的知情決策。這篇關於 "在不確定性下執行參數選擇 "的文章對它以及相關步驟和挑战進行了簡要描述。
RAI參數選擇
在下面一節中,我們將提供一些非詳盡的例子,說明在更廣泛的RAI系統模型上運行的一些計算實驗,其中包括SAFEs系統和流動性池(ETH/RAI Uniswap實例)。
場景測試
我們的工作流程規定了一些測試場景,以將系統目標與可測量的KPI,以及最終與選定的控制參數聯系起來。所執行的場景包括:
"合理性檢驗",以確保系統的Plant表現符合預期;這將考慮控制器關閉的情況,唯一的不確定性來源是ETH價格的變動。
衝擊檢驗,即引入外生過程的預設變化,衡量系統的反應能力,以及
軌跡抽樣,即蒙特卡洛在許多隨機過程實現上運行,在各種環境條件下對反映系統目標的關鍵績效指標進行測量和評價。
"合理性檢驗 "測試
要測試的基线場景是債務和二級市場系統在沒有控制器的情況下自行運行。這種測試是為了確保 "Plant "模型在使用它來評估控制器之前正常工作。
這個合理性檢驗通過固定贖回價格來復制'掛鉤到法幣'的控制器。在這種情況下,系統應該達到一種狀態,即ETH的價格變動會被'傳遞'到市場價格上,而贖回價格固定在其初始條件下(這種情況下,RAI是Reflexer在發布時設定的值,3.14美元/RAI)。 "合理性檢驗 "的結果見下圖6。
圖6:在PID控制器關閉的情況下,將生成的ETH價格信號引入模型,在RAI的市場價格上產生相應的變動。
如圖6所示,在控制器關閉的情況下,ETH價格產生的變動會在RAI的市場價格中產生相應的變動,並有輕微的向上漂移(具體到ETH價格的衝擊過程實現)。觀察到的動態與同類系統(如單一抵押品DAI)中的動態相似。
衝擊測試的攻擊和失效模式
與任何綜合系統設計一樣,我們需要了解我們系統的局限性,以及在什么情況下會出現故障。衝擊測試從實現外部過程的一次性變化开始,例如ETH的價格,並檢查由此產生的對系統動態的影響。衝擊測試對於選擇能保持系統穩定的參數範圍特別有用,即保持價格和代幣余額不至於跑到無窮大或為零。
下面是一個例子,比如,兩周後ETH價格突然下跌30%。我們可以看到,在Kp=2e-07和5e-09的情況下,對PI變量的影響是失控的,而那些由參數建議給出的值則保持穩定和有界。
圖7:2周後ETH價格階梯變化下贖回價格與市場價格的衝擊分析。綠色為泄露PI控制器的可行參數範圍,紅色為失敗模式的例子。
建議參數範圍
基於不確定性工作流程下的參數選擇,我們確定P控制器是最簡單和最安全的網絡啓動配置,並進一步觀察到,如果我們希望進一步減少穩態誤差,可以添加一個積分,但只有當泄漏項被包括在內,並進一步滿足條件Kp > -Ki /(1 - �),其中α是泄漏積分參數使才可以。
下圖8是使用參數值取自推薦範圍的模擬示例,其中比例項為正,積分項為負,表現出穩定性--控制器的作用是減弱外生隨機過程的變化,如ETH價格。在這種情況下,Kp項比Ki項強3個數量級以上,積分項每期泄漏1/1000的值。由此產生的系統在穩態時的表現與純P控制器相當(如下圖所示),但如果出現穩態誤差,則有額外的能力來消除它們。
圖8:贖回價格與ETH價格的比較,使用推薦參數的實現。
圖9:模擬RAI流動資金余額與RAI債務余額的實現情況
逐步推出
在創建和部署新的金融系統時,我們需要進行漸進式的測試和推廣,以確保系統安全,然後再向更多用戶和更多資本开放。
2020年10月,ProtoRAI(PRAI)進行了一個激勵性的主網測試,以低債務上限的方式啓動,用於測試系統行為,並為更大規模的正式RAI系統啓動提供參考。這裏的目的是在全面部署之前,觀察小規模低質押的情況。
RAI網絡於2021年2月17日上线,初始配置只有比例控制器Kp項。該系統表現出預期的行為,與我們在比例控制器情況下預期的結果一致。
截至2021年4月2日,每個RAI分析儀表盤的價格
繼續監測實時數據,並將其與系統模型相結合,將揭示是否值得納入綜合控制項Ki及其泄漏的 "抗飽和 "機制。這將增加系統的復雜性,但也可以確保長期的可持續性,從而在RAI系統的生命周期內促進治理最小化。
治理最小化
試圖通過忽略治理面來實現治理最小化,就好比上了一輛自動駕駛汽車,卻無法指示汽車導航,讓它帶你到哪裏去。
在實踐中,治理最小化首先要有一個定義明確的治理面,然後是關於誰、何時以及如何改變參數的明確程序。成功的治理最小化意味着做出更少、更小、更明確的改變,並減少業務开銷。
參數完全不耦合的情況很少;更多的時候,適當的值是相互關聯的,就像我們看到的Kp、Ki和α(泄露積分參數)。模型在監測系統健康方面發揮着重要的作用,因為它們可以幫助抑制為了治理行動而採取的治理行動,這實際上是將系統置於風險之中,同時反過來幫助確定何時需要採取行動,有足夠的預警來規劃、測試和執行有效的幹預措施。
下一步
鑑於我們已經有了RAI動態和主網發布的全功能模型,我們接下來要擴大現有模型的規模,使其與實時數據相結合,為持續監測提供信息。此後還要作出決定,要從衝擊和事件中學習,以提高我們對周圍復雜的新動態的理解。
結論
在這篇文章中,我們總結了RAI穩定性控制器的參數選擇的工程工作,旨在進一步教育和告知以太坊社區關於計算機輔助設計在復雜系統中的重要性。
通過介紹PID控制器的概念和它在RAI生態系統中的參數化,以及對系統進行電池衝擊和靈敏度測試以了解系統的響應情況,我們更好地了解了RAI如何應對系統控制之外的各種攻擊和外生衝擊。
最終,Reflexer團隊的目標是提供一種低波動性、最小化治理、穩定價格的資產,供以太坊生態系統使用。盡管存在不確定性,但只要有嚴格的控制理論基礎,這些特性就可以變得可靠。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。
崩!比特幣插針66800、以太坊失守2400美元,美總統「大選前避險」美股全倒
比 特幣昨日最高回彈到約 69,500 美元水平後無法持續攀高,在今(5)日零點後開啟新一波下跌,...
Coinbase「鉅額上幣費」公關危機未平,又遭爆 Armstrong 等高管將再賣9億美元股票
美 國上市加密貨幣交易所 Coinbase 執行長 Brian Armstrong,近期趁幣安陷入...
華爾街大鱷 Bernstein:無論誰當選美國總統,比特幣將在2025突破20萬美元
備 受全球關注的美國總統大選開票將在臺灣時間 11 月 6 日陸續啟動,由於共和黨候選人川普和民主...
備戰美國大選》過去十屆選舉後,美股標普500和比特幣歷史表現如何?
備 受全球關注的美國總統大選即將在臺灣時間 11 月 6 日正式開票,但由於共和黨與民主黨可能帶來...
巴比特資訊
文章數量
141粉絲數
0