OpenAI又祭出王炸 GPT-4o使得AI表達有了感情
北京時間周二(5月14日)凌晨,全球人工智能的執牛耳者OpenAI公司在线上舉辦了“春季更新”活動。
本次活動中,OpenAI發布了新旗艦模型 GPT-4o,可以實時對音頻、視覺和文本進行推理。 據悉,新模型使ChatGPT能夠處理50種不同的語言,同時提高了速度和質量。
在此前,用戶使用語音模式與ChatGPT對話時,平均延遲達到數秒鐘,音頻在輸入時還會由於處理方式丟失大量信息,讓GPT-4無法直接觀察音調、說話的人和背景噪音,也無法輸出笑聲、歌唱聲和表達情感。
而最新的GPT-4o延遲很低,與人類在對話中的反應時間相近,講述故事宛如真人。 與現有模型相比,其在圖像和音頻處理方面很出色,甚至可以從急促的喘氣聲中理解「緊張」的含義,並且指導對方進行深呼吸等等。
可以說,GPT-4o使得AI表達有了“感情”,是邁向更自然人機交互的關鍵一步。 OpenAI首席執行官奧特曼表示,GPT-4o的語音功能讓人想起了電影《她》,“感覺就像是電影中的人工智能,我仍然對其感到驚訝。”
目前,GPT-4o已對所有用戶免費开放,付費訂閱的ChatGPT Plus用戶的消息數量上限是免費用戶的5倍。
OpenAI的首席技術官Mira Murati表示,未來做產品要免費優先,讓更多的人使用。 業內人士稱,技術迭代優化和費用下降將加速大模型走向行業應用。
不過也有觀點認為,OpenAI之所以“祭出”一些免費功能,在於行業的競爭異常激烈。 無論OpenAI做出怎樣的創新,在Meta,谷歌,亞馬遜,xAi等強敵環伺的背景下,都容易被模仿甚至被趕超。 此次發布會,也宣告新一輪技術战和價格战的开始,其他科技巨頭也將在未來一個月內公布AI最新進展。
值得一提的是,目前AI技術的快速發展也引起一些擔憂。 圍繞版權問題的爭議持續困擾着AI企業,許多創作者也擔心,AI大模型的訓練涉及侵權問題。
此外,當地時間5月14日,在瑞士日內瓦舉行中美人工智能(AI)政府間對話首次會議,就AI科技風險、全球治理等問題進行交流。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。