iOS最強AI「視覺智能」,蘋果AI眼鏡的前哨

2024-11-15 16:11:34

在 iOS 18.2 Beta 2 上,蘋果 Visual Intelligence(視覺智能)正式登場。

作為 Apple Intelligence 的一部分,Visual Intelligence 是 iPhone 16 系列上的「獨佔」功能。主要通過 iPhone 16系列上新增的相機按鈕,利用攝像頭捕捉物理世界的對象,並通過大模型分析有關該物體的「深度和有用信息」。

例如,拍攝餐廳的照片,用戶可以立即獲得其營業時間、評價和菜單等詳細信息;拍攝活動傳單的照片,該工具可以提取並整理重要詳細信息,例如活動的名稱、日期和地點。

Visual Intelligence 配合 iPhone 16 系列的相機按鈕,具有免解鎖、一鍵 AI 的特性,相對之前的 iPhone 或其他設備而言,具有更高效率。

基於 Visual Intelligence ,蘋果也為接下來的 AI、AR 眼鏡做了足夠的技術鋪墊、場景探索與用戶習慣的養成。Ray-Ban Meta 已經證明了 AI 眼鏡技術路徑的可行性,蘋果也於近日啓動了代號為「Atlas」的智能眼鏡項目,一場巨變正在酝釀。

Visual Intelligence ,以攝像頭為核心的「空間GPT」

相對文字形式,圖形圖像屬於典型的空間數據,是人們日常獲取信息最主要的方式。Visual Intelligence 的出現,讓這種信息獲取現在有了更數字化的方式。

海外媒體在 iOS 18.2 Beta 的評測信息顯示,當 Visual Intelligence 界面打开時,只需點擊相機快門按鈕即可拍照。然後,用戶可以點擊屏幕上的按鈕向 ChatGPT 詢問圖片,也可以按搜索按鈕啓動 Google 搜索。用戶可以選擇在沒有帳戶的情況下使用 ChatGP;如果不登錄,請求將保持匿名。

從下方的三張圖中,分別展示了利用 Visual Intelligence 進行「識別物體」,「計算食物卡路裏」,以及「提取重要信息」的場景,不管是利用「物體圖片進行檢索文字信息」,還是利用「圖片上的文字檢索更深度的圖片、文字信息」,Visual Intelligence 都能很好地給出答案。

不同的是,一些是顯而易見的基礎信息,一些是需要網絡數據的挖掘匹配,還有一些是需要持續對話進行挖掘。當然,這些取決於前置的 Prompt,如果有更完善的 AI 工作流設定,相信它會基於每種不同的物體,甚至不同的用戶,給出千人千面的答案。如:當識別圖片物體為「食物」時,自動去分析它的「卡路裏」以及相關營養信息,而不僅僅是告訴我,它是什么,將會進一步提升效率。

圖源:CNET

圖源:Future

圖源:Apple

雖然 Visual Intelligence 與 Google Lens,或者百度的 AI 識圖十分相似,但 Visual Intelligence 的與衆不同之處在於它直接在 iPhone 上處理所有內容,而不是將數據發送到雲端。

蘋果軟件工程高級副總裁 Craig Federighi 指出,Visual Intelligence 使用設備內處理技術結合蘋果自己的服務。這意味着用戶的照片將保持私密,不會上傳到外部服務器。

iOS 18.2 預計將於 12 月份第一周面向美國地區正式推送。Visual Intelligence 是一個非常高效率的工具,將帶來更好的 AI 交互提升與應用變革。

對於 AI 圖像圖形識別來說,目前智能手機無疑是最方便的電子產品,不過從交互維度來說,帶攝像頭的 AI/AR 眼鏡或是更好的載體,至少讓用戶可以空出雙手,不用一直握持 iPhone。

圖源:tomsguide

蘋果入局AI眼鏡,項目代號「Atlas」

據外媒消息,有知情人士透露,蘋果於近日开啓了一項全新的內部研究,該研究重點聚焦於智能眼鏡的开發。

據稱,這個新項目的代號為 Atlas。蘋果收集了員工對於智能眼鏡的看法,負責該計劃的團隊也向部分選定的員工發送了電子郵件,以此確認了在這一領域的產品研究情況。

當蘋果計劃推出新的品類產品時,通常會組建祕密小組。公司傾向於收集員工而非客戶的反饋,目的在於保持計劃的保密性。這些情況充分表明,蘋果有意大力推進开發自己的智能眼鏡的想法。

值得注意的是,報道稱這項研究由蘋果硬件工程部門的產品系統質量團隊領導,其中並未提及蘋果的 Vision 部門,這意味着蘋果這款智能眼鏡是不帶光機的 AI 音頻眼鏡,與 Ray-Ban Meta 類似。結合早前蘋果決定推遲 AR 眼鏡的研發信息來看,具有較高可信度。

相對於 AR 智能眼鏡而言,AI 音頻眼鏡不僅技術門檻相對更低,且供應鏈也十分成熟,體積重量上也普遍能做到 50g 以內的輕薄佩戴體驗。不少業內人士認為 AI 音頻眼鏡是未來全彩 AR 眼鏡重要的過渡產品,在目前消費市場中具備較高的市場競爭力。

作為iPhone的配件,「Atlas」具備強大市場潛力

蘋果擁有一整套最強的生態聯動,正如 AirPods 與 iPhone 連接的高效率表現。蘋果如果將 AI 眼鏡定義為 iPhone 的「配件」,內置攝像頭與麥克風,利用 iPhone 的 AI 算力,連接 Visual Intelligence 與加強版 Siri,充分利用自身的硬件生態,那將會是一個更加驚豔的硬件。

在所有可穿戴設備中,AI 眼鏡擁有諸多先天產品設計上的優勢,可配備第一人稱視角的攝像頭,所見即所得;近嘴的麥克風,更好地拾音效果;近耳的揚聲器,更好地人機交互。可以說,目前蘋果在 iOS 上所儲備的 Visual Intelligence 與加強版 Siri 等 AI 技術都能在 AI 眼鏡上得到更好的實現。

一直以來,蘋果的消費級硬件都以「技術創新」和「場景創新」聞名,在 AI 眼鏡上,我們也可以期待一下,蘋果是否能做出一款真正超越 Ray-Ban Meta 的 AI 眼鏡產品,滿足一些額外的消費需求。

當然,與 Ray-Ban Meta 等第三方設備相比,從使用效率、連接體驗上來看,手機廠商自身的硬件生態組合本身就會有一些明顯優勢,即使前者具備先發優勢。

眼鏡品類在目前的消費市場的確是一個大衆產品,但也並非完完全全是一個生活「必需品」。對於無需近視矯正、戶外遮陽的用戶來說,佩戴眼鏡事實上是一件非常困難的事。就個人而言,在沒有養成眼鏡佩戴習慣之前,即使 20-30g 的眼鏡長時間佩戴也是一件非常困難的事,除非它真的能給我帶來價值增量,就像 AirPods 和 Apple Watch 那樣。

在古希臘神話中,Atlas(阿特拉斯)是擎天巨神,屬於泰坦神族,他被宙斯降罪用雙肩支撐蒼天。從命名上來看,蘋果對於這款硬件寄予厚望。然而,蘋果的 AI 眼鏡系列,能否真正支撐其蘋果智能穿戴、甚至計算平臺的下一個十年呢?

答案留給時間。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

推薦文章

觀點》Memecoin 是史上最瘋狂的賺錢機器嗎?

我 們要去邁阿密!我們要買藍寶堅尼!來自倫敦的 16 歲大學生 Oliver Szmul 聲音嘶啞...

Foresight News
3 2小時前

鮑爾放鷹「不急降息」比特幣下殺 $86,600、美股全倒,10月PPI顯示通膨仍具黏性

美 國聯準會主席鮑爾在臺灣時間今(15)日清晨於達拉斯的一場活動上釋出鷹派言論,他表示近期美國經濟...

Editor Jr.
4 2小時前

Upbit 加密貨幣交易量遠超韓國股市,市場過熱跡象再現?

自 川普在本月初強勢贏下美國總統大選後,美股和加密貨幣市場紛紛迎來慶祝行情,標普 500 指數一度...

Editor Jr.
4 2小時前

iOS最強AI「視覺智能」,蘋果AI眼鏡的前哨

在 iOS 18.2 Beta 2 上,蘋果 Visual Intelligence(視覺智能)正...

VR陀螺
4 2小時前

Gary Gensler發表“離別演講”,特朗普2.0下的SEC將採取什么加密監管政策?

來源:WilmerHale 原標題:Trump Administration 2.0: How t...

比推BitpushNews
4 2小時前

吳說播客:ACT 喜與悲,有人意外爆賺 200 萬,有人爆發前一天割肉

編輯:吳說區塊鏈 本期播客從 AI Memecoin 投資熱點及近日 ACT 暴漲事件展开,def...

吳說Real
3 2小時前