iOS最強AI「視覺智能」,蘋果AI眼鏡的前哨

2024-11-15 16:11:34

在 iOS 18.2 Beta 2 上,蘋果 Visual Intelligence(視覺智能)正式登場。

作為 Apple Intelligence 的一部分,Visual Intelligence 是 iPhone 16 系列上的「獨佔」功能。主要通過 iPhone 16系列上新增的相機按鈕,利用攝像頭捕捉物理世界的對象,並通過大模型分析有關該物體的「深度和有用信息」。

例如,拍攝餐廳的照片,用戶可以立即獲得其營業時間、評價和菜單等詳細信息;拍攝活動傳單的照片,該工具可以提取並整理重要詳細信息,例如活動的名稱、日期和地點。

Visual Intelligence 配合 iPhone 16 系列的相機按鈕,具有免解鎖、一鍵 AI 的特性,相對之前的 iPhone 或其他設備而言,具有更高效率。

基於 Visual Intelligence ,蘋果也為接下來的 AI、AR 眼鏡做了足夠的技術鋪墊、場景探索與用戶習慣的養成。Ray-Ban Meta 已經證明了 AI 眼鏡技術路徑的可行性,蘋果也於近日啓動了代號為「Atlas」的智能眼鏡項目,一場巨變正在酝釀。

Visual Intelligence ,以攝像頭為核心的「空間GPT」

相對文字形式,圖形圖像屬於典型的空間數據,是人們日常獲取信息最主要的方式。Visual Intelligence 的出現,讓這種信息獲取現在有了更數字化的方式。

海外媒體在 iOS 18.2 Beta 的評測信息顯示,當 Visual Intelligence 界面打开時,只需點擊相機快門按鈕即可拍照。然後,用戶可以點擊屏幕上的按鈕向 ChatGPT 詢問圖片,也可以按搜索按鈕啓動 Google 搜索。用戶可以選擇在沒有帳戶的情況下使用 ChatGP;如果不登錄,請求將保持匿名。

從下方的三張圖中,分別展示了利用 Visual Intelligence 進行「識別物體」,「計算食物卡路裏」,以及「提取重要信息」的場景,不管是利用「物體圖片進行檢索文字信息」,還是利用「圖片上的文字檢索更深度的圖片、文字信息」,Visual Intelligence 都能很好地給出答案。

不同的是,一些是顯而易見的基礎信息,一些是需要網絡數據的挖掘匹配,還有一些是需要持續對話進行挖掘。當然,這些取決於前置的 Prompt,如果有更完善的 AI 工作流設定,相信它會基於每種不同的物體,甚至不同的用戶,給出千人千面的答案。如:當識別圖片物體為「食物」時,自動去分析它的「卡路裏」以及相關營養信息,而不僅僅是告訴我,它是什么,將會進一步提升效率。

圖源:CNET

圖源:Future

圖源:Apple

雖然 Visual Intelligence 與 Google Lens,或者百度的 AI 識圖十分相似,但 Visual Intelligence 的與衆不同之處在於它直接在 iPhone 上處理所有內容,而不是將數據發送到雲端。

蘋果軟件工程高級副總裁 Craig Federighi 指出,Visual Intelligence 使用設備內處理技術結合蘋果自己的服務。這意味着用戶的照片將保持私密,不會上傳到外部服務器。

iOS 18.2 預計將於 12 月份第一周面向美國地區正式推送。Visual Intelligence 是一個非常高效率的工具,將帶來更好的 AI 交互提升與應用變革。

對於 AI 圖像圖形識別來說,目前智能手機無疑是最方便的電子產品,不過從交互維度來說,帶攝像頭的 AI/AR 眼鏡或是更好的載體,至少讓用戶可以空出雙手,不用一直握持 iPhone。

圖源:tomsguide

蘋果入局AI眼鏡,項目代號「Atlas」

據外媒消息,有知情人士透露,蘋果於近日开啓了一項全新的內部研究,該研究重點聚焦於智能眼鏡的开發。

據稱,這個新項目的代號為 Atlas。蘋果收集了員工對於智能眼鏡的看法,負責該計劃的團隊也向部分選定的員工發送了電子郵件,以此確認了在這一領域的產品研究情況。

當蘋果計劃推出新的品類產品時,通常會組建祕密小組。公司傾向於收集員工而非客戶的反饋,目的在於保持計劃的保密性。這些情況充分表明,蘋果有意大力推進开發自己的智能眼鏡的想法。

值得注意的是,報道稱這項研究由蘋果硬件工程部門的產品系統質量團隊領導,其中並未提及蘋果的 Vision 部門,這意味着蘋果這款智能眼鏡是不帶光機的 AI 音頻眼鏡,與 Ray-Ban Meta 類似。結合早前蘋果決定推遲 AR 眼鏡的研發信息來看,具有較高可信度。

相對於 AR 智能眼鏡而言,AI 音頻眼鏡不僅技術門檻相對更低,且供應鏈也十分成熟,體積重量上也普遍能做到 50g 以內的輕薄佩戴體驗。不少業內人士認為 AI 音頻眼鏡是未來全彩 AR 眼鏡重要的過渡產品,在目前消費市場中具備較高的市場競爭力。

作為iPhone的配件,「Atlas」具備強大市場潛力

蘋果擁有一整套最強的生態聯動,正如 AirPods 與 iPhone 連接的高效率表現。蘋果如果將 AI 眼鏡定義為 iPhone 的「配件」,內置攝像頭與麥克風,利用 iPhone 的 AI 算力,連接 Visual Intelligence 與加強版 Siri,充分利用自身的硬件生態,那將會是一個更加驚豔的硬件。

在所有可穿戴設備中,AI 眼鏡擁有諸多先天產品設計上的優勢,可配備第一人稱視角的攝像頭,所見即所得;近嘴的麥克風,更好地拾音效果;近耳的揚聲器,更好地人機交互。可以說,目前蘋果在 iOS 上所儲備的 Visual Intelligence 與加強版 Siri 等 AI 技術都能在 AI 眼鏡上得到更好的實現。

一直以來,蘋果的消費級硬件都以「技術創新」和「場景創新」聞名,在 AI 眼鏡上,我們也可以期待一下,蘋果是否能做出一款真正超越 Ray-Ban Meta 的 AI 眼鏡產品,滿足一些額外的消費需求。

當然,與 Ray-Ban Meta 等第三方設備相比,從使用效率、連接體驗上來看,手機廠商自身的硬件生態組合本身就會有一些明顯優勢,即使前者具備先發優勢。

眼鏡品類在目前的消費市場的確是一個大衆產品,但也並非完完全全是一個生活「必需品」。對於無需近視矯正、戶外遮陽的用戶來說,佩戴眼鏡事實上是一件非常困難的事。就個人而言,在沒有養成眼鏡佩戴習慣之前,即使 20-30g 的眼鏡長時間佩戴也是一件非常困難的事,除非它真的能給我帶來價值增量,就像 AirPods 和 Apple Watch 那樣。

在古希臘神話中,Atlas(阿特拉斯)是擎天巨神,屬於泰坦神族,他被宙斯降罪用雙肩支撐蒼天。從命名上來看,蘋果對於這款硬件寄予厚望。然而,蘋果的 AI 眼鏡系列,能否真正支撐其蘋果智能穿戴、甚至計算平臺的下一個十年呢?

答案留給時間。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

評論

推薦文章

新用戶去哪了?「沒人玩」比熊市更可怕,加密專案下一步怎麼走?

加 密行銷工作令人眼花撩亂:從選擇合適的管道,到訊息傳遞,再到團隊協調。你是否應該投資舉辦一場活動...

深潮 Techflow
2 1小時前

LIBRA幕後推手又割韭菜!發新幣$WOLF「市值衝上4200萬鎂」後秒歸零

作 為 LIBRA、MELANIA 等代幣發行幕後推手的 Kelsier Ventures 執行長...

James
1 1小時前

TimeFUN興起,深度解析名人時間代幣

作者:defioasis 編輯:Colin Wu 近期,Binance 創始人 CZ 發表了基於時...

1 1小時前

空投周報 | Babylon空投注冊截止時間延長至3月19日;Bedrock开放空投查詢(3.10-3.16)

@OdailyChina @web3_golem Odaily星球日報盤點了 2025 年 3 月...

星球日報
1 1小時前

周報 | MGX 對幣安投資 20 億美元,並收購幣安的少數股權;美 SEC 推遲批准 DOGE、XRP、LTC、Solana 與 ADA 現貨 ETF

1、 TON 基金會確認 Telegram 創始人已重獲自由,支持捍衛在线言論自由和隱私權 TON...

1 1小時前

牛市結束了?10x Research:比特幣恐再盤整8個月,市場缺抄底買盤

比 特幣在 11 日跌破 7.7 萬美元後反彈,近幾日持續在 8 萬美元上方震盪,儘管在 14 日...

James
8 9小時前