必讀視頻專題飛象趣談光通信人工智能低空經濟5G手機智能汽車智慧城市會展特約記者

蘋果發(fā)布 LiTo 大模型:單圖生成 3D 對象,AI 高度還原多視角光影

2026年3月17日 09:21IT之家作 者:故淵

科技媒體 9to5Mac 昨日(3 月 16 日)發(fā)布博文,報道稱蘋果 AI 研究團隊發(fā)布研究報告,攻克了 3D 重建領域的一項核心難題:僅通過單張平面圖像,就能重建出完整的 3D 對象。

該專利描述名為 LiTo(表面光場標記化)的最新模型,打破了傳統方法需要多角度圖像輸入的限制,在重建 3D 對象之后,用戶切換不同觀察視角后,該模型生成的反光、高光等光影效果依然能保持高度的物理真實與一致性。

這項突破的核心在于對創(chuàng)新應用“潛在空間”(Latent Space)。在機器學習中,潛在空間能將復雜信息壓縮成多維數學向量,從而大幅降低計算成本。

LiTo 模型首創(chuàng)了一種統一的 3D 潛在表示法,將隨機采樣的表面光場數據編碼為緊湊的向量集。這意味著模型無需死記硬背每一個視覺細節(jié),而是通過數學描述,同時掌握了對象的物理形狀以及光線與其表面交互的底層規(guī)律。

在具體運行機制上,LiTo 編碼器負責“壓縮信息”,將輸入圖像中的幾何結構和視角相關的外觀特征,轉化為潛在空間中的精簡代碼。

隨后,解碼器執(zhí)行“逆向解壓”,利用這些底層代碼完整還原出 3D 對象。這種雙向機制讓模型能夠精準復現復雜光照條件下的鏡面高光和菲涅爾反射等高級光影效果。

為打造該模型,蘋果研究人員使用了數千個在 150 個不同視角和 3 種光照條件下渲染的 3D 對象進行高強度訓練。系統通過不斷抽取小部分數據樣本,訓練解碼器在不同光照和視角下還原完整對象。

最終,模型具備了僅憑單張圖片就能預測其三維潛在表示的能力。在蘋果公布的官方對比測試中,LiTo 在多視角光影還原度上顯著超越了現有的 TRELLIS 模型。

編 輯:路金娣
飛象網版權及免責聲明:
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創(chuàng)”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發(fā)之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
推薦閱讀
  • 2026十大科技趨勢

    2026 十大科技趨勢,定義新一年的每一次突破。祝大家馬年大吉,馬到成功!初八啟新程,萬事皆順遂!

    [詳細]

精彩視頻

精彩專題

關于我們廣告報價聯系我們隱私聲明本站地圖

CCTIME飛象網 CopyRight © 2007-2026 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務業(yè)務經營許可證080234號 京公網安備110105000771號

公司名稱: 北京飛象互動文化傳媒有限公司

未經書面許可,禁止轉載、摘編、復制、鏡像