每日微信報
人物專訪監(jiān)管
制造芯片
6G 運營
大數據物聯網
移動互聯網量子
云計算互聯網
報告衛(wèi)星

蘋果發(fā)布 LiTo 大模型：單圖生成 3D 對象，AI 高度還原多視角光影

2026年3月17日 09:21IT之家作者：故淵

科技媒體 9to5Mac 昨日（3 月 16 日）發(fā)布博文，報道稱蘋果 AI 研究團隊發(fā)布研究報告，攻克了 3D 重建領域的一項核心難題：僅通過單張平面圖像，就能重建出完整的 3D 對象。

該專利描述名為 LiTo（表面光場標記化）的最新模型，打破了傳統方法需要多角度圖像輸入的限制，在重建 3D 對象之后，用戶切換不同觀察視角后，該模型生成的反光、高光等光影效果依然能保持高度的物理真實與一致性。

這項突破的核心在于對創(chuàng)新應用“潛在空間”（Latent Space）。在機器學習中，潛在空間能將復雜信息壓縮成多維數學向量，從而大幅降低計算成本。

LiTo 模型首創(chuàng)了一種統一的 3D 潛在表示法，將隨機采樣的表面光場數據編碼為緊湊的向量集。這意味著模型無需死記硬背每一個視覺細節(jié)，而是通過數學描述，同時掌握了對象的物理形狀以及光線與其表面交互的底層規(guī)律。

在具體運行機制上，LiTo 編碼器負責“壓縮信息”，將輸入圖像中的幾何結構和視角相關的外觀特征，轉化為潛在空間中的精簡代碼。

隨后，解碼器執(zhí)行“逆向解壓”，利用這些底層代碼完整還原出 3D 對象。這種雙向機制讓模型能夠精準復現復雜光照條件下的鏡面高光和菲涅爾反射等高級光影效果。

為打造該模型，蘋果研究人員使用了數千個在 150 個不同視角和 3 種光照條件下渲染的 3D 對象進行高強度訓練。系統通過不斷抽取小部分數據樣本，訓練解碼器在不同光照和視角下還原完整對象。

最終，模型具備了僅憑單張圖片就能預測其三維潛在表示的能力。在蘋果公布的官方對比測試中，LiTo 在多視角光影還原度上顯著超越了現有的 TRELLIS 模型。

編輯：路金娣

飛象網版權及免責聲明:
1.本網刊載內容，凡注明來源為“飛象網”和“飛象原創(chuàng)”皆屬飛象網版權所有，未經允許禁止轉載、摘編及鏡像，違者必究。對于經過授權可以轉載，請必須保持轉載文章、圖像、音視頻的完整性，并完整標注作者信息和飛象網來源。
2.凡注明“來源：XXXX”的作品，均轉載自其它媒體，在于傳播更多行業(yè)信息，并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題，請在相關作品刊發(fā)之日起30日內與本網聯系，我們將第一時間予以處理。
本站聯系電話為86-010-87765777，郵件后綴為cctime.com，冒充本站員工以任何其他聯系方式，進行的“內容核實”、“商務聯系”等行為，均不能代表本站。本站擁有對此聲明的最終解釋權。