首頁(yè) >> 移動(dòng)互聯(lián)網(wǎng) >> 正文

傳音多媒體團(tuán)隊(duì)攬獲CVPR NTIRE 2025兩項(xiàng)挑戰(zhàn)賽冠亞軍，推動(dòng)視頻畫(huà)質(zhì)升級(jí)

2025年6月24日 15:20 CCTIME飛象網(wǎng)

近日,在計(jì)算機(jī)視覺(jué)領(lǐng)域最具影響力的國(guó)際競(jìng)賽 CVPR NTIRE 2025中,傳音多媒體團(tuán)隊(duì)與上海交通大學(xué)圖像所MediaLab聯(lián)合團(tuán)隊(duì)分別斬獲高效超分辨率挑戰(zhàn)賽(NTIRE 2025 Efficient Super-Resolution Challenge)第一名,短視頻UGC圖像超分辨率挑戰(zhàn)賽(NTIRE 2025 Short-form UGC Image Super-Resolution Challenge)第二名,展現(xiàn)了傳音在視頻畫(huà)質(zhì)領(lǐng)域的深厚積累與領(lǐng)先實(shí)力。

CVPR NTIRE(New Trends in Image Restoration and Enhancement)是計(jì)算機(jī)視覺(jué)頂會(huì)CVPR(Conference on Computer Vision and Pattern Recognition)旗下極具影響力的國(guó)際學(xué)術(shù)競(jìng)賽,素有“影像算法奧林匹克”之稱。該賽事聚焦視頻復(fù)原、圖像增強(qiáng)、生成技術(shù)及質(zhì)量評(píng)估等底層視覺(jué)任務(wù),旨在推動(dòng)技術(shù)突破并解決實(shí)際應(yīng)用難題。今年的賽事設(shè)置了多項(xiàng)挑戰(zhàn)賽,吸引了全球頂尖科研與產(chǎn)業(yè)隊(duì)伍參與。

傳音深耕非洲、南亞等新興市場(chǎng)多年,始終圍繞用戶需求進(jìn)行本地化創(chuàng)新。近年來(lái)數(shù)字媒體飛速發(fā)展,傳音洞察到用戶對(duì)智能手機(jī)圖像和視頻素質(zhì)提出了更高的要求。據(jù)Dataspark的數(shù)據(jù)顯示,2024年非洲用戶月均在社交、視頻類App上花費(fèi)約52小時(shí),然而非洲用戶觀看視頻在線播放網(wǎng)速平均不到10M/S,觀看體驗(yàn)較差。面對(duì)非洲等目標(biāo)市場(chǎng)存在的網(wǎng)速慢、流量貴等現(xiàn)實(shí)問(wèn)題,傳音持續(xù)投入資源,與上海交通大學(xué)圖像所MediaLab深入合作,研發(fā)輕量化、低功耗、高性能的畫(huà)質(zhì)增強(qiáng)技術(shù),讓更多用戶在有限條件下也能享受高清視覺(jué)體驗(yàn)。

技術(shù)成果一:高效圖像超分辨率中的蒸餾監(jiān)督下的卷積低秩適應(yīng)

在高效超分辨率挑戰(zhàn)賽中,傳音多媒體團(tuán)隊(duì)和上海交通大學(xué)圖像所MediaLab提交的論文“高效圖像超分辨率中的蒸餾監(jiān)督下的卷積低秩適應(yīng)(Distillation-Supervised Convolutional Low-Rank Adaptation for Efficient Image Super-Resolution)”提出DSCLoRA技術(shù),其借鑒大語(yǔ)言模型中的低秩適應(yīng)并結(jié)合知識(shí)蒸餾策略,在不增加計(jì)算成本的前提下顯著提升了高效超分辨率模型的性能。

多個(gè)基準(zhǔn)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明DSCLoRA在模型復(fù)雜度和性能表現(xiàn)之間實(shí)現(xiàn)了出色的均衡。在不增加模型體積和計(jì)算開(kāi)銷的前提下,DSCLoRA能夠大幅提升圖像超分辨率效果,提升弱網(wǎng)環(huán)境下視頻通話與流媒體播放清晰度,同時(shí)具備推理速度快、功耗低等優(yōu)點(diǎn)。通過(guò)將該算法集成至手機(jī)影像引擎,用戶在在線視頻播放、視頻通話、圖像放大、數(shù)碼變焦拍攝等場(chǎng)景中,均可體驗(yàn)更高分辨率、更銳利自然的畫(huà)面。

模型架構(gòu)總覽

技術(shù)成果二:用于短視頻UGC圖像超分辨率的增強(qiáng)語(yǔ)義提取與引導(dǎo)

在短視頻UGC圖像超分辨率挑戰(zhàn)賽中,傳音多媒體團(tuán)隊(duì)和上海交通大學(xué)圖像所MediaLab提交的論文“用于UGC圖像超分辨率的增強(qiáng)語(yǔ)義提取與引導(dǎo)(Enhanced Semantic Extraction and Guidance for UGC Image Super Resolution)”,提出一種基于 Diffusion 的新型模型以處理短視頻平臺(tái) UGC 場(chǎng)景下低分辨率退化圖片,有助于實(shí)現(xiàn)更穩(wěn)健、感知可信和實(shí)際適用的圖像修復(fù)。

該模型通過(guò)制作特定數(shù)據(jù)集,消除現(xiàn)實(shí) UGC 場(chǎng)景下圖片退化類型和合成退化之間存在的差異。其次,通過(guò)引入語(yǔ)義提取模塊,利用 SAM2 預(yù)訓(xùn)練模型提取高層次的上下文信息,協(xié)助模型進(jìn)行圖像重建任務(wù)。最后,針對(duì)不同的數(shù)據(jù)集進(jìn)行參數(shù)微調(diào),使模型在不同數(shù)據(jù)集上表現(xiàn)達(dá)到最優(yōu)。

該項(xiàng)技術(shù)突破,將有效處理模糊、壓縮、結(jié)構(gòu)變形等常見(jiàn)失真問(wèn)題,生成更自然、真實(shí)、語(yǔ)義一致的修復(fù)圖像,極大提升用戶在短視頻截圖、社交圖片增強(qiáng)等場(chǎng)景中的視覺(jué)體驗(yàn)。

模型架構(gòu)總覽

此次聯(lián)合高校團(tuán)隊(duì)參加國(guó)際頂級(jí)競(jìng)賽體現(xiàn)傳音對(duì)核心技術(shù)創(chuàng)新的重視與投入,也為后續(xù)畫(huà)質(zhì)增強(qiáng)功能的產(chǎn)品化奠定堅(jiān)實(shí)基礎(chǔ)。未來(lái),傳音將加速將畫(huà)質(zhì)增強(qiáng)技術(shù)部署到旗下手機(jī)產(chǎn)品中,構(gòu)建起一套適應(yīng)新興市場(chǎng)特色、兼顧性能與體驗(yàn)的視頻增強(qiáng)解決方案,為更多新興市場(chǎng)用戶帶來(lái)更為高清、流暢的視覺(jué)體驗(yàn)。

編輯：T01

飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容，凡注明來(lái)源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有，未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像，違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載，請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性，并完整標(biāo)注作者信息和飛象網(wǎng)來(lái)源。
2.凡注明“來(lái)源：XXXX”的作品，均轉(zhuǎn)載自其它媒體，在于傳播更多行業(yè)信息，并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系，我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777，郵件后綴為cctime.com，冒充本站員工以任何其他聯(lián)系方式，進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為，均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。

推薦新聞

·微軟推出 Win11 設(shè)備端小型語(yǔ)言模型 Mu，助力系統(tǒng)設(shè)置..	·消息稱臺(tái)積電為蘋(píng)果建 2 納米專用產(chǎn)線：iPhone 18 Pro ..
·中國(guó)eSIM進(jìn)入快車道，紫光同芯讓“智慧時(shí)刻在線”	·中國(guó)與中亞開(kāi)展人工智能合作前景廣闊
·工信部等六部門(mén)開(kāi)展2025年度智能工廠梯度培育行動(dòng)	·6G標(biāo)準(zhǔn)化啟航，智能超表面技術(shù)需產(chǎn)業(yè)協(xié)同破局
·阿里云推出自動(dòng)駕駛模型訓(xùn)練推理加速框架，訓(xùn)練時(shí)間可..	·對(duì)標(biāo)Cursor！百度文心快碼AI IDE上線，宣布首創(chuàng)設(shè)計(jì)稿..
·英國(guó)擬建立國(guó)家數(shù)據(jù)圖書(shū)館對(duì)AI治理的啟示	·中國(guó)電信AI+網(wǎng)絡(luò)能力發(fā)布大會(huì)召開(kāi) 全球首個(gè)網(wǎng)絡(luò)大模型..
·2025 WBBA云網(wǎng)寬帶發(fā)展大會(huì) \| 更智能的基礎(chǔ)設(shè)施：AI與..	·工信部2025年度國(guó)家科學(xué)技術(shù)獎(jiǎng)提名公示：頻譜、全光網(wǎng)..
·爆發(fā)前夜的智能體，落在中國(guó)算力的舒適區(qū)	·向“智”！中國(guó)機(jī)器人“跑”起來(lái)

人物

韋樂(lè)平：大模型時(shí)代將開(kāi)啟新一波“光進(jìn)銅退”

·中國(guó)移動(dòng)副總經(jīng)理程建軍：為AI fo..

·中國(guó)信通院工業(yè)互聯(lián)網(wǎng)與物聯(lián)網(wǎng)研..

·卡奧斯馮興智：AI賦能工業(yè)互聯(lián)網(wǎng)..

·徐工漢云張啟亮：聚焦AI+工業(yè)互聯(lián)..

·中國(guó)信通院余曉暉：工業(yè)互聯(lián)網(wǎng)十..

·2025工業(yè)互聯(lián)網(wǎng)大會(huì)專家訪|華為郭..

精彩視頻

2025MWC上海丨中興通訊副總裁熊杰就AI萬(wàn)兆全光園區(qū)話題進(jìn)行交流

2025MWC上海｜中國(guó)信科：全棧算力創(chuàng)新應(yīng)用為AI時(shí)代構(gòu)筑數(shù)智基石

2025MWC上海丨智能加速度中興通訊展臺(tái)直擊

2025MWC上海｜京信通信：AI賦能5G-A 重構(gòu)連接的價(jià)值

精彩專題

2025 MWC 上海

2025工業(yè)互聯(lián)網(wǎng)大會(huì)

2025世界電信和信息社會(huì)日大會(huì)

第八屆數(shù)字中國(guó)建設(shè)峰會(huì)

關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱：北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書(shū)面許可，禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像

感谢您访问我们的网站，您可能还对以下资源感兴趣：

亚洲成AV人片在线观看天堂无

国产高清在线?视频大全欧洲熟妇精品色在线视频视频一区二区三卡在线观看免费国产精品自在欧美一区

傳音多媒體團(tuán)隊(duì)攬獲CVPR NTIRE 2025兩項(xiàng)挑戰(zhàn)賽冠亞軍，推動(dòng)視頻畫(huà)質(zhì)升級(jí)

傳音多媒體團(tuán)隊(duì)攬獲CVPR NTIRE 2025兩項(xiàng)挑戰(zhàn)賽冠亞軍，推動(dòng)視頻畫(huà)質(zhì)升級(jí)