必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟(jì)5G手機(jī)智能汽車智慧城市會(huì)展特約記者

識(shí)別率超75% AI聽懂你的聲音

2025年10月16日 17:49CCTIME飛象網(wǎng)

清晨的地鐵站,人來人往。林女士又一次下意識(shí)地放慢腳步,低頭假裝看手機(jī),與迎面走來的同事擦肩而過。這個(gè)看似尋常的早晨,對(duì)她而言卻是一場(chǎng)無聲的考驗(yàn)。

“以前上班路上,遠(yuǎn)遠(yuǎn)看到同事走過來,我第一反應(yīng)就是繞道。”林女士回憶道,手指不自覺地摩挲著衣角,“不是不想打招呼,是怕自己發(fā)音不準(zhǔn),對(duì)方聽不懂,也怕對(duì)方那種困惑的眼神!

作為一名聽障人士,林女士從小佩戴助聽器,但在嘈雜環(huán)境中依然“聽不清”。更讓她困擾的是,長(zhǎng)期缺乏語(yǔ)音練習(xí)讓她陷入“不敢說、怕說錯(cuò)”的循環(huán)。她坦言,過去的生活像被困在一座“現(xiàn)代孤島”——就醫(yī)需要家人陪同,社交活動(dòng)能推則推。

就在林女士幾乎要習(xí)慣這種孤獨(dú)時(shí),轉(zhuǎn)機(jī)悄然而至。今年年中,通過當(dāng)?shù)貧埪?lián),她第一次接觸到了中國(guó)移動(dòng)開發(fā)的“中移無障礙”小程序。這個(gè)看似普通的手機(jī)應(yīng)用,帶領(lǐng)她開始了一段全新的語(yǔ)音康復(fù)之旅。

“第一次使用,系統(tǒng)讓我讀幾句話,識(shí)別率只有30%左右!绷峙空f這話時(shí),眼中卻帶著光,“但它不像人那樣會(huì)不耐煩,反而每次都會(huì)鼓勵(lì)我!边@個(gè)小程序通過AI技術(shù)分析她的發(fā)音問題,精準(zhǔn)指出聲母、韻母的偏差,并通過波形圖對(duì)比,讓她第一次“看見”了自己的聲音與標(biāo)準(zhǔn)音的差距。

用戶的發(fā)音評(píng)分情況

隨著使用次數(shù)的增加,系統(tǒng)會(huì)根據(jù)她的語(yǔ)音數(shù)據(jù),逐步訓(xùn)練出“專屬語(yǔ)音識(shí)別模型”,這個(gè)為她量身定制的AI助手,不僅用于日常訓(xùn)練,還能在實(shí)際溝通中,將她不清晰的語(yǔ)音實(shí)時(shí)轉(zhuǎn)寫成文字,讓對(duì)方一目了然。

“以前去醫(yī)院都得家人陪著,現(xiàn)在我自己去也沒問題了!绷峙啃χ故臼謾C(jī)界面:當(dāng)她說“掛號(hào)”,屏幕上準(zhǔn)確識(shí)別并顯示出“掛號(hào)”二字!斑@種感覺,像是終于有了一座橋,連接起了我和外面的世界!

這些改變是如何發(fā)生的?“我們不僅是在做一款產(chǎn)品,更是在做一種陪伴!敝袊(guó)移動(dòng)互聯(lián)網(wǎng)公司產(chǎn)品負(fù)責(zé)人給出了答案。原來,得益于中國(guó)移動(dòng)遍布全國(guó)的智算中心和自研的發(fā)音質(zhì)量評(píng)估算法,系統(tǒng)能夠分析每位用戶的發(fā)音弱點(diǎn),針對(duì)性收集語(yǔ)音數(shù)據(jù)。

用戶參加語(yǔ)音素材收集活動(dòng)

研發(fā)團(tuán)隊(duì)通過深入理解聽障群體發(fā)音的差異性,用AI技術(shù)識(shí)別歸納出20余種常見構(gòu)音障礙類型,進(jìn)行專項(xiàng)問題突破。“僅需傳統(tǒng)方法三分之一的訓(xùn)練樣本量,就能構(gòu)建出個(gè)性化專屬模型!蹦壳,模型平均識(shí)別率從初期不足30%提升至75%以上,部分用戶接近90%。此外,研發(fā)團(tuán)隊(duì)還將個(gè)人專屬模型壓縮至百兆級(jí)別,使其輕松運(yùn)行在普通手機(jī)上,大大降低了使用門檻,讓更多人受益。

記者看到,目前該方案已集成至中國(guó)移動(dòng)“5G新通話”,在通話中就可實(shí)現(xiàn)毫秒級(jí)語(yǔ)音轉(zhuǎn)文字,借助“5G消息”識(shí)別對(duì)話場(chǎng)景智能生成快捷回復(fù);在社交、就醫(yī)等現(xiàn)場(chǎng)溝通場(chǎng)景中,“面對(duì)面助手”提供著精準(zhǔn)的轉(zhuǎn)寫支持。

中國(guó)移動(dòng)互聯(lián)網(wǎng)公司產(chǎn)品負(fù)責(zé)人的感悟尤為深刻:“科技向善的意義,不僅僅是幫助聽障群體,同時(shí)也是激發(fā)我們這些科技創(chuàng)新工作者人性之中向善的一面。雙向奔赴的力量,才能喚醒大模型的力量!

如今,在地鐵站里,林女士不再躲避同事。她開始主動(dòng)微笑、打招呼,甚至參與工作討論!半m然發(fā)音還不完美,但我知道,我在進(jìn)步。”她說這話時(shí),聲音里透著從未有過的從容,“而這份進(jìn)步,背后是科技帶來的底氣!

在這個(gè)每一聲“你好”都值得被聽見的時(shí)代,技術(shù)正悄然成為那座無聲的橋——它不只是一串串代碼和算法,更是貫通聽與說的紐帶,連接你與我的橋梁,讓曾經(jīng)被困在孤島上的心靈,重新融入世界的對(duì)話。

編 輯:孫秀杰
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
推薦閱讀

精彩視頻

精彩專題

關(guān)于我們廣告報(bào)價(jià)聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號(hào)-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)

公司名稱: 北京飛象互動(dòng)文化傳媒有限公司

未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像