8 月 21 日消息,谷歌為旗下人工智能助手 Gemini Live 帶來了一系列新功能,旨在提升用戶與之進(jìn)行實(shí)時(shí)對(duì)話的體驗(yàn)。從下周開始,Gemini Live 將具備直接在用戶屏幕上突出顯示內(nèi)容的功能,當(dāng)用戶共享攝像頭畫面時(shí),這一功能將使 AI 助手能夠指出特定物品。

例如,當(dāng)你需要在一堆工具中找到合適的工具來完成一個(gè)項(xiàng)目時(shí),你可以將智能手機(jī)的攝像頭對(duì)準(zhǔn)這些工具,Gemini Live 將在屏幕上高亮顯示正確的工具。這項(xiàng)功能將率先在 8 月 28 日上市的全新 Pixel 10 系列手機(jī)上推出。與此同時(shí),谷歌將開始向其他安卓設(shè)備推出視覺引導(dǎo)功能,并計(jì)劃在未來幾周內(nèi)擴(kuò)展至 iOS 系統(tǒng)。

谷歌還宣布了 Gemini Live 與更多應(yīng)用程序的新整合,使其能夠與包括消息、電話和時(shí)鐘等應(yīng)用進(jìn)行交互。例如,當(dāng)你與 Gemini 就前往目的地的路線進(jìn)行對(duì)話時(shí),如果你意識(shí)到自己要遲到,你可以中斷聊天機(jī)器人,對(duì)它說:“這條路線看起來不錯(cuò),F(xiàn)在,給亞歷克斯發(fā)一條消息,告訴他我大概會(huì)遲到 10 分鐘!彪S后,谷歌將為你草擬一條短信發(fā)送給你的朋友。

此外IT之家注意到,谷歌還為 Gemini Live 推出了一款新的音頻模型,該公司表示,這一模型將“顯著改善”聊天機(jī)器人對(duì)人類語音關(guān)鍵要素(如語調(diào)、節(jié)奏和音高)的運(yùn)用。不久之后,Gemini 將根據(jù)你所討論的話題改變語調(diào),例如在你詢問有關(guān)壓力較大的話題時(shí),它會(huì)使用更平靜的聲音。
你還可以調(diào)整 Gemini 說話的速度,使其更快或更慢。而且,如果你要求 Gemini 從某個(gè)特定角色或歷史人物的視角來生動(dòng)地講述一個(gè)故事,聊天機(jī)器人可能會(huì)采用相應(yīng)的口音,以營(yíng)造出“豐富、引人入勝的敘事”效果。