導(dǎo)讀:微軟正式宣布跟小鵬汽車(chē)合作,進(jìn)一步提升智能汽車(chē)語(yǔ)音助手的技術(shù)水準(zhǔn),這個(gè)消息可是非常讓人激動(dòng)的,之后我們的汽車(chē)語(yǔ)音助手或許可以跟手機(jī)助手一樣好用,有了微軟的合作,或許可以讓語(yǔ)音助手技術(shù)在流暢度、質(zhì)量、保真度和自然度上都得到了極大提升。
2022年1月7日,微軟正式宣布,在基于微軟智能云Azure的深度神經(jīng)網(wǎng)絡(luò)TTS(Text-to-Speech)支持下,中國(guó)領(lǐng)先的智能電動(dòng)汽車(chē)公司小鵬汽車(chē)已經(jīng)順利完成其車(chē)規(guī)級(jí)語(yǔ)音助手的升級(jí),進(jìn)一步提升智能汽車(chē)語(yǔ)音助手的技術(shù)水準(zhǔn)。
目前,購(gòu)買(mǎi)小鵬汽車(chē)P7車(chē)型的中國(guó)用戶,可以通過(guò)OTA(Over-The-Air)升級(jí)這款可媲美人聲的全新智能語(yǔ)音助手“小P”,小鵬汽車(chē)也計(jì)劃通過(guò)OTA將這一技術(shù)升級(jí)引入其他幾款車(chē)型當(dāng)中。
得益于過(guò)去幾年微軟在語(yǔ)音、自然語(yǔ)言和機(jī)器翻譯領(lǐng)域的研究成果,語(yǔ)音助手技術(shù)在流暢度、質(zhì)量、保真度和自然度上都得到了極大提升。
在經(jīng)過(guò)與微軟Azure人工智能技術(shù)和其他產(chǎn)品的整合之后,這些技術(shù)創(chuàng)新成功助力了像小鵬汽車(chē)這樣的企業(yè),為其消費(fèi)者帶來(lái)更為豐富和更具吸引力的用戶體驗(yàn)。
在為期數(shù)月的合作中,微軟與小鵬汽車(chē)攜手攻克了語(yǔ)音合成技術(shù)應(yīng)用面臨的三個(gè)技術(shù)挑戰(zhàn):
首先,為了解決汽車(chē)場(chǎng)景下的網(wǎng)絡(luò)抖動(dòng)問(wèn)題,高質(zhì)量保障語(yǔ)音功能的持續(xù)運(yùn)行,小鵬汽車(chē)搭建了多級(jí)緩存架構(gòu),可以提前預(yù)置和緩存高質(zhì)量語(yǔ)音文件,最大程度上降低了該功能對(duì)網(wǎng)絡(luò)的依賴(lài);
其次,為了在不占用過(guò)多資源的前提下,依然能提供媲美人類(lèi)的真實(shí)聲音體驗(yàn),小鵬汽車(chē)借助了微軟智能云Azure的緩存和壓縮功能,可以將語(yǔ)音文件壓縮到24KHz的采樣率和16位的量化水平,大大減少了數(shù)據(jù)網(wǎng)絡(luò)和整車(chē)算力的資源壓力;
最后,雙方還在減少合成語(yǔ)音歧義和多音字優(yōu)化準(zhǔn)確性方面做出了諸多改進(jìn)。
兩邊都是希望在智能汽車(chē)語(yǔ)音助手做的更好,這樣對(duì)于駕駛員來(lái)說(shuō)也會(huì)更加的方便,全新的車(chē)載語(yǔ)音能在語(yǔ)音保真度、功能性和場(chǎng)景優(yōu)化上都達(dá)到了新的水平,這真的是一大進(jìn)步了,小鵬汽車(chē)這邊是希望之后可以在更多的使用場(chǎng)景中部署語(yǔ)音助手,讓其成為直觀駕駛體驗(yàn)中不可或缺的一部分。想法是非常好的,我想大家也是比較支持這種想法的,畢竟可以讓我們的智能汽車(chē)助手更加高級(jí),這誰(shuí)能不愛(ài)呢。
小鵬汽車(chē)AI產(chǎn)品高級(jí)專(zhuān)家郝超表示:“從確定合作意向到產(chǎn)品上線,我們與微軟耗時(shí)數(shù)月,攜手完成了一次對(duì)汽車(chē)語(yǔ)音交互技術(shù)的前沿探索,將車(chē)載語(yǔ)音的自然語(yǔ)音水平提升到了一個(gè)全新的水準(zhǔn)。隨著對(duì)城市出行的理解愈發(fā)深入,和更多使用場(chǎng)景的發(fā)掘,這些技術(shù)成果將獲得更為廣泛的應(yīng)用,實(shí)現(xiàn)高水平的人機(jī)共駕體驗(yàn)。”
微軟汽車(chē)、出行和運(yùn)輸行業(yè)總經(jīng)理Sanjay Ravi表示:“隨著研究和技術(shù)的進(jìn)步,Azure認(rèn)知服務(wù)(如視覺(jué)和語(yǔ)音)將在定義獨(dú)特的車(chē)載體驗(yàn)方面發(fā)揮關(guān)鍵作用。智能語(yǔ)音正在成為主要的車(chē)載交互工具,而微軟預(yù)置的深度神經(jīng)語(yǔ)音和個(gè)性化深度神經(jīng)語(yǔ)音定制服務(wù),將助力汽車(chē)制造商強(qiáng)化自身品牌,打造更接近自然人聲的、差異化且真實(shí)的用戶體驗(yàn)。”
除了小鵬汽車(chē)外,微軟還與多家汽車(chē)制造商及合作伙伴在智能汽車(chē)領(lǐng)域展開(kāi)深入合作,專(zhuān)注于助推汽車(chē)行業(yè)的智能應(yīng)用提升。
不同廠商的智能需求不同,從人機(jī)交互到駕駛信息分析、判斷、決斷等角度出發(fā),不同品牌、車(chē)輛需要載入不同需求的智能應(yīng)用。
微軟基于強(qiáng)大的語(yǔ)音語(yǔ)義及數(shù)據(jù)架構(gòu)的底層平臺(tái),通過(guò)強(qiáng)大的技術(shù)能力和底層平臺(tái)賦能眾多智能汽車(chē)廠商,開(kāi)發(fā)形態(tài)多樣的信息數(shù)據(jù)的中控顯示語(yǔ)音系統(tǒng)、配合多維的硬件結(jié)構(gòu),讓用戶體驗(yàn)更智能的駕駛座艙交互感受。