日前,百度宣布百度Create大會(暨百度AI開發(fā)者大會)將于1月10日舉辦。據(jù)悉,百度已連續(xù)第五年舉辦Create大會,今年的Create大會將依舊在百度希壤元宇宙中呈現(xiàn),分享百度在人工智能、自動駕駛、智能交通、智能搜索、量子計算、人工智能科學(xué)計算等領(lǐng)域的最新進展與思考。
在Create大會正式召開之前,百度展示了如何用“手機全雙工語音交互”改善使用導(dǎo)航應(yīng)用的體驗,還詳細介紹了如何用“上帝視角”提升汽車的自動駕駛能力,以及百度自研的深度學(xué)習(xí)平臺飛槳在科研領(lǐng)域的運用。
業(yè)內(nèi)首發(fā)全雙工語音交互技術(shù)
以實際使用場景為例,當用戶駕駛車輛時使用地圖導(dǎo)航,一般會借助時播放的導(dǎo)航語音認路。當環(huán)境音比較嘈雜,而用戶需要修改路線的時候,語音可能會識別不請。它的原理也不難理解,如果手機App在說話的時候,又在聽,它可能會識別自己說的話,非常容易造成誤判。
百度語音首席架構(gòu)師賈磊解釋說,很長一段時間,都沒有一個方案能普適的支持在手機上實現(xiàn)全雙工的語音交互——在手機播放導(dǎo)航提示的同時,也能夠聽清我們的指令,甚至像真人對話一樣可以被我們隨時打斷,并對新的語音指令給予反饋。
理論上講,想要實現(xiàn)全雙工語音交互,必須先做回聲消除,避免手機終端識別自己播放的聲音。賈磊說,在前裝軟件的音箱、車載系統(tǒng)上比較容易實現(xiàn),可以通過硬件適配算法,提前保證回聲消除的效果。
而手機App屬于純軟件后裝方案,需要讓軟件算法適配不同型號的終端硬件。通常,手機上喇叭距離麥克風的距離比較近,同時手機終端款式多,硬件參差不齊。這些因素疊加在一起,會導(dǎo)致聲音信號的回聲消除會出現(xiàn)各種各樣的問題。再加上手機硬件的迭代更新非常快速,回聲消除效果就更加難以保證了。
百度的技術(shù)團隊融合傳統(tǒng)信號處理和深度學(xué)習(xí)模型各自的優(yōu)點,基于語音識別目標,端到端地進行回聲消除和信號增強,解決了手機場景下的回聲消除問題,即使手機音量開到最大,回聲消除量也能達到40分貝,使得手機APP的語音識別功能能夠正常工作。
據(jù)介紹,這是第一個能在手機上實現(xiàn)純軟件方案回聲消除的技術(shù)。這個技術(shù)的實現(xiàn)讓讓人機交互更智能順暢,更逼近人與人直接交互的體驗。目前,百度已經(jīng)計劃將全雙工語音交互運用到更多場景中,比如智能汽車。
車路一體的UniBEV解決方案
在近日的溝通會上,百度還展示了自動駕駛車路一體解決方案UniBEV。
據(jù)了解,近幾年來,有的車企推出了BEV(Bird's Eye View,視覺為中心的俯視圖)自動駕駛感知方案。據(jù)介紹,BEV自動駕駛感知就好比是一個從高處統(tǒng)觀全局的“上帝視角”,車上多個傳感器采集的數(shù)據(jù),會輸入到一個統(tǒng)一模型進行整體分析推理生成鳥瞰圖,能有效地避免誤差疊加;這種方案還能夠做到時序融合,不僅是收集一個時刻的數(shù)據(jù),分析一個時刻的數(shù)據(jù),而是支持把過去一個時間片段中的數(shù)據(jù)都融合進模型做環(huán)境感知建模,時序信息的引入讓感知到的結(jié)果更穩(wěn)定,使得車輛對于道路情況的判斷更加準確、讓自動駕駛更安全。
而百度基于BEV基礎(chǔ)上,提出了UniBEV車路一體的解決方案。它集成了車端多相機、多傳感器的在線建圖、動態(tài)障礙物感知,以及路側(cè)視角下的多路口多傳感器融合等任務(wù),是業(yè)內(nèi)首個車路一體的端到端感知解決方案。
基于統(tǒng)一的BEV空間,UniBEV 車路一體大模型更容易實現(xiàn)多模態(tài)、多視角、多時間上的時空特征融合。百度借助大數(shù)據(jù)+大模型+小型化技術(shù)閉環(huán),在車端路側(cè)的動靜態(tài)感知端有更大的優(yōu)勢。
此外,百度還展示了飛槳團隊的最新成果:推出了超大規(guī)模圖學(xué)習(xí)訓(xùn)練技術(shù)PGLBox,是業(yè)界首個同時支持復(fù)雜算法+超大圖+超大離散模型的大規(guī)模圖學(xué)習(xí)訓(xùn)練技術(shù),通過顯存、內(nèi)存、SSD三級存儲技術(shù)和訓(xùn)練框架的性能優(yōu)化技術(shù),單機即可支持百億節(jié)點、數(shù)百億邊的圖采樣和訓(xùn)練,并可通過多機擴展支持更大規(guī)模。據(jù)悉飛槳目前已經(jīng)在百度的智能交通、信息推薦、搜索等標桿場景實現(xiàn)落地,大幅提升業(yè)務(wù)效率和用戶體驗。
免責聲明:本文轉(zhuǎn)自網(wǎng)絡(luò),僅代表作者個人觀點,與亞訊車網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容(包括圖片版權(quán)等問題)未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。本站不承擔此類作品侵權(quán)行為的直接責任及連帶責任。
買車、賣車就上亞訊車網(wǎng) www.sbu3.com
汽車團購 tg.yescar.cn,省心、省力、省錢!團購電話:400-6808097
關(guān)鍵詞:百度,手機,語音,技術(shù),消除
近日,網(wǎng)絡(luò)上曝光了最新小鵬X9增程版車型諜照,根據(jù)此前規(guī)劃,小鵬首款
日前,從海外媒體處獲悉,由于現(xiàn)款A(yù)MG C 63在全球市場表現(xiàn)沒能達到預(yù)
近日,從官方獲得了大眾凌渡L GTS更多渲染圖,該車作為高性能版本,將
近日,路虎純電“小衛(wèi)士”諜照曝光,該車基于EMA平臺打造,未來將與奔
近日,寶馬官方發(fā)布了一組M4紐博格林官方合作限量版的官圖,新車采用