您的位置:首頁(yè) > 財(cái)經(jīng) >

文心大模型上車(chē) 智能座艙邁入大模型時(shí)代_環(huán)球速遞

隨著AI大模型的持續(xù)演進(jìn),其應(yīng)用場(chǎng)景也在不斷更新。

“今天我們正站在大語(yǔ)言模型的技術(shù)基點(diǎn)去思考,汽車(chē)?yán)锼枰淖畋举|(zhì)的核心變革點(diǎn)是什么?!?月26日,在21世紀(jì)經(jīng)濟(jì)報(bào)道科技峰會(huì)“潮起AIGC:大模型崛起”北京閉門(mén)會(huì)上,百度智能汽車(chē)事業(yè)部智艙業(yè)務(wù)部產(chǎn)品架構(gòu)師徐嘉南介紹稱(chēng)。


(資料圖片)

在徐嘉南看來(lái),未來(lái)可移動(dòng)的汽車(chē)機(jī)器人應(yīng)當(dāng)具備自主移動(dòng)及人機(jī)對(duì)話(huà)式交互兩大方向的能力,大語(yǔ)言模型則以其更強(qiáng)的自然語(yǔ)言理解、邏輯推理及創(chuàng)造性為汽車(chē)的智能應(yīng)用帶來(lái)全新的想象空間。

需要注意的是,百度正在進(jìn)行大模型上車(chē)的持續(xù)探索。就在日前,百度Apollo汽車(chē)智能化業(yè)務(wù)展示了以文心大模型為基礎(chǔ)的新一代AI智艙探索成果,這也是國(guó)內(nèi)首個(gè)基于文心大模型在車(chē)載場(chǎng)景下的探索成果,并有望在未來(lái)推進(jìn)量產(chǎn)。

據(jù)介紹,基于文心大模型能力,百度Apollo推出的智艙將具備出行場(chǎng)景對(duì)話(huà)式交互、邏輯推理、策略規(guī)劃和知識(shí)問(wèn)答等多項(xiàng)能力,同時(shí)也能夠?qū)崿F(xiàn)在當(dāng)前智艙命令式交互下覆蓋全車(chē)多音區(qū)、毫秒級(jí)響應(yīng)、免喚醒全時(shí)交互的極致體驗(yàn)。

“從整個(gè)發(fā)展角度來(lái)看,我們認(rèn)為未來(lái)文心大模型會(huì)重塑車(chē)內(nèi)的應(yīng)用和交互,基于文心這樣的能力,把過(guò)去可能我們想到的體驗(yàn),但是過(guò)去的技術(shù)做不到的能力,去進(jìn)行一次重構(gòu),給大家?guī)?lái)全新體驗(yàn)?!毙旒文现赋觥?/p>

文心大模型上車(chē)

作為智能汽車(chē)的核心,智能座艙隨著汽車(chē)智能化的演進(jìn)而持續(xù)發(fā)生著變化,它也愈發(fā)成為用戶(hù)購(gòu)車(chē)決策的決定因素之一。

徐嘉南指出,當(dāng)前智能座艙的功能正在持續(xù)增加,同時(shí)語(yǔ)音交互的覆蓋率也在持續(xù)增加。據(jù)相關(guān)機(jī)構(gòu)調(diào)研,2022年1-8月,語(yǔ)音交互功能在智能座艙的滲透率達(dá)到73.3%,百度方面則預(yù)測(cè)稱(chēng),未來(lái)智能座艙的語(yǔ)音交互覆蓋量還會(huì)快速拓展,到2025年會(huì)實(shí)現(xiàn)超過(guò)95%的搭載。

不過(guò)當(dāng)前,智能座艙的語(yǔ)音交互更多是命令式的交互工具,并且系統(tǒng)功能單一,交互系統(tǒng)毫無(wú)智能可言。大模型的落地,則帶來(lái)了全新的可能性,有望推動(dòng)座艙語(yǔ)音助手向“AI智能助手”升級(jí)。

就此,百度Apollo正式推出國(guó)內(nèi)首個(gè)基于文心大模型在車(chē)載場(chǎng)景下的探索成果。據(jù)介紹,基于文心大模型能力,百度Apollo針對(duì)車(chē)載場(chǎng)景進(jìn)行專(zhuān)項(xiàng)訓(xùn)練和模型精調(diào),無(wú)需人工數(shù)據(jù)標(biāo)注,AI便會(huì)具備更出色的語(yǔ)言理解和學(xué)習(xí)能力。

例如,在出行場(chǎng)景中,小度車(chē)載語(yǔ)音可以幫用戶(hù)進(jìn)行旅途行程規(guī)劃、沿途景點(diǎn)美食推薦。在家庭出行時(shí),靈感畫(huà)畫(huà)可起到給兒童娛樂(lè)陪伴的作用。只需用一句話(huà)描述想要的畫(huà)作內(nèi)容,AI即可在幾秒內(nèi)按照完成一幅創(chuàng)意畫(huà)作。

同時(shí),百度也在探索如何借助文心大模型能力重塑個(gè)性化駕駛空間。在未來(lái),百變?nèi)嗽O(shè)功能可針對(duì)不同場(chǎng)景和不同用戶(hù)特點(diǎn)、偏好,定制個(gè)性化的語(yǔ)音助手人設(shè),與用戶(hù)進(jìn)行情感化交流。用戶(hù)也可以擁有一個(gè)用車(chē)顧問(wèn),拋棄陳舊的產(chǎn)品說(shuō)明書(shū),用戶(hù)可以隨時(shí)隨地、詳細(xì)了解車(chē)輛功能。

此外,大模型融入智艙場(chǎng)景后,百度Apollo智艙也將演變?yōu)椤暗谌羁臻g”的核心載體。可以依托語(yǔ)音助手完成朋友圈文案撰寫(xiě)、沿途景色拍照并一鍵發(fā)送至手機(jī),也可以在開(kāi)車(chē)途中讓語(yǔ)音助手完成一天的日程安排和會(huì)議預(yù)定等等。

據(jù)介紹,在未來(lái),大模型加持下的智艙將具備出行場(chǎng)景對(duì)話(huà)式交互、邏輯推理、策略規(guī)劃和知識(shí)問(wèn)答等多項(xiàng)能力,讓車(chē)內(nèi)助手在未來(lái)有能力像真人一樣跟用戶(hù)交流,可以理解并滿(mǎn)足用戶(hù)在車(chē)內(nèi)場(chǎng)景的深層次需求。

“未來(lái)基于文心大模型的能力,車(chē)?yán)锼薪换タ梢杂米匀徽Z(yǔ)言的方式進(jìn)行,而不是以點(diǎn)擊頁(yè)面然后跳轉(zhuǎn)的邏輯進(jìn)行交互,這是大模型給未來(lái)車(chē)機(jī)交互體驗(yàn)帶來(lái)的非常大的變化?!毙旒文媳硎?,“用戶(hù)直接表達(dá)需求,系統(tǒng)根據(jù)分析和理解,調(diào)動(dòng)應(yīng)用資源進(jìn)行需求滿(mǎn)足。這將改變?nèi)伺c應(yīng)用、甚至人與車(chē)之間的關(guān)系?!?/p>

技術(shù)推動(dòng)變革

身處汽車(chē)行業(yè)劇變的時(shí)代,智能化成為汽車(chē)品牌差異化的重要因素,而智艙是當(dāng)前階段用戶(hù)最容易有感知的智能汽車(chē)配置。

百度智能座艙產(chǎn)品由小度車(chē)載SDK及小度車(chē)載OS構(gòu)成。官方數(shù)據(jù)顯示,百度Apollo始終助力OEM打造智能化競(jìng)爭(zhēng)優(yōu)勢(shì),其汽車(chē)智能化解決方案已在31個(gè)汽車(chē)品牌的134個(gè)車(chē)型上實(shí)現(xiàn)量產(chǎn),累計(jì)搭載超700萬(wàn)輛。

同時(shí),考慮到車(chē)企希望進(jìn)行個(gè)性化、定制化而非千篇一律的體驗(yàn),希望形成自身的品牌調(diào)性,因而百度進(jìn)一步推出了小度車(chē)載SDK,從而讓車(chē)企實(shí)現(xiàn)差異化設(shè)計(jì)。

其中,在小度車(chē)載語(yǔ)音SDK方面,百度Apollo已經(jīng)實(shí)現(xiàn)了最新的技術(shù)升級(jí),使其變得更加智能化和易用。

基于大模型本地化,小度車(chē)載語(yǔ)音SDK持續(xù)推動(dòng)座艙極致交互體驗(yàn)。“所謂的大模型本地化,是指將云端參數(shù)非常大的模型通過(guò)蒸餾和裁剪的方式,把整個(gè)體積和運(yùn)行資源占用變得更小,然后移動(dòng)到端上,利用本地化的算力去進(jìn)行加速運(yùn)行,從而帶來(lái)更極致的語(yǔ)音交互體驗(yàn)?!毙旒文辖忉尫Q(chēng)。

具體而言,小度車(chē)載語(yǔ)音能夠?qū)崿F(xiàn)流暢的免喚醒多路同時(shí)交互、全頁(yè)面所見(jiàn)所說(shuō)、全域毫秒級(jí)響應(yīng),讓用戶(hù)像是擁有了一個(gè)隨時(shí)待命的私人助理。

尤其值得注意的是,小度車(chē)載語(yǔ)音還能夠?qū)崿F(xiàn)真多路同時(shí)對(duì)話(huà)能力,最大支持8路同時(shí)交互精確處理,覆蓋整個(gè)座艙內(nèi)外,可以實(shí)現(xiàn)多路同時(shí)、快速、連續(xù)對(duì)話(huà)的極限挑戰(zhàn)。坐在駕駛位、副駕駛位、和后排的每一個(gè)人都可以同時(shí)提出自己的訴求,語(yǔ)音助手不僅可以識(shí)別不同位置用戶(hù)的需求并且可以依次解決。

此外,小度車(chē)載語(yǔ)音還實(shí)現(xiàn)了全領(lǐng)域毫秒級(jí)響應(yīng),且通過(guò)自動(dòng)識(shí)屏方式實(shí)現(xiàn)用戶(hù)全場(chǎng)景的語(yǔ)音交互體驗(yàn)。“車(chē)?yán)锼械墓δ芏伎梢哉Z(yǔ)音交互,而不是只在某些應(yīng)用里面才能交互,這在我們行業(yè)上是非常大的改變?!毙旒文媳硎尽?/p>

在徐嘉南看來(lái),大語(yǔ)言模型正在推動(dòng)行業(yè)走向真正的對(duì)話(huà)式交互,而它也將帶來(lái)用戶(hù)及產(chǎn)業(yè)層面的深刻變革。

從用戶(hù)層面而言,隨著通用語(yǔ)言模型置入設(shè)備中,其能夠在不同場(chǎng)景下化身不同類(lèi)型的助手,并解決用戶(hù)的專(zhuān)業(yè)問(wèn)題。從產(chǎn)業(yè)層面來(lái)看,車(chē)企未來(lái)在進(jìn)行語(yǔ)音交互功能開(kāi)發(fā)時(shí),也將從儲(chǔ)備語(yǔ)音開(kāi)發(fā)人員進(jìn)行具體功能設(shè)計(jì),到配備提示詞工程師進(jìn)行大模型調(diào)教,訓(xùn)練車(chē)機(jī)更好地響應(yīng)用戶(hù)需求。

而想要達(dá)到這樣的變革,就需要堅(jiān)實(shí)的技術(shù)支撐?!鞍俣仍谡麄€(gè)行業(yè)內(nèi)擁有深刻的AI技術(shù)積累,擁有全棧自研的AI架構(gòu),從底層芯片的昆侖芯,到上層深度學(xué)習(xí)框架飛槳,再到AI大模型層,我們能夠基于文心大模型的能力實(shí)現(xiàn)用戶(hù)及車(chē)企所需要的體驗(yàn)?!毙旒文媳硎?。

(文章來(lái)源:21世紀(jì)經(jīng)濟(jì)報(bào)道)

標(biāo)簽:

相關(guān)閱讀