人機(jī)接口或人機(jī)界面(HMI)是系統(tǒng)和人之間進(jìn)行交互和信息交換的媒介。傳統(tǒng)的HMI主要借助RS232、RS422/RS485等串行通信接口,以及網(wǎng)口、USB等數(shù)據(jù)接口來實現(xiàn)設(shè)備的人機(jī)交互,而展現(xiàn)在我們面前的“觸摸屏”、導(dǎo)航按鈕等是HMI產(chǎn)品中非常重要的硬件部分,它替代了原有的鼠標(biāo)和鍵盤的部分功能。 隨著技術(shù)的不斷演進(jìn),HMI的交互方式和體現(xiàn)形式都發(fā)生了很大的改變。現(xiàn)在的人機(jī)交互可能是有形的,也可能是無形的。比如,我們可以發(fā)出一個口頭命令或者通過手勢來控制智能手機(jī),也可以用語音控制車輛的導(dǎo)航系統(tǒng),選擇我們要去的目的地。 有關(guān)HMI的三大猜想 無論是在功能上還是概念上,如今的HMI都發(fā)生了翻天覆地的變化。從技術(shù)和應(yīng)用角度,我們認(rèn)為HMI將在如下三個方面進(jìn)一步影響未來的人機(jī)交互方式。 屏幕的變化 在消費電子中,曲面屏、折疊屏開始大量使用,傳感器技術(shù)的進(jìn)步帶動屏下指紋的應(yīng)用。在汽車中,HMI的體現(xiàn)形式主要是屏幕和顯示器,乘客可以通過按下屏幕上的按鈕來操作音頻系統(tǒng)的輸出,比如選擇輸入設(shè)備、收音機(jī)調(diào)臺、瀏覽導(dǎo)航指令等。 未來,乘用車中的屏幕將被賦予更多功能,尺寸也會越來越大,一個完全可定制的全數(shù)字儀表盤顯示屏將獲得廣泛應(yīng)用。現(xiàn)在,特斯拉的15英寸縱向觸摸屏已經(jīng)將加熱、通風(fēng)和空調(diào)(HVAC)控制等功能納入其中,接下來應(yīng)該還會賦予大屏更多的功能。 語音有望優(yōu)先成為HMI的下一個發(fā)展目標(biāo) 專家預(yù)測,到2022年,80%的車載HMI將集成語音控制功能,這還不包括智能手機(jī)中使用的語音識別系統(tǒng)。隨著語音識別技術(shù)的進(jìn)步,其應(yīng)用也在不斷擴(kuò)展。現(xiàn)在,大多數(shù)HMI使用語音命令來控制音頻系統(tǒng)和接聽電話等。 未來,自然語言命令還將用來執(zhí)行更加復(fù)雜的功能,從車輛的自適應(yīng)巡航控制,到智能手機(jī)和可穿戴設(shè)備的非接觸控制和操作。也可以說,將語音用戶界面(VUI)應(yīng)用于電子設(shè)備中將成為人機(jī)交互發(fā)展的大趨勢。現(xiàn)在,基于人工智能(AI)的語音智能助理基本解決了VUI存在的“聽不清楚”這一弊端,語音控制 + AI + 機(jī)器學(xué)習(xí),三者相結(jié)合的語音用戶界面,它們的應(yīng)用前景,想想都會讓人無比激動。 手勢識別在非接觸HMI中開始走紅 與觸摸屏相比,手勢控制具有很多優(yōu)點:例如,用戶不必觸摸設(shè)備就可以從遠(yuǎn)處發(fā)出命令。另外,手勢控制還將HMI從二維用戶界面擴(kuò)展至三維空間。全球著名的車企寶馬公司已將手勢技術(shù)應(yīng)用在部分車型中,乘客做出的手勢動作被攝像頭“看到”后即可執(zhí)行車內(nèi)的功能。當(dāng)然,我們也可以把手勢控制看作是語音控制的替代方案,尤其是在那些不適合大聲講話的公共區(qū)域。 VUI:HMI的未來之星 新冠肺炎的爆發(fā),為了避免因接觸可能帶來的病毒傳播,在工作場所、零售店、醫(yī)院等環(huán)境中,非接觸HMI的需求量急劇上升。隨著全球經(jīng)濟(jì)的重新開放,這一趨勢有進(jìn)一步加速的可能。為此,我們大膽預(yù)測,未來10年,非接觸HMI尤其是VUI的發(fā)展將駛?cè)氚l(fā)展的快車道。該市場的發(fā)展也為半導(dǎo)體公司、OEM/ODM、近距離傳感供應(yīng)商和軟件公司提供了商機(jī)。 在一眾非接觸HMI技術(shù)中,為什么VUI這么被業(yè)界看好呢?其實,早在2014 年,微軟首席執(zhí)行官 Satya Nadella就曾預(yù)言:“人聲就是新的接口”。根據(jù)普華永道(PwC)在2018年所作的一項消費者調(diào)查顯示,90%的受訪者熟悉語音助手,72%的受訪者對這項技術(shù)有第一手使用經(jīng)驗。 ![]() 圖1:語音助手在各種電子設(shè)備中的應(yīng)用情況(圖源:PwC 2018年消費者調(diào)查問卷) VUI之所以獲得消費者的廣泛認(rèn)可,一方面它能解放我們的雙手,提高通信的便利性;另一方面它有效增強(qiáng)了客戶體驗,畢竟我們說話的速度比打字快得多,通過對非接觸控制系統(tǒng)的口頭命令,人與機(jī)器的交流將變得更加自然和有效。隨著語音識別技術(shù)的不斷成熟,VUI在未來幾年內(nèi)將惠及數(shù)十億用戶。專家預(yù)測,在未來5年內(nèi),幾乎每個應(yīng)用程序都將以某種方式集成VUI技術(shù)。 AI使機(jī)器變得越來越智能化,因此,加入了AI和機(jī)器學(xué)習(xí)的VUI將極大地改善語音接口的個性化體驗。據(jù)研究公司Tractica的預(yù)測,基于AI的語音智能助理在HMI中的作用越來越重要,到2025年,全球市場價值有望達(dá)到46億美元。未來幾年內(nèi),80%的車載HMI將集成語音識別系統(tǒng),這還不包括谷歌語音(Google voice)和蘋果Siri等智能手機(jī)助理應(yīng)用。在汽車中,語音命令最常用于控制汽車中的媒體播放器,為導(dǎo)航系統(tǒng)設(shè)置目的地。隨著機(jī)器學(xué)習(xí)算法的發(fā)展,ADAS的功能中也將引入VUI。在智能手機(jī)中,高端機(jī)型幾乎都擁有語音控制手機(jī)操作的功能。 在智能家居中,語音控制系統(tǒng)將家居自動化提升到了一個新的水平,像Amazon Echo、Google Nest和Samsung SmartThings這樣的智能家居集線器允許用戶使用簡單的語音命令來管理連接的設(shè)備。與此同時,VUI也在逐步滲透到我們的工作場所,并使之朝著數(shù)字化方向發(fā)展。Gartner預(yù)測,到2023年25%的員工與應(yīng)用程序的交互將通過語音進(jìn)行。 深耕關(guān)鍵技術(shù) 總體來看,非接觸HMI主要涉及9大關(guān)鍵技術(shù),即:基于攝像頭的手勢識別及認(rèn)證、手勢超聲或雷達(dá)、眼球跟蹤、語音命令、基于手勢和位置的光電二極管傳感器、接近式觸摸屏、運動傳感器融合、短距無線電以及其他非接觸技術(shù)。根據(jù)研究機(jī)構(gòu)Touch Display Research最新發(fā)布的《非接觸HMI 2020》報告,目前,非接觸HMI技術(shù)已經(jīng)吸引了多達(dá)390余家公司的參與,他們重點深耕非接觸傳感器,以及軟件和系統(tǒng)集成等領(lǐng)域,其中,提供語音命令和基于攝像頭的手勢識別的公司最多。 針對HMI應(yīng)用,多家技術(shù)供應(yīng)商都采取了積極的行動,比如,TI公司以營造一個完整的生態(tài)系統(tǒng)為主,其HMI產(chǎn)品組合包括廣泛的I/O、圖形處理、語音識別等,提供開發(fā)各種接口所需的幾乎所有組件、軟件和支持。TI的方案還實現(xiàn)了以太網(wǎng)供電,以進(jìn)一步降低布線的復(fù)雜性,甚至支持無線連接。 例如,TIDEP-01013是具有毫米波傳感器和Sitara處理器的手勢控制HMI參考設(shè)計;TIDEP0066語音識別參考設(shè)計則采用TI嵌入式語音識別 (TIesr) 庫,突出了C5535和C5545 DSP器件的語音識別能力。 ![]() 圖2:語音識別參考設(shè)計原理框圖(圖源:TI) 由于背景噪音的干擾,語音識別的效果通常不是那么完美。優(yōu)質(zhì)MEMS麥克風(fēng)和先進(jìn)的音頻處理功能是促使語音控制設(shè)備真正適用于日常環(huán)境的關(guān)鍵因素。英飛凌的VUI市場策略則是通過逐步建立起來的合作伙伴生態(tài)系統(tǒng),向行業(yè)提供一系列創(chuàng)新的參考平臺和即用型新一代VUI解決方案。目前可用的解決方案主要來自于Aaware、CEVA、Creoir、SoundAI、Sugr和XMOS等公司。2017年初,英飛凌與XMOS共同提出的全新語音控制方案采用的是智能麥克風(fēng),它使語音助手能在其他噪音當(dāng)中準(zhǔn)確識別定位人聲。其中,英飛凌的XENSIV雷達(dá)和硅麥克風(fēng)傳感器組合能識別揚聲器與麥克風(fēng)的位置和距離,同時利用XMOS的遠(yuǎn)場語音處理技術(shù)來捕捉語音。 ![]() 圖3:英飛凌聯(lián)合合作伙伴推出是部分VUI參考設(shè)計(圖源:根據(jù)英飛凌網(wǎng)站信息整理) 結(jié)語 時間回到20世紀(jì)50年代初,語音識別技術(shù)初現(xiàn)萌芽,只是彼時的系統(tǒng)只能理解數(shù)字。到了2017年,這項技術(shù)已經(jīng)取得長足的進(jìn)步,幾乎達(dá)到可以精確地理解人類語言的水平,因此奠定了VUI商用的基礎(chǔ)。 人機(jī)交互是實現(xiàn)自動化和智能化的前提。經(jīng)過幾十年的發(fā)展,按鈕/按鍵這種HMI方式正在從我們的生活中退出,取而代之的觸摸屏在很多應(yīng)用場合也會逐漸被全新一代的VUI替代。技術(shù)和創(chuàng)新永無止境,雖然今天的VUI尚不完美,但它的優(yōu)點已被消費者廣泛認(rèn)可。畢竟,人類最有效的溝通方法就是語言,未來的機(jī)器應(yīng)該也不會例外。 來源:貿(mào)澤電子 作者:M博士 |