国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

英飛凌高信噪比MEMS麥克風(fēng)驅(qū)動(dòng)人工智能交互

發(fā)布時(shí)間:2025-4-2 16:20    發(fā)布者:唯樣商城
關(guān)鍵詞: 人工智能 , 英飛凌 , 信噪比
導(dǎo)言


在英飛凌,我們一直堅(jiān)信卓越的音頻解決方案對(duì)于提升消費(fèi)類設(shè)備的用戶體驗(yàn)至關(guān)重要。我們堅(jiān)定不移地致力于創(chuàng)新,在主動(dòng)降噪、語(yǔ)音透?jìng)鳌浺羰忆浺簟⒁纛l變焦和其他相關(guān)技術(shù)方面取得了顯著進(jìn)步,對(duì)此我們深感自豪。作為MEMS麥克風(fēng)的領(lǐng)先供應(yīng)商,英飛凌集中資源改善MEMS麥克風(fēng)的音頻質(zhì)量,為T(mén)WS和耳罩式耳機(jī)、筆記本電腦、平板電腦、會(huì)議系統(tǒng)、智能手機(jī)、智能音箱、助聽(tīng)器甚至汽車等各種消費(fèi)設(shè)備帶來(lái)卓越體驗(yàn)。


今天,我們生活在一個(gè)激動(dòng)人心的時(shí)代,人工智能正在徹底改變?nèi)粘I睿鳦hatGPT等工具正在通過(guò)直觀的文本和語(yǔ)音交互重新定義工作效率。隨著人工智能系統(tǒng)的不斷進(jìn)步,傳統(tǒng)的商業(yè)模式、信仰和假設(shè)正在受到挑戰(zhàn)。語(yǔ)音在新興的人工智能生態(tài)系統(tǒng)中扮演什么角色?作為企業(yè)領(lǐng)導(dǎo)者,我們是否需要重新思考我們的信念?生成式人工智能的興起是否會(huì)降低高質(zhì)量語(yǔ)音輸入的重要性,或者高質(zhì)量語(yǔ)音輸入是否會(huì)成為廣泛采用人工智能服務(wù)和個(gè)人助理的必要條件?


人工智能,從得力助手到最好的朋友


人類不僅會(huì)根據(jù)問(wèn)題的內(nèi)容,也會(huì)根據(jù)提問(wèn)的形式調(diào)整自己的回答,這是很自然的事情。人類的聲音提供了各種線索,可用來(lái)判斷提問(wèn)者的年齡、性別、社會(huì)和文化背景以及情緒狀態(tài)。此外,識(shí)別所處的環(huán)境(如機(jī)場(chǎng)、辦公室、交通或跑步等體育活動(dòng))也有助于確定提問(wèn)者的意圖,并相應(yīng)地調(diào)整答案并更好的對(duì)話。


盡管人工智能的能力有了長(zhǎng)足的進(jìn)步,但人們?nèi)匀徽J(rèn)為,基于人工智能的輔助工具缺乏正確預(yù)測(cè)人類提問(wèn)意圖或特定信息將如何被解讀的能力。為了改善人機(jī)交互,人工智能在做出修辭選擇時(shí)應(yīng)考慮三個(gè)關(guān)鍵因素:對(duì)聽(tīng)者的了解、聽(tīng)者的情緒狀態(tài)和環(huán)境背景。


在許多情況下,僅憑接收到的音頻信號(hào)就足以提取有用的信息并做出適當(dāng)?shù)姆磻?yīng)。例如,考慮一下與素未謀面的人進(jìn)行電話或音頻會(huì)議的情況。更重要的是,考慮一下在沒(méi)有機(jī)會(huì)當(dāng)面交流的情況下,一個(gè)人在反復(fù)交談后對(duì)另一個(gè)人的感知是如何發(fā)展和變化的。


最近的研究表明,即使人工智能的語(yǔ)言反應(yīng)風(fēng)格發(fā)生微小的變化,也會(huì)導(dǎo)致人工智能的社交能力和個(gè)性發(fā)生明顯變化。我們有理由假設(shè),在適當(dāng)?shù)穆曇糨斎胨较拢磥?lái)的人工智能系統(tǒng)將能夠作為有效的伙伴發(fā)揮作用,表現(xiàn)出人類朋友的行為,例如詢問(wèn)并真正傾聽(tīng)答案,或者只是傾聽(tīng)并在適當(dāng)?shù)臅r(shí)候保留判斷。


人類如何體驗(yàn)音頻信號(hào)?


與任何語(yǔ)言交流一樣,音頻信息也使用語(yǔ)言和文字來(lái)傳達(dá)思想、情感和觀點(diǎn)。此外,音調(diào)、速度、音量和背景噪音等其他交流元素也會(huì)影響對(duì)信息的整體感知。


從科學(xué)的角度來(lái)看,人耳基于兩個(gè)關(guān)鍵因素來(lái)感知音頻信號(hào):頻率和聲壓級(jí)。聲壓級(jí) (SPL) 以分貝 (dBSPL) 為單位,表示圍繞環(huán)境大氣壓振蕩的聲壓幅度。100dBSPL的聲壓級(jí)相當(dāng)于割草機(jī)或直升機(jī)發(fā)出的巨大噪音。聲壓級(jí)范圍內(nèi)的最低點(diǎn) (0dB) 等效于20µa的聲壓振蕩,這代表具有最佳聽(tīng)力的健康年輕人在1kHz頻率下的聽(tīng)力閾值。所有與語(yǔ)言有關(guān)的人類聲音都屬于100Hz至8kHz的頻段。根據(jù)ISO226:2023標(biāo)準(zhǔn),相應(yīng)的人類聽(tīng)力閾值如圖1所示。



圖1 聽(tīng)力閾值。根據(jù)ISO226:2023,人在重復(fù)試驗(yàn)中做出50%正確檢測(cè)反應(yīng)的聲級(jí)。


如圖1所示人耳對(duì)500Hz至6kHz范圍內(nèi)的頻率特別敏感。這些頻率上的任何頻率平衡問(wèn)題都會(huì)對(duì)聲音和樂(lè)器的感知質(zhì)量產(chǎn)生重大影響。500Hz至4kHz之間的頻率包含了人類語(yǔ)音中影響語(yǔ)音清晰度的大部分信息。具體來(lái)說(shuō),2kHz左右的頻率尤為重要。5kHz至10kHz的頻率對(duì)音樂(lè)非常重要。這些頻率為聲音增添了“活力”和“亮度”。然而,這些頻率包含的語(yǔ)音信息相對(duì)較少,只有咝聲,即“zhi”、“chi”和“shi”等詞開(kāi)頭的嘶嘶聲。降低6-8kHz左右的咝聲會(huì)對(duì)語(yǔ)音清晰度產(chǎn)生不利影響。


我們大多數(shù)人都知道,人類的聽(tīng)力閾值會(huì)隨著年齡的增長(zhǎng)而下降,如圖2所示。



圖2 該圖顯示了不同年齡段本體正常的男性在單聲道耳機(jī)聆聽(tīng)條件下的聽(tīng)閾衰減情況。請(qǐng)注意,女性也有類似的圖表,其聽(tīng)力衰減程度隨年齡增長(zhǎng)而略有降低(ISO7029:2017)。


值得注意的是,即使是輕度聽(tīng)力損失(大多數(shù)人的聽(tīng)力損失發(fā)生在40至50歲之間)也會(huì)對(duì)個(gè)人生活產(chǎn)生重大影響。例如,患有輕度聽(tīng)力損失的人在嘈雜的環(huán)境中跟不上集體談話可能會(huì)遇到困難。此外,他們還可能錯(cuò)過(guò)重要的聽(tīng)覺(jué)提示,如警告信號(hào)或警報(bào)。


目前的音頻硬件是否足以滿足未來(lái)人工智能的需要?


既然我們已經(jīng)對(duì)人類如何感知音頻信號(hào)有了更好的了解,那么讓我們重新審視一下最初的問(wèn)題,即當(dāng)前和未來(lái)的人工智能需要什么樣的音頻輸入質(zhì)量,才能達(dá)到與人類無(wú)異的水平。


目前市場(chǎng)上的大多數(shù)消費(fèi)類設(shè)備都使用MEMS麥克風(fēng)記錄音頻信號(hào)。MEMS麥克風(fēng)是人工智能個(gè)人助理的主要音頻捕捉技術(shù),使用人工智能助理技術(shù)的設(shè)備目前已開(kāi)始在市場(chǎng)上銷售。


MEMS麥克風(fēng)的錄音質(zhì)量取決于其動(dòng)態(tài)范圍 (dynamic range) 。動(dòng)態(tài)范圍的上限由聲學(xué)過(guò)載點(diǎn) (AOP) 確定,它定義了麥克風(fēng)在高聲壓級(jí)時(shí)的失真性能。麥克風(fēng)的自噪聲確定了其動(dòng)態(tài)范圍的下限。衡量麥克風(fēng)自噪聲的方法是信噪比 (SNR),它定義了麥克風(fēng)的自噪聲與其捕獲的信號(hào) (靈敏度) 之間的比率。不過(guò),就我們的討論而言,信噪比有些不合適,因?yàn)樾旁氡鹊淖栽肼暿褂昧薃計(jì)權(quán)(A-weighting),而A計(jì)權(quán)其實(shí)是基于人類感知音頻信號(hào)的能力來(lái)定義的。


如果音頻信號(hào)的預(yù)期接收者是人工智能,則相關(guān)的麥克風(fēng)的等效噪聲級(jí)ENL(equivalent noise level)是衡量性能的更合適參數(shù),因?yàn)樗雎粤虽浿坡曇舻娜祟惛兄蛩亍5刃г肼暭?jí)ENL指的是在沒(méi)有外部聲源的情況下麥克風(fēng)產(chǎn)生的信號(hào)。等效噪聲級(jí)ENL以分貝(dBSPL)為單位,表示與麥克風(fēng)自噪聲相同電壓的聲壓級(jí)。


值得注意的是,無(wú)論后期采用何種聲音處理方法,低于等效噪聲級(jí)ENL的任何聲音信息基本上都會(huì)丟失,無(wú)法恢復(fù)。因此,如果音頻鏈路中沒(méi)有其他元件在信號(hào)到達(dá)人工智能算法之前引入噪音,麥克風(fēng)ENL就可以被視為人工智能算法的聽(tīng)覺(jué)閾值。應(yīng)該注意的是,這是一個(gè)高度簡(jiǎn)化的假設(shè),因?yàn)橐纛l鏈中通常還有許多其他組件,包括聲道、防水保護(hù)膜和音頻處理鏈路。


請(qǐng)參考圖3兩種MEMS麥克風(fēng)等效噪聲級(jí)ENL曲線與人類聽(tīng)力閾值的直觀對(duì)比。



圖3 中端和高端MEMS麥克風(fēng)的1/3倍頻程等效噪聲級(jí)ENL與典型男性聽(tīng)力閾值的比較。


紅色線條的是信噪比為65dB(A)的麥克風(fēng)的等效噪聲級(jí)ENL曲線,麥克風(fēng)集成了防塵設(shè)計(jì)。相應(yīng)的MEMS麥克風(fēng)目前已用于多家供應(yīng)商生產(chǎn)的多款高端智能手機(jī)中。


下面的紫色線條表示英飛凌最新高端數(shù)字麥克風(fēng)的等效噪聲級(jí)ENL曲線,該麥克風(fēng)具有創(chuàng)新的防護(hù)設(shè)計(jì),可實(shí)現(xiàn)防塵防水效果。這款麥克風(fēng)代表了當(dāng)前的技術(shù)水平,今年才在高端平板電腦上發(fā)布。我們預(yù)計(jì),到今年年底,性能相當(dāng)?shù)柠溈孙L(fēng)將出現(xiàn)在高端智能手機(jī)上。值得注意的是,將麥克風(fēng)的自噪聲降低5-10dB是一項(xiàng)重大成就,特別是考慮到聲壓是使用對(duì)數(shù)刻度來(lái)表示的。


雖然英飛凌在降低高端MEMS麥克風(fēng)的自噪聲方面取得了顯著進(jìn)展,但與人耳相比,麥克風(fēng)在辨別低聲壓級(jí)的能力方面仍有很大差距。尤其是2kHz附近,對(duì)于確保人類聽(tīng)眾獲得高水平的聲音清晰度至關(guān)重要。年輕人的聽(tīng)覺(jué)能力與英飛凌最先進(jìn)的麥克風(fēng)之間的差距超過(guò)12dBSPL。與目前高端手機(jī)中使用的麥克風(fēng)相比,差距明顯更大,達(dá)到17dBSPL。需要再次指出的是,這一評(píng)估僅考慮了MEMS麥克風(fēng)的自噪聲,并未考慮音頻鏈中會(huì)進(jìn)一步降低整體性能的額外噪聲源。


目前MEMS麥克風(fēng)技術(shù)的局限性在包含大部分人類語(yǔ)音信息的頻率范圍(500Hz - 4kHz)內(nèi)最為明顯。即使是市場(chǎng)上最先進(jìn)的MEMS麥克風(fēng),其聲音理解能力也只能達(dá)到60歲老人的水平。根據(jù)現(xiàn)有數(shù)據(jù),可以合理地預(yù)計(jì),使用最新MEMS麥克風(fēng)技術(shù)的人工智能虛擬助手將出現(xiàn)與老年人類似的聽(tīng)力障礙,特別是在需要在嘈雜環(huán)境中或遠(yuǎn)距離跟讀對(duì)話的情況下。


總結(jié)與展望


人工智能的飛速發(fā)展不僅不會(huì)減緩,反而會(huì)加速M(fèi)EMS麥克風(fēng)向更高信噪比發(fā)展的趨勢(shì)。雖然最新的MEMS麥克風(fēng)還無(wú)法與人耳的音頻質(zhì)量相媲美,但英飛凌在降低麥克風(fēng)自噪聲方面取得的進(jìn)展有利于現(xiàn)有和未來(lái)的人工智能。進(jìn)一步改進(jìn)音頻鏈路將是增強(qiáng)人工智能能力的關(guān)鍵,例如周圍環(huán)境分辨、語(yǔ)境理解、情感意識(shí)、說(shuō)話者識(shí)別和多人對(duì)話記錄。有了更好的音頻輸入,人工智能與人類的互動(dòng)方式將能與人類之間的互動(dòng)相匹配,甚至不相上下。


此外,人機(jī)交互水平的提高將促成新的基于人工智能的用例和服務(wù)。例如,想象一下未來(lái)的微軟Copilot,它不僅能總結(jié)團(tuán)隊(duì)會(huì)議內(nèi)容,還能提供對(duì)交談氛圍的整體評(píng)估。未來(lái)的人工智能輔助功能或許可以基于人類的語(yǔ)音和音頻,突出顯示重點(diǎn)或按照重要性進(jìn)行排序。此外,還可以添加輔導(dǎo)功能,為用戶提供有用的建議,幫助他們更好地將未來(lái)的對(duì)話引向所需的方向。


試想一下,人工智能可以對(duì)新的求職者進(jìn)行第一輪面試,或者僅憑音頻就能識(shí)別說(shuō)話者,其安全級(jí)別足以滿足網(wǎng)上購(gòu)物的需要。


所有這些可能只是未來(lái)人工智能的一小部分,未來(lái)人工智能的聽(tīng)力能力將達(dá)到或超過(guò)人類。憑借我們的增強(qiáng)型MEMS麥克風(fēng)解決方案,英飛凌很榮幸能夠參與這一激動(dòng)人心的旅程。


本文地址:http://www.qingdxww.cn/thread-885064-1-1.html     【打印本頁(yè)】

本站部分文章為轉(zhuǎn)載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé);文章版權(quán)歸原作者及原出處所有,如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,我們將根據(jù)著作權(quán)人的要求,第一時(shí)間更正或刪除。
高分通過(guò) 發(fā)表于 2025-4-6 11:05:59
厲害
您需要登錄后才可以發(fā)表評(píng)論 登錄 | 立即注冊(cè)

廠商推薦

  • Microchip視頻專區(qū)
  • 5分鐘詳解定時(shí)器/計(jì)數(shù)器E和波形擴(kuò)展!
  • 了解一下Microchip強(qiáng)大的PIC18-Q24 MCU系列
  • 無(wú)線充電基礎(chǔ)知識(shí)及應(yīng)用培訓(xùn)教程2
  • 為何選擇集成電平轉(zhuǎn)換?
  • 貿(mào)澤電子(Mouser)專區(qū)
關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權(quán)所有   京ICP備16069177號(hào) | 京公網(wǎng)安備11010502021702
快速回復(fù) 返回頂部 返回列表
主站蜘蛛池模板: 可以免费在线看黄的网站 | 日本成人一区二区三区 | 热久久这里只有精品 | 中文天堂最新版www在线观看 | 91成人高清在线播放 | 1204曰韩欧美成人看片 | 国产中的精品一区的 | 啊~用力cao我cao死我 | 五月天激情婷婷婷久久 | 国产一级视频在线观看网站 | 国产欧美一区二区精品性色 | 欧美性色黄大片在线观看 | 四虎网站在线观看 | 窝窝影院午夜色在线视频 | 星武神诀在线观看全集免费播放 | 99久久精品费精品国产一区二 | 亚洲欧美一区在线 | 日韩福利网站 | 天美传媒无忧传媒果冻传媒 | 精品国产无限资源免费观看 | 在线日本中文字幕 | 一本卡二卡三乱码最近更新版 | 四虎网站1515hh四虎 | 妈妈的朋友韩国在线播放 | 日韩区在线观看 | 青青青青草原国产免费 | 免费在线观看国产 | 黄色免费的网站 | 黄片一级毛片 | 亚洲高清网站 | 在线视频一区二区 | 国产ppp在线视频在线观看 | 亚洲成a人| 欧美欲妇 | 亚洲日本欧美日韩高观看 | 亚色中文字幕 | 久久精品这里只有精品 | 欧美日韩91| 国精品在亚洲_欧美 | 高清国产精品久久久久 | 四虎国产精品永久一区 |