電子設備中的語音和音頻控製進展
發布時間:2023-06-21 來源:Mouser 責任編輯:wenwei
【導讀】言(yan)語(yu)是(shi)人(ren)們(men)表(biao)達(da)思(si)想(xiang)和(he)願(yuan)望(wang)的(de)一(yi)種(zhong)有(you)效(xiao)方(fang)式(shi)。在(zai)工(gong)業(ye)時(shi)代(dai)到(dao)來(lai)之(zhi)前(qian),人(ren)類(lei)發(fa)現(xian)動(dong)物(wu)可(ke)以(yi)被(bei)訓(xun)練(lian)用(yong)來(lai)識(shi)別(bie)和(he)響(xiang)應(ying)讓(rang)它(ta)們(men)執(zhi)行(xing)某(mou)些(xie)任(ren)務(wu)的(de)基(ji)本(ben)命(ming)令(ling)。
下xia一yi個ge合he乎hu邏luo輯ji的de發fa展zhan應ying該gai是shi開kai發fa一yi種zhong使shi用yong聲sheng音yin信xin號hao與yu機ji器qi進jin行xing交jiao流liu,並bing指zhi揮hui機ji器qi行xing動dong的de方fang法fa。近jin年nian來lai,以yi語yu音yin和he音yin頻pin作zuo為wei電dian子zi設she備bei的de控kong製zhi界jie麵mian越yue來lai越yue受shou歡huan迎ying,並bing且qie這zhe種zhong技ji術shu也ye在zai不bu斷duan發fa展zhan,以yi滿man足zu用yong戶hu的de期qi望wang和he新xin應ying用yong的de要yao求qiu。
zaibenwenzhong,womenjiangjieshiyongyuyinheyinpinxinhaokongzhidianzishebeihejiqidehaochu,binghuiguruheshixianzhezhongkongzhi。womenhaijiangzhanshizhezhongkongzhijiemianxianzaikeyiruhenenggouqianrudaolixianshebei,yijitamentigongdeyinpinkongzhitiyanruhenenggoudafudugaishan。
使用語音控製電子設備
采用語音控製實現與機器交互有幾個明顯好處:
●對人類來說,語音是一種直觀的交流形式,這種口頭傳達指令的方式更容易。
●jishiyigerendeyanjingheshouzhengzaiyongyuqitashiqing,yuyinjiaoliurengrankeneng。shishideyuyinkongzhiyehenfangbian,liruzaijiachedengmouxieyingyongchangjingxia,shitutongguochumolaikongzhicheneiqitashebeishiweifade。
●語音是控製機器的一種有效媒介,采用語音控製機器,可以在不需要複雜指令的情況下進行監聽和響應。
●zaishebeizhongjichengyuyinkongzhinenggouzuidaxiandudijianshaoxuduoshebeiduichupingdexuqiu。zheduiyuchuyuyuanchenghuobianxieshidianchigongdianshebeilaishuoyouqilixiang,zaizhexieshebeizhong,jianxiaochicunhejiangdigonghaoshichangjiandeshejitiaozhan。duiyujuyouduogeyonghudeyingyonglaishuo,qudiaochupingkongzhiyegengjiafuheweishengyaoqiu。
●如圖1所(suo)示(shi),對(dui)於(yu)某(mou)些(xie)殘(can)疾(ji)人(ren)來(lai)說(shuo),觸(chu)屏(ping)控(kong)製(zhi)可(ke)能(neng)是(shi)一(yi)種(zhong)不(bu)現(xian)實(shi)的(de)選(xuan)擇(ze),因(yin)而(er)語(yu)音(yin)可(ke)以(yi)成(cheng)為(wei)一(yi)種(zhong)有(you)效(xiao)的(de)支(zhi)持(chi)工(gong)具(ju)。通(tong)過(guo)語(yu)音(yin)與(yu)機(ji)器(qi)進(jin)行(xing)交(jiao)互(hu)可(ke)用(yong)於(yu)執(zhi)行(xing)諸(zhu)如(ru)開(kai)門(men)之(zhi)類(lei)的(de)任(ren)務(wu),或(huo)者(zhe)通(tong)過(guo)遠(yuan)程(cheng)通(tong)信(xin)來(lai)傳(chuan)輸(shu)個(ge)人(ren)最(zui)近(jin)的(de)健(jian)康(kang)狀(zhuang)況(kuang)。
圖1:聲控機器人助手。(來源:Shutterstock的PaO_STUDIO)
語音控製設備的音頻前端(AFE)包括麥克風陣列和信號處理模塊。AFE能夠處理來自多通道麥克風陣列的信號,以消除任何背景噪聲或設備本身回放產生的幹擾。然後,該信號被發送到“喚醒詞(wake-word)”檢測引擎,例如經過在設備上預先編程,可識別出“Alexa”或“OK Google”等單詞。通過使用多種信號處理算法,能夠消除多種不需要的幹擾信號。語音控製解決方案的組成部分包括:
麥克風陣列:語音激活係統需要一個或多個麥克風來捕獲音頻控製信號。在選擇麥克風陣列時,重要的考慮因素包括尺寸、成本、性能和穩健性。優化組合來自多麥克風陣列的不同信號有助於提高音頻信號鏈的信噪比(SNR)。
到達方向(DoA)檢測器:用於確定用戶相對於被控設備的位置,以便麥克風陣列可以將波束調整為語音的方向。
波束成形器:它接受來自DoA檢測器的聲音,同時去除來自其他方向的聲音。其性能取決於麥克風陣列的幾何形狀、SNR以及波束寬度和背景噪聲水平等。
聲學回聲消除器(AEC):它會消除設備揚聲器本身的播放信號(例如,設備揚聲器正在播放音樂時收到語音指令),以便清晰地拾取用戶語音指令。
自適應幹擾消除器(AIC):它能夠消除來自其他聲音源的外部噪聲,這些噪聲很難用傳統的波束成形器消除,例如,其他設備產生的較大噪聲。
喚醒詞檢測器:將來自AFE的經過處理語音信號與喚醒詞庫進行比較,例如可使用喚醒詞檢測算法的“Hey Google”,這種算法通常是機器學習模型的一部分。更大的模型則更準確,例如,1MB訓練模型比64kB模型更準確,但處理強度更大。需要大的喚醒詞模型來準確地檢測喚醒詞,從而減少錯誤警報的數量。
D類音頻放大器
該(gai)控(kong)製(zhi)界(jie)麵(mian)的(de)語(yu)音(yin)處(chu)理(li)部(bu)分(fen)經(jing)過(guo)大(da)量(liang)開(kai)發(fa),現(xian)在(zai)即(ji)使(shi)是(shi)低(di)成(cheng)本(ben)的(de)設(she)備(bei)也(ye)能(neng)提(ti)供(gong)準(zhun)確(que)的(de)語(yu)音(yin)識(shi)別(bie)能(neng)力(li)。然(ran)而(er),界(jie)麵(mian)的(de)音(yin)頻(pin)端(duan)受(shou)到(dao)的(de)關(guan)注(zhu)明(ming)顯(xian)較(jiao)少(shao),這(zhe)意(yi)味(wei)著(zhe)與(yu)高(gao)端(duan)音(yin)頻(pin)設(she)備(bei)相(xiang)比(bi),許(xu)多(duo)早(zao)期(qi)智(zhi)能(neng)揚(yang)聲(sheng)器(qi)和(he)其(qi)他(ta)支(zhi)持(chi)音(yin)頻(pin)的(de)物(wu)聯(lian)網(wang)(IoT)設備所產生的音質較差。
與yu語yu音yin控kong製zhi相xiang關guan的de任ren何he新xin產chan品pin都dou可ke能neng被bei認ren為wei分fen散san了le人ren們men對dui這zhe些xie缺que點dian的de關guan注zhu。然ran而er,隨sui著zhe智zhi能neng設she備bei越yue來lai越yue廣guang泛fan采cai用yong,消xiao費fei者zhe對dui其qi提ti供gong的de音yin頻pin體ti驗yan期qi望wang也ye越yue來lai越yue高gao。傳chuan統tongAB類音頻放大器的低效率使其無法用於低功率物聯網設備,幸運的是,幾家芯片製造商最近推出了一係列高級D類lei音yin頻pin放fang大da器qi,體ti現xian了le對dui以yi前qian可ke用yong音yin頻pin放fang大da器qi的de重zhong大da改gai進jin,其qi中zhong許xu多duo產chan品pin都dou是shi專zhuan門men為wei在zai智zhi能neng技ji術shu和he物wu聯lian網wang設she備bei中zhong實shi現xian高gao品pin質zhi音yin頻pin而er開kai發fa。
德州儀器 (Texas Instruments)的TAS2770 15W輸入音頻放大器能夠提高響度和音頻質量,它具有更強的語音捕獲能力,意味著語音控製設備的操作更容易、更自然。Maxim Integrated(現在屬於Analog Devices旗下品牌)開發了MAX98357 和MAX98358 D類放大器,效率達到92%,可提供3.2W的AB類音頻性能,這些放大器的簡化框圖如圖2所示。Diodes Incorporated的PAM8106具有較低功耗,使其能夠在由1.5V鉛酸電池和3.5V鋰離子電池驅動的設備中很好地運行。
圖2:Maxim Integrated D類音頻放大器簡化框圖。(來源:Maxim Integrated)
離線語音控製
亞馬遜的Alexa和穀歌助手(Google Assistant)dengjiyuyundejiejuefanganhenrongyiyongyujuyouwendinghulianwanglianjiedeshebei,danduiyunaxiemeiyouwendinghulianwanghuogenbenmeiyoulianjiedeshebeilaishuo,lixianyuyinkongzhizeshiyigegenghaodejiejuefangan。liru,ruguomougechanpinxuyaoxiangyingjiandandedancizhiling,rugo、stop、reset等(通常稱為關鍵字識別),那麼在設備本身進行本地處理則很有意義。使用低成本的嵌入式微控製器可以實現簡單的關鍵字指令係統,例如可使用恩智浦(NXP)基於EdgeReady MCU的離線本地語音控製解決方案。它采用i.MX RT交叉MCU,開發人員能夠快速將語音控製集成到他們的產品中。恩智浦基於i.MX RT106S的解決方案包括SLN-LOCAL2-IOT開發工具包,如圖3所示。
該開發工具包配備了在FreeRTOS上運行的全部集成軟件,並提供有軟件開發工具包(SDK),以便快速驗證概念。離線語音控製也有助於解決許多消費者的隱私問題,因為他們擔心自己的係統容易受到在線黑客的攻擊。
圖3:恩智浦的SLN-LOCAL2-IOT離線語音控製解決方案。(來源:恩智浦)
結論
yuyinheyinpinzhengzaikuaisuchengweixuduozhinengshebeideshouxuankongzhijiemian,zhezhongjishuyouqishihezaidigonghaohebianxieshiwulianwangshebeizhongshiyong,yinweitanenggouxiaochuduiangguiqiehaodiandeshuzixianshiqideyaoqiu。xuduozaoqixitongdeyinpinzhiliangjiaocha,zhinengshiyongyunlianjiejiejuefanganlaishixian。
然而,隨著新一代高效D類(lei)音(yin)頻(pin)放(fang)大(da)器(qi)的(de)出(chu)現(xian),使(shi)製(zhi)造(zao)商(shang)能(neng)夠(gou)確(que)保(bao)其(qi)設(she)備(bei)為(wei)消(xiao)費(fei)者(zhe)提(ti)供(gong)高(gao)質(zhi)量(liang)的(de)音(yin)頻(pin)體(ti)驗(yan)。而(er)且(qie)現(xian)在(zai)也(ye)可(ke)提(ti)供(gong)一(yi)些(xie)其(qi)它(ta)解(jie)決(jue)方(fang)案(an),能(neng)夠(gou)在(zai)互(hu)聯(lian)網(wang)連(lian)接(jie)不(bu)穩(wen)定(ding)或(huo)根(gen)本(ben)沒(mei)有(you)互(hu)聯(lian)網(wang)連(lian)接(jie)的(de)情(qing)況(kuang)下(xia)實(shi)現(xian)設(she)備(bei)的(de)語(yu)音(yin)控(kong)製(zhi)。這(zhe)些(xie)創(chuang)新(xin)表(biao)明(ming),隨(sui)著(zhe)人(ren)們(men)越(yue)來(lai)越(yue)習(xi)慣(guan)這(zhe)種(zhong)控(kong)製(zhi)界(jie)麵(mian),語(yu)音(yin)控(kong)製(zhi)技(ji)術(shu)有(you)能(neng)力(li)適(shi)應(ying)新(xin)的(de)需(xu)求(qiu),而(er)且(qie)這(zhe)種(zhong)發(fa)展(zhan)趨(qu)勢(shi)還(hai)會(hui)不(bu)斷(duan)繼(ji)續(xu)。
免責聲明:本文為轉載文章,轉載此文目的在於傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請聯係小編進行處理。
推薦閱讀:
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
- 築基AI4S:摩爾線程全功能GPU加速中國生命科學自主生態
- 一秒檢測,成本降至萬分之一,光引科技把幾十萬的台式光譜儀“搬”到了手腕上
- AI服務器電源機櫃Power Rack HVDC MW級測試方案
- 突破工藝邊界,奎芯科技LPDDR5X IP矽驗證通過,速率達9600Mbps
- 通過直接、準確、自動測量超低範圍的氯殘留來推動反滲透膜保護
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall



