Skip to main content

MEMS mikrofonok segítik a hangészlelést és a kulcsszófelismerést a hangvezérelt rendszerekben

Megjelent: 2020. augusztus 11.

digi keyA felhasználók egyre jobban megbíznak a hangban mint kezelőfelületben. Ennek eredményeképpen olyan kihívásokat állítanak a tervezők elé, hogy minél pontosabb és megbízhatóbb, továbbá a lehető legkisebb fogyasztású és válaszidejű hangvezérléses felhasználói felületeket (VUI) hozzanak létre, amelyek kis helyen elférnek, olcsók, és az egyre szorosabb tervezési ütemterveket is lehet velük tartani.

 

Az egyre magasabb elvárásoknak való megfelelés érdekében néhány gyártó fejlett mikro-elektromechanikus rendszerű (MEMS) mikrofonokat kezdett használni, amelyek teljesítmény-jelleggörbéje olyan, hogy elősegíti a felélesztőszavak hatékony érzékelését, valamint a hangvezérléses felhasználói felületek hangparancsainak feldolgozását.
MEMS mikrofonokat – vagy más néven szilíciummikrofonokat – már régóta használnak okostelefonokban, vezeték nélküli fülhallgatókban, autókban, okostévékben és távirányítókban. Ez nagy részben olyan hangvezérelt személyititkár-alkalmazásoknak köszönhető, amilyen az Amazon esetében az Alexa, a Google Assistant és az Apple termékeiben a Siri. Ezek a titkáralkalmazások adott hangparancsokra várnak, és felélesztőszavas algoritmusokat használva kiszűrik azokat a beszéd többi szava közül. A tervezők ezt a szűrőfunkciót gyorsan és gazdaságosan valósítják meg úgy, hogy egyúttal javítják a megbízhatóságát, a pontosságát és a jelentős környezeti zajban is messziről történő beszédhang-érzékelést.

 

Figure 1

1. ábra  A MEMS mikrofon alapfelépítésén látható annak két fő alkotóeleme: a MEMS jelátalakító és a jelfeldolgozó lánc (a célorientált integrált áramkörben (ASIC)) (A kép forrása: CUI Devices)

 

A MEMS mikrofonok működési elve

A MEMS mikrofonok jellemzően két, egyazon tokban elhelyezett alkatrészből állnak: egy MEMS membránból, amely átalakítja a hanghullámokat elektromos jellé, valamint egy erősítőből, amely impedanciaátalakító-ként működve használható analóg kimenőjelet ad a hangfrekvenciás jelfeldolgozó láncra. A harmadik alkotóelem – ha digitális kimenőjelre van szükség – egy analóg-digitális átalakító, amely szintén elhelyezhető ugyanabban a tokban (1. ábra).
Az analóg vagy digitális kimenőjelű miniatűr mikrofonok használatának lehetővé tétele mellett a MEMS technika jó teljesítményt nyújt a fázisegyeztetés és a munkapont-elvándorlás tekintetében is.

 

A MEMS mikrofonok főbb jellemzői

A hangvezérelt eszközöket fejlesztő tervezők számára a MEMS mikrofonok lényeges paraméterei a következők:

  • Jel-zaj viszony (SNR): a mikrofon-kimenőjel zajszintjének és a referencia-jelszintnek az aránya. A jel-zaj viszony mérésekor figyelembe kell venni a mikrofon részegységei és a MEMS mikrofon készletébe tartozó egyéb eszközök, például integrált áramkörök által keltett zajt is.

  • Érzékenység: az 1 kHz frekvenciájú, 94 dB hangnyomású (SPL) vagy 1 Pa nyomású szinuszhullámra válaszul adott analóg vagy digitális kimenőjel értéke.

  • Érzékenységtűrés: egy adott mikrofon érzékenységi tartománya. A kis érzékenységtűrés több mikrofon használata esetén biztosítja az egységességet.

  • Dinamikatartomány: azon leghangosabb és leghalkabb hangnak megfelelő hangnyomásszint közti különbség, amelyek között a mikrofon jelleggörbéje lineáris.

  • Frekvenciaátvitel: az a hangfrekvencia-tartomány, amelyben a mikrofon működőképes.

  • Feléledési idő: azt mutatja, milyen gyorsan képes egy mikrofon feléledni egy indítóeseményre reagálva, és érvényes jelet kiadni.

A hangvezérelt eszközök, például a távirányítók, tévék és okoshangszórók gyakran erős környezeti zajban működnek. Ezenkívül a használójuk lehet a közelükben, de távhasználat esetén 1–10 méteres távolságban is. Ezen körülmények miatt fontos a mikrofon dinamikatartománya, érzékenysége és jel-zaj viszonya. Azokon az alkalmazási területeken, ahol több mikrofont használnak tömbben, az érzékenységtűrés válik kritikussá.
Miközben mindegyik mikrofon beállítható egy adott érzékenységi szintre, apró szerkezeti különbségek is eltéréseket okozhatnak. Mivel azonban a MEMS mikrofonokat szigorúan ellenőrzött félvezetőgyártási technológiák használatával alakítják ki, képesek azokat a rendkívül kismértékű érzékenységtűréseket nyújtani, amelyekre a mikrofontömbök jelének hatékony feldolgozásához szükség van (2. ábra).

 

Figure 2

2. ábra  A tömbben használt mikrofonoknak rendkívül egyforma jelleggörbéjűeknek kell lenniük a kívánt jelfeldolgozási teljesítmény megvalósításához (A kép forrása: CUI Devices)


Ez a kis tűrés létfontosságú a hangvezérléses felhasználói felületeket használó berendezések mikrofontömbjeinek egyre gyarapodó felhasználási területein. A mikrofontömbökben két vagy több mikrofont használnak a jelek begyűjtéséhez, majd külön-külön dolgozzák fel az egyes mikrofonok jeleit – erősítve, késleltetve vagy szűrve azokat –, mielőtt a jeleket egyesítik a végeredményül kapott jel kialakítása érdekében. A mikrofontömbökben a több bemenőjelből létrehozható egy közvetlen válaszjel – ezt nyalábformázás néven is ismerik – a nem kívánt zajok kiszűréséhez, miközben a rendszer a kívánatosabb irányból érkező hangra összpontosít.
A MEMS mikrofonok feléledési ideje szintén kritikus fontosságú a teljes kulcsszavak érzékelése és pontosságuk biztosítása miatt. Az energiatakarékosság érdekében a hangvezérléses felhasználói felületeket használó eszközöket kis fogyasztású állapotban tartják, de ha a mikrofon felélesztési indítójel utáni feléledési ideje rövid, az befolyásolja a hangvezérléses felhasználói felület feléledési idejét is, amely pedig a felélesztőszavak észlelési teljesítményére és a fogyasztásra van hatással.
Ha ezeket a jelleggörbéket szem előtt tartva választ mikrofont, az ebből fakadó hangfeldolgozó algoritmusok jobb teljesítményt nyújthatnak a felhasználó hangjának kiszűrése terén nagyon zajos környezetben, illetve ha a felhasználó nagy távolságból beszél, vagy amikor mindkét eset fennáll.

 

A MEMS mikrofonok analóg és digitális illesztőfelületének összevetése

Amint a MEMS mikrofonok működését ismertető szakaszban utaltunk rá, a MEMS mikrofonok kimenőjele lehet analóg vagy digitális. Az analóg MEMS mikrofonok kis kimeneti impedanciájú belső erősítőt használnak a mikrofon jelének észszerűen magas szintre erősítésére. Ez megfelelő illesztőfelületet kínál a hangfeldolgozó egység számára. A hangvezérléses felhasználói felületek esetében a tervezőnek meg kell bizonyosodnia arról, hogy a kapcsolódó jelfeldolgozó egység tartalmaz-e a tokon belül elhelyezett A/D átalakítót, vagy maga választhat az adott követelményeknek megfelelő külső A/D átalakítót. Az utóbbi megoldás növelheti az áramkör bonyolultságát és árát.
Digitális MEMS mikrofon használata esetén a mikrofon kimenőjele közvetlenül rávezethető digitális áramkörökre, általában egy mikrovezérlőre vagy digitális jelfeldolgozó egységre (DSP). Az erős villamos zajú környezetekre tervezett hangvezérléses felhasználói felületek jellemzően inkább a digitális mikrofonokat részesítik előnyben, mert a digitális kimenőjeleknek nagyobb a zajtűrésük, mint az analógoknak.
Ezenkívül a digitális MEMS mikrofonok közös jellemzője, hogy impulzussűrűség-modulációt (PDM) használnak az analóg jelfeszültségnek a logikai magas jelszintű jelek sűrűségének megfelelő egybites digitális jelfolyammá alakítására. Ez további védettséget jelent a rádiófrekvenciás (RFI) és elektromágneses zavarással (EMI) szemben. Különösen lényeges ez nagy mikrofontömbök használata és fizikailag nagy méretű rendszerek esetén, amilyenek például a gépjárművek hangvezérléses tájékoztató és szórakoztató (infotainment) rendszerei.
Ami az érzékenységet illeti, analóg mikrofonok esetében a hangnyomást decibelben, az 1 V feszültségszinthez viszonyítva mérik (dB/V). A digitális mikrofonok esetében jellemzően szintén decibelben mérik az érzékenységet, de a teljes skálaértékhez képest (dB FS).

 

Figure 3

3. ábra  Az ICS-40740 analóg MEMS mikrofon az okoshangszórók és viselhető készülékek, például zajzáras mikrofonos fejhallgatók méret- és fogyasztási követelményeinek is megfelel (A kép forrása: TDK InvenSense)


MEMS mikrofont használó megoldások hangvezérléses felhasználói felületek kialakításához

A TDK InvenSense cég ICS-40740 jelű analóg MEMS mikrofonja a hangvezérléses felhasználói felületek támasztotta, a mikrofonok teljesítményére vonatkozó számos létfontosságú követelményt kielégít. Tartalmaz egy MEMS mikrofont, egy impedanciaátalakítót, valamint egy kimeneti differenciálerősítőt, mindezt egy kis, 4,00 mm × 3,00 mm × 1,20 mm méretű felületszerelt tokban. Az eszköz 1,5 V-os tápfeszültségről működik, és működés közben mindössze 165 µA az áramfelvétele (3. ábra).
A jel-zaj viszonya 70 dBA (A-súlyozású decibel), amihez nagy, 108,5 dB-es dinamikatartomány tartozik, lehetővé téve a hangok érzékelését nagy környezeti zaj és távoli beszéd esetén is. Ezenkívül széles a frekvenciaátvitele, 80 Hz – 20 kHz, a jelleggörbéjének lineáris része 132,5 dB-t ölel fel, az érzékenységtűrése pedig ±1 dB. Ez utóbbi érték nagyon jól használhatóvá teszi mikrofontömbökben.
Az ICS-40740 parányi helyigénye és kis fogyasztása következtében használható a dolgok internetéhez (IoT) kapcsolódó, kis méretű hangszórók köré épített készülékekben, valamint viselhető eszközökben, amilyenek a zajzáras mikrofonos fejhallgatók.
A Vesper Technologies VM3000 típusú terméke egy gömbkarakterisztikájú, alsó hangnyílású, digitális piezoelektromos MEMS mikrofon szuperrövid, 200 µs alatti feléledési idővel, amely lehetővé teszi a teljes felélesztőszavak észleléséhez elegendően gyors feléledést (4. ábra).


Figure 4
4. ábra  A VM3000 digitális piezoelektromos MEMS mikrofon szuperrövid, 200 µs alatti feléledési idővel, amely lehetővé teszi a teljes felélesztőszavak észleléséhez elegendően gyors feléledést (A kép forrása: Vesper Technologies)


Amikor a piezoelektromos MEMS mikrofonokban a hanghullám eléri a piezoelektromos kristály tartókonzolját, elmozdítja azt, és ezzel feszültséget hoz létre.
A feszültséget egy nagyon kis fogyasztású összehasonlító (komparátor) áramkör érzékeli, amely felélesztőjelet küld a hangrendszernek.
Mivel a MEMS mikrofonoknak nincs szükségük előfeszítő feszültségre, a VM3000 gyakorlatilag nem fogyaszt áramot, amíg egy felélesztőszavas parancs be nem kapcsolja. Ezenkívül képes alvó üzemmódban maradni úgy, hogy közben mindössze 0,35 µA áramot vesz fel, és kevesebb, mint 100 µs alatt képes teljesítmény-üzemmódra kapcsolni. A rendkívül kis fogyasztású alvó üzemmód a gyors üzemmódváltással ötvözve biztosítja azt is, hogy semmilyen adat ne vesszen el, amikor a hangvezérléses eszköz feléled.
A VM3000 digitális mikrofon gyakorlatilag bármelyik hangvezérlő chippel párosítható, és kimenőjele két mikrofon jelét kezeli multiplex üzemmódban, egyetlen adatvonalon. A jel-zaj viszonya 1 kHz-es jel esetén eléri a 63 dB-t, az akusztikus túlterhelési pontja (AOP) pedig 122 dB hangnyomásszintnél van. A VM3000 egy 3,5 mm × 2,65 mm × 1,3 mm méretű tokban van elhelyezve, és csökkenthető vele az anyagköltség, mert tartalmaz egy beépített A/D átalakítót. Ezenkívül a VM3000 egyrétegű piezoelektromos kristályt használ, ezért nem jelentkezik érzékenységi drift, védett a por, víz, pára és egyéb környezeti részecskékkel szemben is.
A piezoelektromos MEMS mikrofonok mint a VM3000 is, egyszerűsítik a mikrofontömböket használó hangvezérlés tervezését is, mert nincs szükség védőhálóra vagy -membránra a több mikrofon beburkolásához. Az ilyen háló vagy membrán, amely a környezeti szennyeződések elleni védőelemként jellemzően a hangnyíláshoz van rögzítve, csökkentheti a MEMS mikrofonok érzékenységét.
A VM3000 ezenkívül viszonylag könnyen szerelhető, mert közvetlenül csatlakoztatható kódoló-dekódoló (codec) vagy más jelfeldolgozó egységekhez (5. ábra). A fő rendszer (codec stb.) biztosítja a fő órajelet (CLK), amely meghatározza a bitek továbbítási sebességét az adatvonalon (DATA).
Érdekesség még, hogy két mikrofon kapcsolható egy DATA adatvonalra. Ennek oka, hogy az adat az órajel felfutó vagy lefutó éléhez van kapcsolva, ez az L/R Select (bal/jobb kiválasztó) lábbal állítható be, ha L/R Select = GND (föld) (felső állás), akkor a lefutó, ha L/R Select = VDD (tápfeszültség) (alsó állás), akkor a felfutó élhez. A codec vagy a jelfeldolgozó egység ezután szét tudja válogatni a jelfolyamot annak alapján, hogy az adatok az órajel melyik éléhez kapcsolódnak.

 

Figure 6
5. ábra  A VM3000 közvetlenül kapcsolható külső jelfeldolgozó egységekhez, és két mikrofon kapcsolható egy DATA adatvonalra (A kép forrása: Vesper Technologies)

 

Az első lépések: fejlesztőkészlet MEMS mikrofonokhoz

A főbb paraméterek kiértékeléséhez és a MEMS mikrofonokat használó hangvezérléses rendszerek tervezésének egyszerűsítéséhez a gyártók referenciakártyákat és szoftverfejlesztő készleteket kínálnak.
A Vesper például az S-VM3000-C kártyát, amely egy VM3000 digitális MEMS mikrofont és egy 0,1 µF kapacitású tápfeszültség-simító kondenzátort tartalmaz, mindezt élcsatlakozós kivitelben.
Ehhez hasonlóan a TDK InvenSense az EV_ICS-40740-FX fejlesztőkártyát kínálja saját ICS-40740 analóg MEMS mikrofonjához, egy olyan kártyát, amelynek segítségével a tervezők gyorsan és hatékonyan elemezhetik az analóg mikrofonok differenciál kimenőjelének teljesítményét.
A MEMS mikrofonon kívül az egyetlen egyéb alkatrész, amelyet a fejlesztőkészlet tartalmaz, egy 0,1 µF kapacitású tápfeszültség-simító kondenzátor.
A CUI Devices, amely analóg és digitális MEMS mikrofonokat is gyárt, a DEVKIT-MEMS-001 fejlesztőkészletet kínálja a tervezőknek prototípusok készítéséhez és teszteléséhez (6. ábra). Ez a kártya négy egymástól független mikrofonkiértékelő áramkört tartalmaz.
A kártya két analóg MEMS mikrofont tartalmaz: az alsó hangnyílásnál a CMM-2718AB-38308-TR, míg a felső hangnyílásnál a CMM-2718AT-42308-TR jelűt, valamint két digitális MEMS mikrofont, az alsó hangnyílásnál a CMM-4030DB-26354-TR, míg a felső hangnyílásnál a CMM-4030DT-26354-TR jelűt. A felső és az alsó hangnyílást a nagyobb tervezési rugalmasság érdekében az analóg és a digitális kimenőjelű mikrofonok is használják.
A két analóg eszközt összevetve a CMM-2718AB-38308-TR érzékenysége –38 dB, jel-zaj aránya 65 dBA, míg a CM-2718AT-43208-TR érzékenysége –42 dB, jel-zaj aránya 60 dBA. A frekvenciaátvitele mindkettőnek 100 Hz – 10 kHz, áramfelvétele pedig 80 µA egy 2 V-os tápfeszültségről.
Ami a két digitális mikrofont illeti, a CMM-4030DB-26354-TR érzékenysége –26 dB, jel-zaj aránya 64 dBA, míg a CMM-4030DT-26354-TR érzékenysége –26 dB, jel-zaj aránya 65 dBA. Mindkettő 1 bites PDM adatformátumot használ, és a frekvenciaátvitele mindkettőnek 100 Hz – 10 kHz, áramfelvétele pedig 0,54 mA egy 2 V-os tápfeszültségről.

 

Figure 5

6. ábra  A DEVKIT-MEMS-001 négy leválasztható mikrofonkiértékelő áramkört tartalmaz: kettőt analóg és kettőt digitális kimenőjelekhez (A kép forrása: CUI Devices)

 

Következtetés

Az analóg és a digitális MEMS mikrofonoknak is olyan rendszerszintű előnyei vannak, amelyek pótolják a mindig bekapcsolt hangvezérléses illesztőfelületeket használó megoldások hiányosságait.
A legújabb MEMS mikrofonok új műszaki megoldásokat használnak az elem vagy akkumulátor üzemidejének meghosszabbítására, a távoli hangok minőségének javítására és a környezeti szennyeződéseknek való ellenállás megvalósítására. A kulcsszavak pontosságának javítása egy másik fő tervezési szempont, amely szorosan kapcsolódik olyan jellemzőkhöz, mint a jel-zaj viszony, az érzékenységtűrés és a feléledési idő – a legújabb eszközök ezek mindegyikén javítanak, hogy jobb hangvezérléses felhasználói felületeket lehessen velük tervezni.

 

Szerző: Rolf Horn – Digi-Key Electronics

 

Digi-Key Electronics
Angol nyelvű kapcsolat
Arkadiusz Rataj
Sales Manager Central Eastern Europe & Turkey
Digi-Key Electronics Germany
Tel.: +48 696 307 330
E-mail: Ez az e-mail-cím a szpemrobotok elleni védelem alatt áll. Megtekintéséhez engedélyeznie kell a JavaScript használatát.

www.digikey.hu

 

még több Digi-Key Electronics