Skip to main content

Magyarázható mesterséges intelligencia mérnöki szemmel

Megjelent: 2022. szeptember 13.

Mouser lidA gépi tanulási algoritmusok gyorsan váltak mindennapi életünk szerves részévé. A mesterséges intelligenciák egyik ágaként a gépi tanulás sokkal nagyobb szerepet kap, mint elsőre gondolnánk, gyakran észre sem vesszük, hogy egy adott esetben valamilyen algoritmus áll a dolgok hátterében. A mobiltelefonok intelligens asszisztensei, közlekedés és útvonaltervezés, webes keresések, és a listát bármeddig folytathatnánk.

 

Ahogy az egyre összetettebb és egymással többszörösen összefüggő algoritmusok mind nagyobb teret nyernek az ipar, az autó­ipar és az orvoslás területén, úgy nő annak a fontossága is, hogy megértsük, miért jutott egy adott gépi tanulási algoritmus egy bizonyos eredményre. Egyre gyakrabban használjuk a „magyarázható mesterséges intelligencia” (explainable AI – xAI) kifejezést egy algoritmus eredményének és az eredményre vezető háttértényezők leírására.
Írásunkban az xAI-t és annak fontosságát járjuk körbe, hogy alkalmazása miért kulcsfontosságú minden új gépi tanulási alkalmazás esetében.

 

Mesterséges intelligencia és gépi tanulás
a mindennapi életünkben

Nehezen tudnánk rámutatni egy pontra, amikor a gépi tanulás mindennapi életünk részévé vált. Nem kísérte nagy bejelentés, legtöbbször említés sem esik róla, azonban a gépi tanulás lassan, de biztosan szervesen beépült a technológiával való mindennapos interakcióinkba. Legtöbbünk számára az első észrevehető találkozás a mobiltelefonok személyi asszisztensei (Google Voice és Apple Siri) formájában történt. A gépi tanulás gyorsan meghatározóvá vált az olyan fejlett autóipari vezetőtámogató rendszerekben, mint az aktív sávtartó asszisztens (ALA), adaptív sebességtartó (ACA) vagy a közúti jelzések felismerése. Ezek mellett a jól azonosítható alkalmazások mellett a gépi tanulás (GT) számtalan olyan alkalmazásban is jelen van, amiknek esetében nincs tudomásunk róla, pénzügyi és biztosítótársaságok dokumentum­feldolgozó rendszereiben, orvosi és egészségügyi diagnosztikai rendszerekben, ahol a képalkotó és egyéb vizsgálatok eredményeit elemezve, mintafelismerésben használják ki a gépi tanulási rendszerek képességeit.
A gépi tanulási rendszerek szélsebesen váltak mindennapi életünk részeivé, mi pedig hasonló gyorsan váltunk függőkké a gyors döntéshozási képességeik miatt.

 

Egy algoritmus döntéshozatali folyamatának megértése

A gépi tanuláson alapuló döntésekbe vetett bizalmunk és az azoktól való függőségünk mostanában kezdi néhány fogyasztói és szakmai etikai csoport aggodalmát kiváltani.
Hogy megérthessük, hogyan becsülik meg a gépi tanulási rendszerek egy kimenetel valószínűségét, tekintsük át röviden működésük alapjait.
A gépi tanulás algoritmusok segítségével utánozza az emberi agy döntéshozatali folyamatát. Az agyunkban lévő neuronokat matematikai alapú neurális hálózat helyettesíti, egy algoritmust létrehozva. Akárcsak az agyunk, a mesterséges neurális hálózat a rendelkezésére álló, megszerzett tudás alapján képes egy bizonyos valószínűséggel rendelkező eredményre jutni. Ahogy az emberek születésüktől kezdve, egy mesterséges neurális hálózat is folyamatos tanulással fejleszti a megértést. Minden gépi tanulási modell alapvető része a neurális hálózat betanítása. Bizonyos feladatokhoz eltérő típusú neurális hálózatokat érdemes alkalmazni, például képek felismeréséhez leginkább egy konvolúciós neurális hálózat, míg az emberi beszéd feldolgozásához a rekurrens neurális hálózatok alkalmasabbak. A modell a működéséhez szükséges tudást hatalmas mennyiségű „kiképző” adat feldolgozásával szerzi meg. Egy állatok felismerésére szolgáló, konvolúciós neurális hálózat több tízezer kép kísérőadatokkal (állatok fajtája, neve, neme, stb.) együtt történő feldolgozását igényli. Minden fajról és nemről számos, különböző látószögből és fényviszonyok között készült fotóra van szükség. A modell betanítását követő tesztfázisban a modellt olyan képekkel tesztelik, amikkel még nem találkozott. A modell minden kép esetén valószínűségi tényezők alapján következtet az eredményre. A kimenetelek valószínűsége annál nagyobb, minél nagyobb volt a tanuláshoz használt adatmennyiség és minél optimalizáltabb az adott neurális hálózat.
Az alkalmazásfejlesztő akkor végzett a modell fejlesztésével, amikor az elvárt feladatokban az eredmények valószínűsége kellően magas értéket ér el.
Egy egyszerű, helyi feldolgozású ipari gépi tanulási alkalmazási példa egy motor állapotának megfigyelése a motor vibrációjának elemzése alapján. Az ipari motorhoz különböző vibrációérzékelőket (piezzo, MEMS, digitális mikrofon) csatolva rögzítenek részletes adatokat a motor vibrációs jellemzőiről. Az ismert mechanikai problémákkal (kopott csapágy, vezérlési hibák) rendelkező motorok kivonásával a gépi tanulási modell tudása tovább mélyíthető. Az így létrejövő modell képes folyamatosan megfigyelni a motor működését és betekintést nyújtani annak mindenkori állapotába. Az ilyen, kis fogyasztású mikrokontrolleren működő neurális hálózatokat TinyML-nek nevezik.

 

Mit értünk magyarázható mesterséges intelligencia alatt?

Ahogy azt az előzőekben jeleztük, a GT-alapú alkalmazások kimeneteleivel kapcsolatosan felmerülnek kételyek az esetlegesen torzított jellegük miatt. A gépi tanulásos és mesterséges intelligencián alapuló algoritmusok objektivitásával kapcsolatos vitáknak számos aspektusa van, de széles körben elfogadott az a vélemény, miszerint átláthatóbbnak, tisztességesebbnek, etikusabbnak és erkölcsösebbnek kellene lenniük. A neurális hálózatok többsége fekete dobozként működik, a betáplált adatok és a kiadott eredmény közötti folyamatokra és döntési mechanizmusokra nincs betekintési lehetőség. Elmondható, hogy egyre növekvő igény mutatkozik arra, hogy az algoritmizált döntési mechanizmusok magyarázatot is adjanak a döntések alapjairól. Az így kapott eredmények jogosak és etikusak, ezért nevezzük az ilyen rendszereket magyarázható mesterséges intelligenciának (explainable AI – xAI).
Rövid írásunkban éppen csak érteni tudjuk az xAI mögött húzódó elképzeléseket, de olvasóink hasznos információkat találhatnak az NXP félvezetőgyártó és a PWC vezetési tanácsadó cég publikációiban.
Az 1. ábra egy etikus és megbízható mesterségesintelligencia-rendszer fejlesztésének az NXP által javasolt holisztikus megközelítését mutatja be.

 

MRA356 Figure1 1

1. ábra Az NXP holisztikus megközelítése etikus és megbízható mesterséges intelligenciák készítéséhez (Forrás: NXP)

 


Hogy lássuk, milyen követelmények merülnek fel egy xAI-rendszerrel kapcsolatban, vizsgáljuk meg két lehetséges alkalmazás forgatókönyvét.
Autóipar– autonóm járművezérlés: Képzeletbeli utasunk egy nagyon lassan haladó taxiban ül, és megkérdezi a sofőrt, hogy miért vezet annyira lassan. A sofőr részletesen elmagyarázza, hogy a hideg időjárás miatt az út jéggel borított, és emiatt különösen körültekintően kell vezessen, nehogy elveszítse a gépjárműve feletti irányítást. Ha ugyanez az utas egy önvezető taxiban ülne, nem lenne kit megkérdeznie a lassú haladás okáról. Az alacsony sebesség minden bizonnyal több, egymástól független gépitanulás-alapú rendszer (környezeti tényezők, meghajtás, stb.) döntésének eredménye, amelyek közösen határozzák meg a lassú haladás szükségességét. Ha az autonóm jármű egy alrendszere vizuálisan és hallhatóan jelezné a döntések mögött álló okokat, az utasok tájékozottabban és nyugodtabban utaznának.
Egészségügy – páciens állapotfelmérése: Egy automatizált rendszer képes felgyorsítani a különböző bőrbetegségek azonosítását. A rendszer bemenete a páciens bőrelváltozásáról készült fotó, a kimenet pedig a bőrgyógyászhoz érkezik, aki javaslatot tesz a kezelésre. Az emberi bőrbetegségeknek sokféle típusa létezik, egyesek átmenetiek, mások tartósan fennmaradnak, némelyik fájdalmas is. A bőrbetegségek súlyossága a kellemetlentől az életveszélyesig terjedhet. A lehetséges rendellenességek széles skálája miatt az orvos további vizsgálatokat tarthat szükségesnek a kezelési terv meghatározása előtt. Ha az előzetes diagnosztikát végző mesterséges intelligencia képes lenne jelezni az egyes lehetséges diagnózisok valószínűségét, az orvos megalapozottabb döntést tudna hozni.
A fenti két egyszerű példa is jól mutatja, milyen fontos lehet egy xAI-alkalmazás használata. A mesterséges intelligenciák és a gépi tanulási rendszerek pénzügyi szolgáltatásokban és az államigazgatásban történő alkalmazásával kapcsolatban számos egyéb etikai és társadalmi kérdést is mérlegelni kell.
Egy gépi tanulási rendszer tervezésekor a fejlesztőknek érdemes figyelembe venniük néhány szempontot.

  • Tartalmaznak-e a betanításhoz használt adatok megfelelő mennyiségű és kellően változatos jellemzőt a kikövetkeztetendő elemről?
  • Megjelenik-e a betanítási adatokban minden azonosított osztályozási csoport a megfelelő mennyiségben és arányosan?
  • Igényel-e magyarázatot az algoritmus által következtetett eredmény?
  • Képes-e a neurális hálózat választ adni az általa kizárt kimenetelek valószínűsége alapján?
  • Vonatkoznak-e a GT-alkalmazás adatfeldolgozási tevékenységére jogi vagy szabályozási korlátozások?
  • Megfelelően védett-e a GT-alkalmazás ellenérdekelt felek befolyása ellen?
  • Megbízható-e a GT-alkalmazás?

 

Gépitanulás-alapú alkalmazások fejlesztése

A beágyazott rendszerek fejlesztői közül sokan dolgoznak már olyan gépi tanulási funkciókat alkalmazó projekteken, mint például a bevezetőben már említett TinyML. A gépi tanulás alkalmazása azonban nem korlátozódik az edge-alapú platformokra, az elv könnyen skálázható nagy ipari alkalmazásokhoz is. A GT ipari alkalmazási példái között említhetjük a gépi látást, az állapotfigyelést, biztonsági és védelmi megoldásokat.
A vezető félvezetőgyártók kínálatában már megjelentek a gépi tanulási alkalmazásokra optimalizált mikrokontrollerek és mikroprocesszorok. Jó példa erre az NXP iMX-8M Nano-Ultralite alkalmazásprocesszor. Az NXP iMX-8M Plus sorozat részeként a Nano-Ultralite (NanoUL) egy elsődleges, négymagos, akár 1,5 Ghz-es órajellel működő Arm® Cortex®-A53 maggal, és egy általános célú, akár 750 Mhz-es Cortex-M7 magprocesszorral rendelkezik valós idejű és alacsony fogyasztású feladatokhoz.
A 2. ábrán az iMX-8M NanoUL fő funkcióit kiemelő blokkábrája szerepel, amin látható a csatlakozóegységek, perifériális interfészek, biztonsági funkciók, órajelek, időzítők, felügyeletidőzítők és PWM-blokkok átfogó készlete. A NanoUL egy kompakt kialakítású alkalmazásprocesszor, fizikai mérete: 11 mm × 11 mm.

 

MRA356 Figure2 2

2. ábra Az NXP iMX-8 Plus NanoUL funkcionális blokkdiagrammja (Forrás: NXP)

 


Az NXP az iMX-8 Plus NanoUL-re alapuló alkalmazások fejlesztésének támogatásához kínálja az i.MX 8M Nano UltraLite Evaluation Kit kiértékelőkészletet – lásd a 3. ábrát. Az egy alaplapot és egy NanoUL processzorkártyát tartalmazó készlet átfogó és teljes platformot biztosít a gépi tanulási alkalmazások fejlesztéséhez.

 

MRA356 Figure3 1

3. ábra Az NXP i.MX 8M NanoUL kiértékelőkészlet a főbb összetevők kiemelésével (Forrás: NXP)

 


A GT-rendszerek fejlesztéséhez mára már megfelelő erőforrások és fejlesztési platformok jól kialakult ökoszisztémája áll rendelkezésre, alacsony energiaigényű edge MCU-k és nagy teljesítményű MPU-k alkalmazása esetén egyaránt.
A TensorFlow Lite a Google TensorFlow vállalati szintű, nyílt forráskódú GT- keretrendszerének kifejezetten alacsony fogyasztású, kis erőforrás-igényű mikrokontrollerekre szánt változata. Futtatható az Arm Cortex-M sorozatú magokon, memóriaigénye csupán 18 kB. A TensorFlow Lite minden szükséges erőforrást biztosít modellek beágyazott eszközökön történő telepítéséhez.
Az Edge Impulse átfogóbb megközelítést alkalmaz, végponttól végpontig terjedő megoldást kínál, lefedve a betanításhoz szükséges adatok bevitelétől kezdve a feladat ellátásához optimális modell kiválasztásán és a tesztelésen keresztül, egészen az edge-eszközökre történő végső telepítésig. Az Edge Impulse a nyílt forráskódú TensorFlow és Keras GT-keretrendszerekkel működik.

 

A magyarázható mesterséges intelligenciák fejlődése

A beágyazott gépitanulás-alapú rendszerek tervezésének és fejlesztésének elsajátításával a beágyazott rendszerekkel foglalkozó mérnökök tovább fejleszthetik készségeiket. A végalkalmazások specifikációinak kidolgozása és a működés átgondolása kiváló lehetőséget biztosít annak mérlegelésére, miként alkalmazhatók a magyarázható mesterséges intelligenciák elvei a tervezés során. A magyarázható mesterséges intelligencia megváltoztatja mindazt, amit a gépi tanulásról gondolunk, használatukkal a beágyazott rendszerek fejlesztői lényegesen több kontextust, magabiztosságot és megbízhatóságot építhetnek be alkalmazásaikba.

 

MarkSzerző: Mark Patrick – Mouser Electronics

Mouser Electronics
Franchised Distributor
www.mouser.com
Kövessen bennünket Twitteren:
https://twitter.com/MouserElecEU