magyar elektronika

Elfogadom az adatkezelési tájékoztatóban foglaltakat:*

farnell lidA tárgyak internete (IoT) átalakítja az otthont, és háztartások milliói számára teszi azt élvezetesebbé, hatékonyabbá és biztonságosabbá. Legyen szó a légkondicionálás és a fűtés vezérléséről, a konyhai készülékek vagy az otthoni riasztórendszerek beállításáról, az IoT-képes eszközök csatlakoztathatósága azt jelenti, hogy az emberek bárhonnan irányíthatják otthonukat, ahol éppen tartózkodnak.

 

A mesterséges intelligencia hozzáadása az IoT-hez a fejlett funkciók egész sorát teszi hozzáférhetővé. Az arcfelismerés lehetővé teszi az otthoni riasztórendszer számára, hogy felismerje, ki áll az ajtó előtt, és csak az általa „ismert” személyek nyithatják ki az ajtót. Hasonlóképpen a hangfelismerés még a mobileszközökkel is elbánik, így a háztulajdonos pusztán a kimondott szóval irányíthatja a világítást, a tévét és a vízforralót.

 

Nézd csak ki beszél!

Az arcfelismerő technológia (FRT) a biztonsági rendszerek legnagyobb előrelépése a CCTV kamerák bevezetése óta, és jellemzően a felhasználók hitelesítésére használják személyazonosság-ellenőrző szolgáltatásokon keresztül. A digitális képen vagy videóképen látható emberi arcot egy arcadatbázissal képes összevetni, és úgy működik, hogy egy adott képen az arcvonásokat pontosan meghatározza és megméri. Az arcfelismerés rendkívül sikeres viszonylag kis populációkban, ellenőrzött környezetben.
Az FRT-rendszerek teljesítményét nagymértékben meghatározza az érzékelt kép minősége. További tényezők közé tartozik a környezet – általában az FRT jobban teljesít, ha hasonlóak a környezeti szempontok, például a háttér, a fej mérete és tájolása, a kamera távolsága és a fényviszonyok hasonlóak. A kép „kora” is fontos, mivel az algoritmus jobban teljesít, ha az összehasonlított képek között kevesebb idő telt el. A teljesítmény akkor maximális, ha a személyről készült fájlképet rögzítő kamera hasonló optikai jellemzőkkel rendelkezik, mint a helyszíni képet készítő kamera.
A beszédfelismerés olyan technológiák összességét jelenti, amelyek lehetővé teszik a számítógépek számára, hogy felismerjék a beszélt szavakat, ezek más néven az automatikus beszédfelismerés (ASR), a számítógépes beszédfelismerés vagy a beszédből szöveggé alakítás (STT). Egyes beszédfelismerő rendszerek „betanítást" igényelnek, amelynek során egy személy szöveget vagy egyetlen szót olvas be a rendszerbe. A rendszer elemzi a személy hangját, és azt felhasználva javítja az adott személy beszédének felismerési pontosságát. Ezeket a rendszereket beszélőfüggő rendszereknek nevezik, míg az olyan rendszereket, amelyek nem használnak tréninget, „beszélőfüggetlen" rendszereknek nevezik.
A beszédfelismerő alkalmazások közé tartoznak a hangalapú felhasználói felületek, mint például a hangalapú tárcsázás, a hívásirányítás – például ha „R-beszélgetést szeretnék kezdeményezni” – és a háztartási készülékek vezérlése. A mindennapi életben használt beszédfelismerés ismerős példája az Amazon Alexa. Amikor az időjárásról vagy a futballeredményekről kérdezzük, a megoldás rögzíti a szavakat, és elküldi azokat az Amazon szervereinek, amelyeknek megvan a számítási teljesítményük a hatékonyabb elemzéshez.
A szavakat egyes hangokra bontja, amelyeket aztán összehasonlít egy adatbázissal, hogy eldöntse, melyik szó felel meg leginkább az adott hangkombinációnak. Miután a rendszer képet kap a szavakról, kiválasztja a legfontosabbakat, hogy értelmet adjon a feladatnak. Ha például olyan szavakat ismer fel, mint az „eső” vagy a „hőmérséklet”, akkor megnyitja az időjárás alkalmazást. A szerverek visszaküldik az információkat az Alexának, amely aztán beszélni tud, hogy elmondja, amit tudni szeretne.

 

Felhő vagy lokális?

Az arc- vagy hangfelismerési adatokat feldolgozó MI-rendszer elhelyezésére két fő lehetőség van: a felhőben vagy magán az IoT-eszközön.
A helyi feldolgozás esetében a számítási teljesítménynek az eszközökben való elhelyezése egy nagy, nyilvánvaló előnnyel jár – csökkenti a késleltetést, vagyis az adatoknak a forrástól a célállomásig történő eljutásához szükséges időt, ami nagyobb sebességet eredményez. A helyi feldolgozás eredményeként nincs szükség összeköttetésre, de az alkalmazástól függően sokkal több számítási teljesítményre lehet szükség az IoT-eszközön. Egy ilyen rendszer távoli frissítése nehézkes lehet, mivel a frissítéseket a hardver teljesítménye korlátozhatja. Mindezek mellett egyre fontosabb szempont a biztonság. Az elosztott adatfeldolgozás azt jelenti, hogy kevesebb adat kerül egy központi szerverre, ami csökkenti a kockázatokat. Könnyebb továbbá „lezárni” egy érintett eszközt.
A felhőalapú megoldások esetében az eszköz csatlakoztathatósága elengedhetetlen. Ez a módszer csökkenti a helyi feldolgozási teljesítmény iránti igényt, és megkönnyíti az algoritmusok frissítését vagy fejlesztését, ha sok eszközzel rendelkezik. Hátránya, hogy a szolgáltatás többletköltségekkel járhat, és biztonsági kockázatot jelenthet a potenciálisan érzékeny adatok külső helyszínre történő küldése.
Az egyik köztes lehetőség az IoT-hardverek melletti, helyileg telepített feldolgozórendszer, amelyet néha Edge-nek (peremhálózatnak) neveznek. Ebben az esetben több IoT-csomópont küld adatokat egy Edge-eszközre feldolgozás céljából, ami az eszközön belüli feldolgozás számos előnyét biztosítja, de csökkenti annak szükségességét, hogy minden egyes csomópont nagy teljesítményű számítási kapacitással rendelkezzen.

 

Csináld magad – MI

Az arc- és hangfelismerő alkalmazások elkészítéséhez egy egylapos számítógép, például egy Raspberry Pi is használható. Arcfelismerés esetén a Raspberry Pi képes felismerni az arcokat egy képen, és valós időben azonosítani és feltérképezni a legfontosabb jellemzőiket, így ideális beltéri biztonsági alkalmazásokhoz. A Farnell összeállított egy alkatrészekből álló készletet, amely egyszerűbbé teszi az arcfelismerő alkalmazások létrehozását. A készlet a Raspberry Pi 4-ből, a Raspberry Pi High-Quality kamerából és a Pimoroni Automation HAT kártyából áll.

  • A Raspberry Pi 4 egy 1,5 GHz-es, 64 bites, négymagos ARM processzorral rendelkező kis egylapos számítógépekből álló sorozat. Cortex-A72 processzorral, fedélzeti 802.11ac Wi-Fi, Bluetooth 5, teljes gigabites Ethernet, két USB 2.0 port, két USB 3.0 port és két monitor támogatása egy pár micro Type D HDMI porton keresztül akár 4K felbontásig. A Pi 4 tápellátása USB-C porton keresztül történik.

farnell 3

 

  • A Raspberry Pi kamerája 12,3 megapixeles Sony IMX477 szenzorból áll, amely hátulról megvilágított szenzorarchitektúrán alapul, állítható hátsó fókusszal és C- és CS-bajonettes objektívek támogatásával.

farnell 1

 

  • Pimoroni Automation HAT – Irányítsd és figyeld a világodat Automation HAT a Raspberry Pi számára! A relékkel, analóg csatornákkal, táplált kimenetekkel és pufferelt bemenetekkel (mind 24 V toleráns) most egyszerre rengeteg „finomság“ csatlakoztatható a Raspberry Pi-hez. Ideális az intelligens otthoni és automatizálási projektekhez, intelligens locsolóberendezésekkel látja el az üvegházat, vagy ütemezi a halak etetését.

farnell 2

 

A felismert képeket a felismerés előtt fel kell dolgozni, amire példa a kép szürkévé alakítása. Egy népszerű feldolgozócsomag az OpenCV (Open Source Computer Vision Library), amely a gépi észlelés kereskedelmi termékekben való felhasználásának felgyorsítására és egy közös számítógépes látásalkalmazási infrastruktúra biztosítására szolgál.
Az OpenCV-t elsősorban a képekkel kapcsolatos műveletekben használják, és olyan funkciókban nyújt segítséget, mint az arcok felismerése és azok jellemzői, a képen lévő alakzatok, például körök és téglalapok felismerése, valamint a képeken lévő szöveg, például rendszámtáblák felismerése. Az OpenCV könnyen megtanulható, szinte minden főbb nyelven működik, és ingyenesen használható.
Egy másik, a Farnell által kínált készlet egy gyors út az automatizált otthon építéséhez, amely hangfelismerésen alapul, és olyan háztartási készülékek, mint a világítás, a ventilátorok és a TV-k vezérlésére szolgál. A megoldás Alexa-kompatibilis mobiltelefont vagy Amazon Echo Dotot és egy Raspberry Pi 4 lapot használ. Az Alexa-kompatibilis eszköz elfogadja a hangparancsokat, és ezeket arra használja, hogy a Raspberry Pi laphoz csatlakoztatott relén keresztül be- vagy kikapcsoljon bármilyen otthoni készüléket. Ez a virtuális készlet egy Raspberry Pi 4 és egy Pi-relé lapot tartalmaz.
A Pi-relé lap a nagy teljesítményű eszközök, például motorok és lámpák vezérlésére ajánlott módszer. Négy kiváló minőségű relével és 7 A/240 VAC-ig terjedő terheléssel rendelkezik, amely egy tipikus otthoni készülékkel, például izzókkal, különböző LED-es lámpákkal és ventilátorokkal működhet. A táblán található LED-ek jelzik az egyes relék állapotát, amíg egy 40 tűs Stacking Header segítségével az RPi GPIO-hoz férhet hozzá. Bármilyen terhelés, például fény, csatlakoztatható a relén keresztül, és vezérelhető a Raspberry Pi 4 segítségével.

 

Összegzés

A tárgyak internetét használó eszközök számára nagy teljesítményű számítási és algoritmusokat kínáló mesterséges intelligencia fejlett vezérlési és biztonsági alkalmazásokat kínál az otthoni felhasználók számára, megkönnyítve és biztonságosabbá téve az életüket. Tipikus alkalmazások lehetnek például az arcfelismerés az ajtónyitáshoz vagy a hangvezérlés az automatizáláshoz. Ezeket a technológiákat ma már könnyű megvalósítani nagyon olcsó, könnyen elérhető SBC-ken, mint például a Raspberry Pi.
A cikk leírja, hogy mi szükséges ezen technológiák megvalósításához. Bemutatja az arc- és hangfelismeréshez használt algoritmusokat és a szükséges feldolgozási folyamatokat. Két különböző megközelítés: a fedélzeti mesterségesintelligencia-feldolgozás és a felhőben történő mesterséges intelligencia leírása, valamint előnyeik és hátrányaik elemzése. A cikket a könnyen elérhető eszközök ismertetése zárja, amelyekkel ezek a technológiák Raspberry Pi segítségével telepíthetők. Az ismertetett technikák és megközelítések a mesterséges intelligencia alkalmazásából hasznot húzó alkalmazások széles körére alkalmazhatók.

 

Ankur TomarSzerző: Ankur Tomarműszaki marketing menedzser, Farnell

 

Farnell element14
Ingyenesen hívható telefonszám:
06 80 016 413
Műszaki támogatás e-mailben:
tech-hu@farnell.com
http://hu.farnell.com
www.element14.com