Hírek
Gép-ész – egy MI robot olyat tud, amit semmi más
Az általános célú robotika korának hajnalát éljük. Több tucatnyi vállalat fektetett hatalmas összegeket olyan humanoid robotokba, amelyek önállóan tudnak eligazodni a meglévő munkaterületeken, és képesek átvenni az emberi dolgozók feladatait.
A robotika területének korai felhasználási esetei egyelőre többnyire a Planet Fitness kategóriába esnek, ami igazából csak annyi jelent, hogy a robotok felemelnek dolgokat, majd leteszik őket valahol máshol.
Az ironikus felhang ellenére ez komoly dolog, nagyszerű eredményeket ad például a raktár jellegű logisztikában, teherautók be- és kirakodásában valamint a súlyos és/vagy nagy méretű dolgok mozgatásában gyári körülmények között. Mindazonáltal ez a képesség meg sem közelíti egy képzett emberi szakmunkás hasznosságát. Ahhoz, hogy ezek a képességek megfelelő mértékben bővüljenek, beinvitálva a robotokat bármely munkahelyre a legkülönfélébb feladatok átvételének okán, szükségük lesz arra, hogy emberi utasítások vagy bemutatók alapján gyorsan tovább tudják képezni saját magukat. A Toyota most nem kevesebbet állít, mint hogy sikerült hatalmas áttörést elérnie egy „diffusion policy”-ra épülő új tanulási megközelítéssel, amely a vállalat szerint megnyitja az utat a nagy viselkedési modellek (large behaviour modellek, LBM-ek) koncepciója előtt.
Már titkos: ebből még nagy siker lehet
A Diffusion Policy egyébiránt olyan koncepció, amelyet a Toyota a Columbia Engineering az MIT-vel közösen fejlesztett ki, és bár a részletei gyorsan nagyon titkossá váltak (profitriadó!), annyit azért elárultak róla, hogy: „a robot viselkedésgenerátora új módon, a saját ‘vizuomotoros’ ellenőrző rendszereinek feltételes diffúziós zajszűrő folyamataként való kezelésével működik”. (A „feltételes diffúziós zajszűrő” kifejezés nem fizikokémiai, hanem a generatív mesterséges intelligencia egyik fő módszere, amelyet jellemzően a képgeneráló szolgáltatások használnak. Erre utal az egyikük neve: „Stable Diffusion”. – A szerk.)
Aki még többet szeretne tudni erről, annak a csoport kutatási dokumentumait ajánljuk olvasgatásra. Míg a ChatGPT-hez hasonló nagy nyelvi modellek (LLM-ek) emberi írások milliárdjait képesek befogadni, és ezek felhasználásával írni és kódolni, a Diffusion Policy az emberekhez már sokkal közelebb álló szinten teszi lehetővé a robotikus mesterséges intelligenciák számára, hogy megfigyeljék, hogyan végez egy ember egy adott fizikai feladatot a való világban, majd lényegében úgy programozzák be saját magukat, hogy rugalmasan le tudják másolni és végre tudják hajtani ezt a feladatot.
Míg egyes startupok VR-távműködtetés (teleprezencia) segítségével tanítják robotjaikat (emberi kezelő távirányíthatja a robot karjait és manipulátorait a feladat elvégzéséhez, és pontosan látja is azt, amit a robot szemei látnak), addig a Toyota megközelítése inkább a haptikus (tapintható) jellemzőkre összpontosít.
A kezelők nem viselnek VR-headsetet, viszont támaszkodhatnak a robot rugalmas manipulátoraitól kapott haptikus visszajelzésekre a kézi vezérlésen keresztül, így bizonyos értelemben „érezni” tudják, mit érez a robot, amikor az „ujjai” érintkeznek a tárgyakkal. A dolog úgy zajlik, hogy egy emberi kezelő többször, kissé eltérő körülmények között megmutatja a robotnak, hogyan kell elvégeznie egy feladatot, majd a robot mesterséges intelligenciája felépíti saját belső modelljét arról, hogy mi is a siker és a kudarc a feladatban, amit kapott, majd a feladat belső modelljei alapján több ezer fizikai alapú szimulációt lefuttatva megkeresi a feladat elvégzéséhez szükséges technikákat.
Este megtanulja, mire megvirrad, már tudja
„A folyamat elején egy tanár egy rövid készségkészletet ad át távműködtetésen keresztül. A mesterségesintelligencia-alapú diffúziós rendszer ezután órákig tanul a háttérben. Gyakran előfordul, hogy délután betanítunk egy robotot, hagyjuk, hogy egy éjszakán át magában tanuljon, majd másnap reggel már egy működő, új viselkedéskészlettel jelentkezik”, mondta el Ben Burchfiel, aki a betanításért felel. A Toyota egy demót is közzétett, amelyben megtekinthetők az eredmények.
A Toyota szerint az idei év végére már több száz feladatot lesznek képesek elvégezni ezek a robotok, 2024 végére pedig több mint 1000 feladatot terveznek megtanítani a gépparknak. A vállalat belefogott az első nagy viselkedési modell, egy olyan keretrendszer megalkotásába, ami végül akár testet adhat a ChatGPT-ben megismert gépi intelligenciának.
Russ Tedrake,a Toyota Kutatóintézet robotikai kutatásért felelős alelnöke elmondta: „Ebben az új megközelítésben az a sebesség és megbízhatóság a legizgalmasabb, amellyel új készségeket lehet adni a gépeknek. Mivel ezek a készségek közvetlenül a kameraképek és a tapintásérzékelés alapján, kizárólag tanult reprezentációkat használva működnek, még olyan feladatokban is képesek jól teljesíteni, amelyekben deformálható tárgyak, ruhák és folyadékokat szerepelnek, amelyek hagyományosan rendkívül nehéz feladatokat jelentettek a robotok számára. Nem kell sok képzelőerő ahhoz, hogy az ötletet olyan keretrendszerré extrapoláljuk, amellyel az ujjakkal és szembefordítható hüvelykujjal rendelkező humanoid robotok is létrehozhatók, az ember számára tervezett eszközök még szélesebb körét véve használatba.”
Forrás: https://itbusiness.hu/technology/ipar-4-0/gep-esz-egy-mi-robot-olyat-tud-amit-semmi-mas/

