Hirdetés
. Hirdetés

Budapest ML Fórum 2022 - Gépek képzelőerővel

|

Fejlesztői innováción túl ugyanis beruházásokon és törvényi szabályozáson is múlik többek között, hogy a mesterséges intelligencia megannyi technológiája milyen pályát fut be.

Hirdetés

Szóbeli utasításra fotórealisztikus képeket szintetizáló vizuális modellek és csökkentett szénlábnyomú nyelvi modellek, a mesterséges intelligencia lassan körvonalazódó törvényi szabályozása és áttörést hozó, hazai AI fejlesztések a Budapest ML Fórumon. A tavalyi online premier után idén első napján már személyesen is fogadta résztvevőit a BI Consulting konferenciája.

Bár a csevegőrobotok és az önvezető járművek a gépi látással és a szemantikus kereséssel együtt nemcsak az új technológiákat övező lelkesedés csúcsán, hanem az ezt követő kiábrándulás mélypontján is túljutottak, és a Gartner görbéjének (Hype Cycle for AI 2021) azonos szakaszán helyezkednek el, további beérésük és széles körű elfogadásuk, alkalmazásuk üteme az elemző előrejelzése szerint teljesen eltérő lesz - mondta Arató Bence, a BI Consulting igazgatója, aki nyitó előadásában a mesterséges intelligencia helyzetét és trendjeit tekintette át.

Hirdetés

Fejlesztői innováción túl ugyanis beruházásokon és törvényi szabályozáson is múlik többek között, hogy a mesterséges intelligencia megannyi technológiája milyen pályát fut be.

Az AI nagy pénzmágnes, így forráshiány aligha fenyeget. A CBInsights adatai (State of AI 2021) szerint a területre áramló kockázati tőke összege tavaly például az egy évvel korábbi kétszeresére nőtt, így elérte a 66,8 milliárd dollárt. A több mint 2800 megkötött üzlet közül három értéke is meghaladta az 1 milliárd dollárt. A Stanford Egyetem jelentésében (2022 AI Index) még ennél is nagyobb összeg, 93,54 milliárd dollár szerepel, de a duplázás stimmel. Az évente közreadott elemzés szerint az újonnan finanszírozott cégek száma 2018 óta csökkent, de a trend megtorpanni látszik. Az ebbe a kategóriába sorolt AI startupok száma ugyanis tavaly és tavalyelőtt is 750-hez közelített.

Idén áprilisban egy hazai rekord is született ezen a téren. A csalásmegelőző technológiát fejlesztő SEON - amelynek megoldásait a Revolut, a Wise és a Patreon is használja - 94 millió dolláros, azaz több mint 32 milliárd forintos tőkeinjekciót kapott. Magyar startupba ekkora bizalmat még soha nem helyeztek befektetők.

A pénz azonban nem minden. A mesterséges intelligencia mind nagyobb szerephez jut az élet minden területén, nemcsak a szervezetek, a vállalati folyamatok működésére és az üzleti döntéshozásra, a tudományos kutatásra, hanem fogyasztási szokásainkra - közöttük tartalomfogyasztási szokásainkra, így gondolkodásmódunk formálására -, hivatalos ügyeink intézésére és orvosi ellátásunkra is egyre nagyobb hatással van, miközben a technológia fekete dobozként működik. Többségünk számára nehezen magyarázható, hogy miként jut felismerésekre, és azt is tapasztaljuk, hogy sokszor elfogultnak bizonyul.

Tavaly áprilisban ezért az Európai Bizottság törvénytervezetet (EU AI Act) tett közzé, amelyben a mesterséges intelligencia használatának szabályozását javasolja az unióban. A leendő törvény mostani formájában négy kockázati szintre sorolná be az alkalmazásokat, és ennek megfelelően engedélyezné, követelményekhez kötné, illetve tiltaná őket.

Mint arra a fejleményeket kísérő és elemző Future of Life Institute rámutat, a szabályozás folyamata rendkívül bonyolult, ezért hosszas lesz, mint azt a GDPR esetében is láttuk. Ugyanakkor az általános adatvédelmi rendelethez hasonlóan az uniós AI törvény is globális szabvánnyá válhat, amely a világ számos országában is segít majd meghúzni a határt, amelyen túl a mesterséges intelligencia inkább negatív, mint pozitív hatással lenne az emberek életére.

Nyelvi és vizuális modellek zárt-nyílt világa

Az OpenAI 2020 szeptemberében több évre szóló megállapodás keretében licencelte nagy teljesítményű, általános célú GPT-3 nyelvi modelljét a Microsoftnak, hogy azt a szoftvercég termékeibe és szolgáltatásaiba építse - emlékeztetett rá előadásában Arató Bence. Tavaly novemberben így megjelent az Azure OpenAI Service, amely az OpenAI API-ján keresztül a GPT-3-hoz ad hozzáférést, de azt a Microsoft felhőplatformjára épülő biztonsági, rendelkezésre állási, megfelelési, adatvédelmi és más, nagyvállalati szintű, azaz fizetős szolgáltatásokkal övezi.

Bár az OpenAI API-ja 2020 júniusától hozzáférhető, és ezen a Microsofttal kötött megállapodás nem változtatott, a lépést nem mindenki üdvözölte. Idén februárra az Eleuther.ai el is készítette a nyílt forráskódú alternatívát, a 20 milliárd paramétert tartalmazó GPT-NeoX-20B nyelvi modellt, amelyet saját GPT-NeoX keretrendszerével, a CoreWeave grafikus processzorait használó gépeken tanított. Az Eleuther.ai szerint jelenleg ez a legnagyobb, nyilvánosan hozzáférhető, előtanított, általános célú, autoregressziós nyelvi modell, amely méreténél és széles körű elérhetőségénél fogva segítheti az AI rendszerek biztonságos alkalmazását célzó kutatásokat. A cég várja az ilyen irányú munka iránt érdeklődők jelentkezését, és a GPT-NeoX-20B demója a CoreWeave és az Anlatan goose.ai szolgáltatásán keresztül is kipróbálható.

Sokan aggodalommal nézik azonban a mind nagyobb nyelvi modellek óriásira növő szénlábnyomát. Figyelmet érdemelnek ezért a párhuzamos feldolgozás lehetőségeit kiaknázó, transzformer modellekre építő fejlesztések, amelyek lerövidítik a tanulás idejét, és kisebb adatkészleteken is nagy pontosságot érnek el. A szükséges számítási kapacitást optimalizáló, ezáltal a mesterséges intelligencia szénlábnyomát csökkentő fejlesztések közé tartozik a DeepMind Chinchilla 70 milliárd paramétert tartalmazó nyelvi modellje, amely felveszi a versenyt a nála sokkal nagyobb, több száz milliárd paramétert tartalmazó Gopher és Megatron-Turing NLG modellekkel is.

Az OpenAI eredetileg 2021 januárjában mutatta be DALL-E vizuális modelljét, amely szöveges promptokból generált képeket. Friss verziója a DALL-E 2, amely idén januárban debütált, és ezt a képességet mesterfokra emeli. Nemcsak hiperrealisztikus képeket generál akár nem létező dolgokról, hanem meglévő képeket is hasonló minőségben módosít, szóban adott utasítások szerint. Rossz kezekben nyilván pofonegyszerűvé tenné a deepfakegyártást, és ennek elejét kellene venni valahogyan. A DALL-E 2-nek azonban az AI további fejlődése és megbízható, biztonságos alkalmazása szempontjából óriási a jelentősége. A képpontdiffúziós technológiával dolgozó vizuális modell addig keveri a pixeleket, amíg a létrejövő képen tudása alapján felismeri a kívánt dolgokat, így azt is látványosan megmutatja, hogy a mesterséges intelligenica ért-e bennünket, jól tanítottuk-e ehhez a rendszert.

A DALL-E 2 egyelőre zárt körben próbálható ki, de a Githubon már létrejött egy csoport, hogy az OpenAI szövegből képet szintetizáló neurális hálózatát PyTorch nyílt forráskódú keretrendszerben implementálja - és várja az érdeklődők csatlakozását.

MI - magyar intelligencia

Két további, áttörést hozó hazai AI-fejleményre is kitért előadásában a BI Consulting igazgatója. A Budapest ML Fórumon is előadó OTP Csoport tavaly novemberben jelentette be, hogy stratégiai együttműködésre lép a kaliforniai SambaNova Systemsszel, és megépíti Európa leggyorsabb szuperszámítógépét a világ egyik legfejlettebb nyelvi modelljének megalkotásához. A bankcsoport ehhez a SambaNova helyben telepített rack szervereit és felhőben elérhető Dataflow-as-a-Service GPT nyelvi modelljét is használni fogja.

A felhőben a munka napok vagy hetek leforgása alatt megkezdhető, a helyben telepített szerverekre pedig azért lesz szükség, hogy a nyelvi modellt használó alkalmazások a felhőbe nem vihető ügyféladatokkal is tudjanak dolgozni, mondta az OTP. Az elsőként elkészülő magyar nyelvi modult azon országok egyedi nyelvi moduljai követik majd, amelyekben a bankcsoport jelen van. A fejlesztés nyomán az ügyfélszolgálattól kezdve a háttérfeladatokat ellátó back-office-ig jelentős változások indulhatnak el az OTP működésének számos területén. Az Innovációs és Technológiai Minisztérium segítségével emellett a köz- és a magánszféra, valamint a felsőoktatás szereplői is elérhetik majd az AI-megoldást.

HuSpaCy néven azonban már idén áprilistól szabadon hozzáférhető egy magyar nyelvi elemző rendszer, amelyet a SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói készítettek. A rendszer az üzleti gyakorlatban is használható erőforrásigénnyel és integrálhatósággal dolgozik.

A mélytanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával ötvöző HuSpaCy mondatok teljes nyelvi elemzésére és névelemek folyó szövegben történő azonosítására is alkalmas. A rendszerre így természetes nyelvi kezelőfelületként szolgáló, hangalapú vagy írásos csetbotok építhetők (ilyeneket a MILAB is fejleszt), de szövegkategorizálásra - például ügyfélszolgálatra beérkező panaszok automatikus leválogatására -, információ kinyerésére és szövegek automatikus generálására is használható. Demója online kipróbálható.

Tekintve, hogy mindkét projekt kormányzati részvétellel fut, bennünk azért felötlött, hogy az erőforrások összevonásával esetleg még gyorsabb és nagyobb előrelépést lehetne elérni egy kis nyelv nagy modelljének fejlesztésében. De reméljük, hogy két magyar nyelvi AI rendszer versenyéből is csupa jó dolgok fognak születni.

Hardverek, szoftverek, tesztek, érdekességek és színes hírek az IT világából ide kattintva!

Hirdetés
0 mp. múlva automatikusan bezár Tovább az oldalra »

Úgy tűnik, AdBlockert használsz, amivel megakadályozod a reklámok megjelenítését. Amennyiben szeretnéd támogatni a munkánkat, kérjük add hozzá az oldalt a kivételek listájához, vagy támogass minket közvetlenül! További információért kattints!

Engedélyezi, hogy a https://computerworld.hu értesítéseket küldjön Önnek a kiemelt hírekről? Az értesítések bármikor kikapcsolhatók a böngésző beállításaiban.