Hirdetés
. Hirdetés

Mély legyen a tanulás, vagy sekély?

|

A gyorsan fejlődő mélytanulás új távlatokat nyit az analitikában, de a technológiával, mint általában a mesterséges intelligenciával szemben ma is gyakran túlzottak az elvárások, mondta Stephen Brobst, a Teradata technológiai igazgatója a Budapest BI Fórum 2017 nyitóelőadásában.

Hirdetés

Egyáltalán nem biztos, hogy minden feladatra a legnagyobb adat- és teljesítményigényű eszközt kell választani, sok esetben az egyszerűbb gépi tanulással, még inkább a két megközelítés együttes alkalmazásával érhető el jobb eredmény.

Hirdetés

Negyven százalékkal több előadást kínált a Budapest BI Fórum 2017: a korábbi években megszokott kettő helyett immár három szekcióban, mondta Arató Bence, a konferenciát szervező BI Consulting ügyvezető igazgatója. Évről évre nő a hazai és a külföldi résztvevők száma is, hiszen a 2013-as induláskor regisztrált 144 főhöz mérten idén elérte a 275-öt, és a látogatók között első ízben Máltáról érkezett szakemberekkel is találkozhattunk.

Több mint kétszáz nevezés és ötvennél több pályamunka futott be a rendezvénnyel párhuzamosan megrendezett adatvizualizációs versenyre - a szakmai zsűri által legjobbnak ítélt tíz induló a konferencia harmadik napján a közönség előtt mérkőzött meg a döntőben. Az adatelemzés, az üzleti intelligencia és az analitika iránt mutatkozó, folyamatosan növekvő érdeklődésre utal az is, hogy két éves konferenciája - a júniusi Budapest Data Fórum és a novemberi Budapest BI Fórum - mellett a BI Consulting már három szakmai estet (meetupot) is tart a BI, a Big Data és a PyData közösségének. Az utóbbi technológia idén először külön szekciót kapott a Budapest BI Fórum programjában is, melynek szervezésében a nyílt forráskódú innovációt a tudományos szférában népszerűsítő NumFOCUS alapítvány működött közre.

Arató Bence, a BI Consulting ügyvezetője a Budapest BI Fórum 2017 konferencián

Döntéshozás gombnyomásra
Új korszakába lépett az analitika fejlődése, amikor a gépi tanulás (machine learning, ML) és a mesterséges intelligencia (artificial intelligence, AI) algoritmusai végre valóra váltották az öntanuló rendszerek ígéretét. Ennek köszönhetően a problémamegoldás újfajta megközelítéseit alkalmazhatjuk a gyakorlatban, és a minden eddiginél nagyobb, strukturálatlan és zajos adattömegek nagy teljesítményű feldolgozásával túlléphetünk a korábban fejlettnek tartott analitika korlátain. Ahhoz azonban, hogy a vállalatok valóban sikeresek legyenek ezen a téren, világosan meg kell érteniük, meddig terjednek az új technológiák lehetőségei, és hol húzódnak korlátaik - mondta Stephen Brobst, a Teradata technológiai igazgatója a konferencia második napján elhangzott nyitóelőadásában.

Míg a 90-es években a jelentések, az elemzések és az előrejelzések elkészítéséhez az adatokat nem kellett különösebben előkészíteni, az ezredfordulón az adattárházak fejlődésével a helyzet változott. A szervezetek egyre nagyobb és összetettebb adathalmazból igyekeztek mind bonyolultabb lekérdezésekkel értékes információkat kinyerni, méghozzá a munkafolyamatok lépéseihez igazodva, lehetőleg minél gyorsabban.

Ez olyannyira nem ment könnyen, hogy az idő mind nagyobb részét - végül már 80-90 százalékát - az adatok előkészítése emésztette fel.

Új megközelítés vált szükségessé a 2010-es évekre, amellyel az üzleti betekintés, a döntéseket megalapozó tudás megszerzésének folyamata minél nagyobb mértékben automatizálható és tovább gyorsítható, akár valós idejűvé tehető. A feldolgozási teljesítmény és a tárkapacitás növekedése, a GPU-k használata és a költségek csökkenése, valamint a változatos forrásokból - szenzorokról, közösségi hálókról, köztéri kamerákról stb. - begyűjthető adattömeg robbanása oda vezetett, hogy a mesterséges intelligencia alkalmazásával ez végre lehetővé vált.

Az utóbbi pár évben különösen látványos a fejlődés ezen a téren, ami persze a várakozásokat is felfokozza és eltúlozza. A Gartner elemzésében (Hype Cycle for Artificial Intelligence, 2017) arra figyelmeztet, hogy az AI iránti lelkesedés a tetőfokára hágott, amit könnyen kiábrándulás, a mesterséges intelligencia tele követhet. A kategóriába tartozó mélytanulás (deep learning, DL) jelenleg az új technológiák életciklusát követő görbe csúcsán áll, a gépi tanulás és az adatkutatás viszont már elindult a lejtőn, bár még nem süllyedt olyan mélyre a hullámvölgybe, mint a big data. Ezzel együtt a Gartner BI Summit 2017 konferenciáján közzétett felmérési adatok szerint 2020-ra az IT-vezetők 30 százaléka az AI-t az öt legfontosabb beruházási terület közé fogja sorolni. Brobst szerint - akit az ExecRanks több mint tízezer fős tagsága az Egyesült Államok negyedik legbefolyásosabb technológiai igazgatójává választott - a világ ötszáz legnagyobb vállalatát véve alapul ez az arány már ma is magasabb.

Tisztán kell látni azonban az AI eredményes alkalmazásához, melyik technológiát milyen feladatok megoldására érdemes bevetni. Az ML-implementációk 95 százaléka például lineáris regressziós algoritmusokra épül, amelyek az egyszerűbb, kétdimenziós adatok közötti összefüggések feltárásában jeleskednek, és az irányított tanulás kiváló eszközei. Az ilyen egyszerű felépítésű, úgynevezett széles (vagy sekély) neurális hálózatokkal szemben a mélytanuló neurális hálózatok, amelyek architektúrája sok rejtett réteget tartalmaz, a sokdimenziós (kép, hang, videó, idősor, szöveg) adattömegek elemzésében, nonlineáris kapcsolatok fellelésében bontakoztatják ki képességeiket - de ennek megfelelően jóval nagyobb feldolgozási és tárkapacitást feltételeznek, vagyis többe kerülnek. A DL egyik első és ma is meghatározó alkalmazási területe a képanalitika, az objektumosztályozás, amiben 2,99 százalékos hibaarányával már felülmúlja az ember pontosságát. Kirajzolódnak azonban a technológia újabb használati esetei is. A Gartner szerint 2019-re már a DL lesz a legnagyobb teljesítményű megoldás az igények, a csalások és a meghibásodások előrejelzésében.

Mindebből következik, hogy gyakran a sekély- és a mélytanulás együttes alkalmazásával érhető el a legjobb eredmény. Egy webshopban vagy alkalmazásboltban például az egyszerűbb feladatok megoldására termett ML-lel is javítható a keresések pontossága, míg az ügyfeleket nagyobb valószínűséggel további vásárlásra ösztönző, személyre szabott ajánlatok megtételében a DL-re érdemes támaszkodni.

Olyan gyorsan fejlődnek a mesterséges intelligencia technológiái, hogy a kereskedelmi forgalomban, dobozban kapható megoldások két évvel az élvonalat képviselő nyílt forráskódú eszközök mögött kullognak. Brobst ezért azt tanácsolta hallgatóságának, hogy az ML és a DL együttes alkalmazásában építsenek nyílt forráskódú szoftverekre és általános célú hardverre, törekedjenek az automatizálásra, valamint fektessenek hangsúlyt az emberi tanulásra is, mert az AI mellett mindig újabb képességekre lesz szükségük.

Adatkutatók aranyélete
Nem könnyíti meg az adott feladat megoldására legalkalmasabb BI-, analitikai vagy AI-megoldás kiválasztását az eszközök és módszerek lendületes fejlődése, mint ahogy az sem, ahogyan a piacelemzők értékelik és összemérik őket. A Gartner például tavaly változtatott korábbi szempontrendszerén, amikor összeállította mágikus négyzetét (2016 Magic Quadrant for BI and Analytics Platforms), így több, addig vezető szállító, közöttük az IBM, az SAP, a SAS a vizionárusok négyzetébe került, átadva helyét az újgenerációs, kimondottan önkiszolgálásra és fejlett adatvizualizációs képességekre építő eszközöket fejlesztő Microsoftnak, Qliknek és Tableau-nek. A mágikus négyzet idei kiadásában változatlanul ez a felállás, de a Gartner ugyanezen területet elemző másik tanulmányában (BI Frontrunners) már más szereplők a vezetők, mivel itt a kis- és középvállalatoknak szánt megoldások kerültek górcső alá. A Forrester pedig két különböző listán rangsorolja a nyilvános felhőben elérhető és a házon belül bevezethető analitikai megoldásokat.

Mindez arra figyelmeztet, hogy nem szabad egyetlen piacelemző véleményére támaszkodni, amikor a vállalat BI-, analitikai és AI-technológiát, eszközkészletet választ - mondta Arató Bence a konferencia harmadik napján megtartott nyitóelőadásában. Egyébként maguk a piacelemzők is hangsúlyozzák, hogy nem konkrét beruházáshoz adnak tanácsot, hanem általános szempontrendszer alapján értékelnek.

Ezzel együtt még sohasem volt olyan jó adatokkal foglalkozó BI-szakembernek lenni, mint napjainkban, tette hozzá. Szállítói oldalról ömlik a pénz a területre, a piacvezető megoldások fejlődése az utóbbi két-három évben hihetetlenül felgyorsult. A Microsoft kezdte diktálni a tempót a Power BI havi frissítéseivel - amelyekre szükség is volt, hogy felzárkózzon az élvonalhoz. A Qlik idén jelentette be, hogy évente öt frissítést fog kiadni, és megszünteti a verziószámozást, míg a Tableau-ről egyelőre csak híresztelik, hogy erre a modellre áll át, de ez minden bizonnyal hamarosan bekövetkezik. Nem kell többé éveket várni a funkcionalitás bővülésére, mert az új képességek pár hónap leforgása alatt elérhetővé válnak.

A kiélezett versenyben a szállítók ráadásul árat csökkentenek, és egyre rugalmasabb licenc-, illetve előfizetői konstrukciókkal keresik a felhasználók kegyeit. A vállalatoknak így nem kell nagy értékű beruházással elkötelezniük magukat valamely technológia mellett, kicsi próbaprojekttel indulhatnak, és ha sikeresnek bizonyul a megoldás, azt igény szerint felméretezhetik. További előny, hogy az újgenerációs eszközök szinte kivétel nélkül ingyenesen is kipróbálhatók, továbbá kiterjeszthetők, alkalmazásprogramozási interfészeken keresztül még akkor is lehet hozzájuk fejleszteni, ha forráskódjuk zárt, a nyílt forráskódú megoldások pedig szabadon alakíthatók.

Ha ez a bőség önmagában nem lenne elég, akkor ráadásként az sem utolsó dolog, hogy az adatokkal foglalkozó szakemberek a legkeresettebbek közé tartoznak a munkaerőpiacon, és ezt bérezésük is tükrözi.

Hirdetés
Ügyfélszolgálati változás!
0 mp. múlva automatikusan bezár Tovább az oldalra »

Úgy tűnik, AdBlockert használsz, amivel megakadályozod a reklámok megjelenítését. Amennyiben szeretnéd támogatni a munkánkat, kérjük add hozzá az oldalt a kivételek listájához, vagy támogass minket közvetlenül! További információért kattints!

Engedélyezi, hogy a https://computerworld.hu értesítéseket küldjön Önnek a kiemelt hírekről? Az értesítések bármikor kikapcsolhatók a böngésző beállításaiban.