Hirdetés

Fel nem ismert hendikep

|

A magyar kis- és középvállalatok már a rajtnál lemaradhatnak, ha nem élnek a big datában rejlő lehetőségekkel. Ráadásul az Európai Unió Általános Adatvédelmi Rendelete, a GDPR ezen a téren is ró kötelezettségeket a cégekre. Első a szemléletváltás, de természetesen kellenek a hozzáértő adattudósok is. Ez utóbbi nem is olyan nagy probléma, mint elsőre hinné az ember.

Egy tavalyi felmérés szerint a hazai vállalatok csaknem fele alig alkalmaz bigdata-analitikákat. Ezzel egyrészt kiaknázatlanul maradnak a cég szellemi és fizikai erőforrásai, másrészt a vállalat óhatatlanul hátrányba kerül a korszerű megoldásokra fogékony versenytársaival szemben. Vajon milyen fő okok állnak a big datára épülő módszerek figyelmen kívül hagyása mögött? A probléma hátteréről, az adatelemzésben rejlő lehetőségekről, valamint a jelenlegi helyzet megváltoztatását célzó teendőkről Kazi Sándor big data architect (DBArt Kft.), a Műegyetem oktatója nyilatkozott a Computerworldnek.

Hirdetés

KAZI SÁNDOR: A hazai kis- és középvállalatok alapvetően két okból nem alkalmaznak bigdata-analitikákat. Először azért, mert nem is tudják, hogy ezáltal monetarizálható értéket kapnának. A másik ok, hogy tényleg nem is kapnának, mivel adatkultúrájuk nem tart ott, hogy elemzéseket végezzenek. Magyarul: ahhoz, hogy adatokat tudjanak elemezni, először olyan minőségben kellene adatokat gyűjteniük, hogy azok elemezhetőek legyenek. A kisebb cégeknél általában már az adatgyűjtés is hiányzik, a nagyobbaknál jellemzően a tájékozatlanság a fő probléma, azaz fogalmuk sincs, mit kezdhetnének az adatokkal.

COMPUTERWORLD: Mi a teendője egy vállalatnak, ha felismeri a big datában rejlő lehetőségeket, és cselekvésre szánja el magát?

KS: Egy szervezet adatkultúrájának alapvetően nyolc szintjét szoktuk megkülönböztetni. Célszerű a legalsó szinten kezdeni, és fokozatosan haladni fölfelé. A tapasztalat azt mutatja, hogy be lehet ugrani azonnal a harmadik vagy negyedik szintre is, de mondjuk a nyolcadikon nem ajánlott kezdeni. A legalsó szint, amikor a vállalat képes standard riportokat készíteni, azaz megbízható számadatokat hozzárendelni számára ismert fogalmakhoz. Az adatfelhasználás második szintjét az ad hoc riportok képezik. Itt már kérdések feltevésére is lehetőséget teremt az összegyűjtött adatmennyiség, illetve az ehhez tartozó infrastruktúra. Rá lehet például kérdezni arra, hogy miként változtak meg az adatok egy adott hónapban az előző havi értékekhez képest. A harmadik szinten már meg lehet keresni bizonyos érthetetlen jelenségek okait. Egy negyedik szintű rendszer már figyelmeztetéseket ad, ha valami rendellenesség történik, azaz nincs szükség a kimutatások folyamatos figyelésére. Az ötödik szinten statisztikai kimutatások készülnek, a hatodikon előrejelzések születnek arról, hogy egy-egy érték várhatóan hogyan alakul majd. A hetedik szintre tartozó rendszer már az eseményeket is előrejelzi, míg a nyolcadik, az optimalizáció szintjén a szervezet az adatai alapján optimalizálhatja saját folyamatait. Általában azt javasoljuk, hogy már az első szint meglépésekor készítsék elő a vállalatok a második szintet, azaz teremtsék meg a lehetőséget új kérdések megfogalmazására. Alapvetően így szoktuk támogatni az adatvezérelt döntéshozást, így indul el az adatvezérelhető kultúra. Megjegyzem, hogy a gépi tanulási és statisztikai módszerek a negyedik szinttől fölfelé használhatóak, azaz amikor már mesterséges intelligenciát is igénybe vesznek ehhez a tevékenységhez, az már az ötödik szintnek tekinthető.

CW: Megváltoztatják a nagyadat-elemzések a döntéshozatali folyamatokat?

KS: Alapvetően az összes analitikai módszer oda vezet, hogy a döntésekhez szükséges azon tudást, amit egy szakember hat-hét év alatt szerzett meg, a big datából dolgozó gépi tanulási algoritmusok sokkal gyorsabban bocsátják rendelkezésre. Ha minden szükséges adatot becsatornáznak a rendszerbe, gyorsan megszületnek a döntésekhez szükséges szabályosságok. A gépi tanulás természetesen nem válthatja ki a szakértőt, abban viszont támogathatja, hogy döntéseit ne zsigerből, megérzések alapján, hanem számadatokra alapozva hozza meg.

CW: Mely területeken volna a legnagyobb szükség a big datában rejlő lehetőségek kihasználására?

KS: Ott, ahol már most is valamilyen szinten adatokra támaszkodnak. Idetartozik például a pénzügy, a HR, mindenfajta szállítmányozással, raktározással foglalkozó terület, a kereskedőhálózatok, a bankok és biztosítók, de akár a vegyészet is, ahol egy-egy kutatásnál számtalan kombinációt kell megvizsgálni. Ahol már eleve foglalkoznak adatokkal, ott viszonylag könnyebb belevágni a mélyebb elemzésbe. Ott azonban, ahol alapvetően nincs még adatgyűjtés, vagy valami gátolja annak bevezetését, nehezebb a helyzet. Tipikusan ilyen az ingatlanpiac, ahol az ügynökök nem érdekeltek az átláthatóságban, ezért féltik az adataikat. A vezetők természetesen igényelnék a standard és ad hoc riportokat, de maguk a résztvevők ellenállnak, így az adatgyűjtés általában meghiúsul. Mindenki úgy gondolja, hogy saját adataiban van a számára monetarizálható érték, és nem engedi ki azokat a kezéből, azaz ellehetetleníti a különböző adathalmazok összekapcsolását. Ezzel szemben két összekapcsolható adathalmaz együttese nagyobb értéket képviselhet, mintha azok elkülönítve maradnak.

CW: Indokolhatja a bigdata-analitika bevezetésének elodázását, hogy egy-két év múlva esetleg kisebb lesz az egyszeri és az üzemeltetési költség?

KS: A big data területnek elég sok aspektusa van. Nagyon változó, hogy valakinek mire van szüksége; csak analitikára, vagy teljes adattároló infrastruktúrára, mert olyan nagy mennyiségű vagy olyan bonyolult az adatstruktúrája, amihez valamilyen speciális eszközt kell beszereznie. Éppen ezért előfordulhat, hogy a nagyon kis kezdeti befektetést folyamatos, enyhén növekvő ráfordítás követi, de előfordulhat

ennek a fordítottja is. A tárhelykapacitás ára folyamatosan csökken, de már most meglehetősen csekély, az analitikai módszertan pedig már sokéves múltra tekint vissza, kellően kiforrott. Ezekből a szempontokból tehát nincs mire várni. A big datával kapcsolatos döntések előtt általában azt mérlegeli az ember, mire is fogja használni a kapott információt. Adatok hiányában azonban ezt nem lehet pontosan megmondani. Az első lépés tehát a gyűjtés megtervezése és elindítása. Az adatgyűjtés sok esetben fél vagy akár egy évvel is megelőzheti annak pontos meghatározását, hogy mi történjék az adatokkal. Az analitikai módszerek bevezetésének késleltetését tehát inkább az a kényszer okozza, hogy nem áll elegendő adat a vállalat rendelkezésére. Természetesen vannak, akik nem várhatnak. Ilyenek például a bankok. Ezek sok esetben megvásárolják azokat az adatokat, kimutatásokat, amelyek a működésükhöz - például a hitelnyújtáshoz - elengedhetetlenek, és amelyek alapján elvégezhetik a szükséges analízist.

CW: Befolyásolhatja-e a big data területén zajló folyamatokat a GDPR jövő májusi, kötelező alkalmazása?

KS: Természetesen. Ez az egyik legerőteljesebb befolyásoló tényező. Egyrészt a GDPR azon passzusára gondolok, amely előírja, hogy az ügyfél kérésére lehessen törölni annak adatait, másrészt arra, hogy adott esetben a szolgáltató köteles anonimizálni felhasználói adatait. Ez utóbbi súlyos dilemmákat vet fel, ugyanis a teljes anonimizálás értéktelenné teheti az összegyűjtött adatokat a szervezet számára, ha viszont az adatbázis továbbra is tartalmaz a személyek azonosítására alkalmas információkat, akkor komoly büntetésre számíthat a vállalat. Olyan kompromisszumot kell tehát találni, hogy az adatokban minél több felhasználható információ maradjon, ugyanakkor ne álljon fenn a büntetés veszélye. A megoldás tipikusan a személyi adatok anonimizálásában, a nevek és címek cseréjében, illetve az adatok folyamatos roncsolásában rejlik. A megfelelés az európai adatvédelmi szabályoknak óhatatlanul maga után vonja a vállalati kultúra módosítását is. Előírás például, hogy a cégek foglalkoztassanak adatvédelmi biztost. Ez természetesen nem azt jelenti, hogy egy tízfős kisvállalatnak teljes munkaidős, főállású adatvédelmi biztosra van szüksége, de a feladatra kijelölt személynek adatvédelmi képzésen kell részt vennie.

CW: Van elég adattudós, aki a vállalatok szolgálatába tudja állítani a big datát?

KS: Európai viszonylatban a magyar piac minden szempontból erősnek számít. Az adattudós-gondolkodás elsősorban biztos matematikai alapokat, matematikus gondolkodást feltételez. Ezen a téren igen jól állunk, ugyanis nyolc-tíz évvel ezelőtt kiemelkedő volt a hazai matematikaoktatás. Azaz, aki tehetséges és/vagy szorgalmas, magas szintre volt képes eljutni, emellett a legtöbb műszaki jellegű képzésen igen nagy szerepet kapott a matematika olyan aspektusa is, amely nem feltétlenül volt közvetlenül szükséges az adott szakma elsajátításához. A munkaerő-piaci igények természetesen formálják ezt valamelyest, például rövidülnek a képzések, ráadásul többnyire az elméleti, és így a matematikai tudás rovására. Mivel kevés olyan hely van, ahol közvetlenül adattudósokat képeznek, a jellemző gyakorlat Magyarországon - akárcsak más országokban -, hogy más területen dolgozókat képeznek át adattudóssá. Olyan személyekre kell itt gondolnunk, akik az illető területen dolgoznak, van üzleti ismeretük, és konyítanak valamit a matematikához.

Az üzleti tudás ugyanis nagyon fontos ahhoz, hogy valaki megfelelő modelleket tudjon építeni, és megfelelően tudja az adatokat elemezni. Ilyen irányú átképzésekre már több példa is van. Emellett az egyetemek is észrevették a növekvő igényt az adattudósok iránt, ott is megtalálhatóak már az adattudós-képzés csírái, de a nagy, hagyományos szervezetek értelemszerűen lassabban reagálnak. Az adattudós tehát jöhet az üzlet vagy a matematika oldaláról, a lényeg, hogy rendelkezzen mindkét ismerettel. Legalábbis a legtöbb esetben ez az elvárás. A nagy projekteknél ugyan előfordulhat, hogy az adattudós üzleti ismeretek nélkül is el tudja végezni a feladatát, de ez még nem jellemző Magyarországon.

Hirdetés
Hirdetés
0 mp. múlva automatikusan bezár Tovább az oldalra » Advertisement

Úgy tűnik, AdBlockert használsz, amivel megakadályozod a reklámok megjelenítését. Amennyiben szeretnéd támogatni a munkánkat, kérjük add hozzá az oldalt a kivételek listájához, vagy támogass minket közvetlenül! További információért kattints!

Engedélyezi, hogy a https://computerworld.hu értesítéseket küldjön Önnek a kiemelt hírekről? Az értesítések bármikor kikapcsolhatók a böngésző beállításaiban.