Hirdetés

Adatban nagyok Magyarországon

|

A hazai piac, szereplőivel együtt, túl kicsi a nagy adathoz - gyakran hallhatjuk ezt még napjainkban is. A Budapest Data Forum előadásaiból ítélve azonban - big datáról lévén szó, egyáltalán nem szokatlan módon - ennek éppen az ellenkezője lehet igaz.

Öt magyar startup példájával is alátámasztotta ezt Arató Bence, a múlt heti konferenciát szervező BI Consulting ügyvezetője. Az elmúlt öt évben ezek a feltörekvő cégek – Enbrite.ly, Gravity, Radoop, SequenceIQ és SSP – nemzetközi sikereket értek el bigdata-megoldásaikkal.

Hirdetés

A nyitó előadás témaválasztása is jelezte, hogy a korábban Adattárház Fórum néven ismert konferencia az adattárházak és a big data területe mellett immár az adatkutatás (data science) témakörével is kiemelten foglalkozik. A szoftverfejlesztéshez elsősorban szellemi tőke szükséges – a kezdeti szakaszban legalábbis –, ezen a téren szakmai felkészültséggel és jó ötlettel a tarsolyában bárki megteheti az első lépéseket a nagy üzleti áttörés felé. Az érdeklődés homlokterében álló adatkutatás kétszeresen is nagy lehetőségeket kínál informatikusainknak, mert – mint azt Stephen Brobst, a Teradata technológiai igazgatója tapasztalataiból kiindulva megállapította, és pár beugratós feladvánnyal újfent sikerrel letesztelte előadásának felvezetőjében –, a magyarok jó matematikusok.

Jól kérdezni nehezebb
...mint jól válaszolni, tette hozzá azonban Stephen Brobst. Elveszni az adatok tengerében a legkönnyebb. A vállalatoknak nem szabad alábecsülniük az adatbőség zavarának veszélyét, áldozniuk kell az értelmes és sikeres adatkutatáshoz szükséges előfeltételek megteremtésére.

Sok nagyvállalat épített adattárházat, amelynek szolgáltatási szintekkel meghatározott működése a BI-elemzőket szolgálja jól. Az adatkutatók más munkamódszerekkel dolgoznak, nem válaszokat keresnek, hanem kérdéseket. Számukra lehetővé kell tenni az önkiszolgálást, hogy a kívánt adatkészleteket maguk vonhassák be az elemzésekbe, igény szerint és gyorsan. Egyik meghatározása szerint az innováció ugyanis nem más, mint próbálkozások és kudarcok, tévedések sorozata, de gyorsan és olcsón kell tévedni, és mindebből tanulni. Ehhez egységes adatarchitektúrára lesz szüksége a vállalatnak, amelyben a központi adattározó a BI-elemzőket és az adatkutatókat, az adattárházat és az adatfelfedezést is kiszolgálja. Ebben az architektúrában az adatkutatók felfedezései az adattárházon keresztül az üzleti területek számára is hozzáférhetővé tehetők, így az innováció nem kallódhat el, nem válik öncélúvá.

Hirdetés

 

A matematika és a kreativitás, a tudomány és a művészet együttes erejével nyert betekintés megosztásakor egy kép ezer szónál többet mond, tette hozzá Stephen Brobst. Az emberek sokkal gyorsabban áttekintik és könnyebben értelmezik a grafikusan ábrázolt adatokat, ezért a képi kommunikáció a big data analitika kulcsfontosságú eleme. Az elérhető adatvizualizációs eszközök közül azonban okosan kell választani. A széles körben használt tortadiagram például csak azt mutatja meg, hogy nem hagytunk ki semmit, megvan az adatok 100 százaléka. Brobst szerint ennél csak egyvalami lehet rosszabb, a 3D tortadiagram. A jó adatvizualizáció több szinten is megmutatja és nem torzítja el az adatokat, egyszerre távcső és mikroszkóp, az adatokról való gondolkodásra serkent, és rá lehet vele közelíteni az érdekes részletekre. Az adatok térképi megjelenítése a jó adatvizualizáció példája, ezért a vállalat helyesen teszi, ha ügyfél-, értékesítési és más adataihoz a földrajzi hosszúság és szélesség koordinátáit is hozzárendeli. Egyre fontosabbá válnak az olyan adatvizualizációs eszközök is, amelyek összetettebb folyamatok, például az ügyfél elvesztését megelőző események elemzését könnyítik meg.

Naplózott életek
Digitális létünk mellékterméke az adat, ezért nő robbanásszerűen a digitális univerzum zettabájtos mérete, de egyre inkább az adat határozza meg, hogy kik vagyunk – mondta Pascal Raabe, az egyesült királyságbeli Ustwo dizájnere, aki szintén az adatok láthatóságával foglalkozott előadásában, de egészen más szemszögből mutatta be a problémát.

Hirdetés

Fényképekből, amelyek a pillanatot örökítik meg, ma 350 millió darabot töltünk fel a Facebookra naponta, a szelfi korában élünk, amelyben egyre inkább csak az számít megtörténtnek, amit lefotóztál. A feltöltött képek zöme nem képeslap minőségű, viszont rengeteg metaadatot tartalmaz készítőjéről és a körülményekről – mindez a szöveges posztokra, videoblogokra és a viselhető eszközökkel terjedő, életnaplózó (lifelogging), rekreációs, egészségügyi és más appok által gyűjtött adatokra is igaz.

Mély adatnyomot hagyunk magunk után szinte minden tevékenységünkkel és megnyilvánulásunkkal, ami komoly következményekkel jár. Nem tisztázott ugyanis, hogy kinek a tulajdonába kerül a feltöltött tartalom: marad a sajátunk, azé lesz, akivel megosztottuk, vagy a szolgáltató rendelkezik felette? Vélhetően valamilyen közös tulajdonlás lehet majd a megoldás, de ettől még messze járunk. Ezért fordulhat elő, hogy egy szolgáltatás megszűnésével a személyes tartalom odavész, ahogyan azt a Gowalla felhasználói is tapasztalhatták, miután a céget felvásárolta a Facebook.

További probléma, hogy a személyes tartalom könnyen törvényszegő megfigyelés alá kerülhet. A GCHQ, az Egyesült Királyság titkosszolgálata a Yahoo webkamerás csevegőszolgáltatásán fél év alatt 1,8 millió üzenetváltást hallgatott le és osztott meg az Egyesült Államok nemzetbiztonsági ügynökségével, az NSA-ával, ahogyan Edward Snowden a vele készült interjúban fogalmazott, a farkadról készített felvételekkel együtt. A lehallgatási botrány kirobbanásakor kiderült ugyanis, hogy sokan intim csevegésre is használják a szolgáltatást. A fiatal nemzedékek tagjai már hajlandók olyan információkat is megosztani magukról, amilyeneket az idősebbek esetleg nem, de a magánélethez való jog alapvető emberi jog. A tömeges megfigyelés ezzel a joggal együtt a felhasználók emberi méltóságát is megsértette.

Hirdetés

A személyes tartalmat feltöltő felhasználók megbíznak a szolgáltatóban, ezért annak értékelnie és ápolnia kellene ezt a bizalmat. Lehetővé kellene tennie, hogy a felhasználók láthassák, milyen adatokat tárol róluk a szolgáltatás, de nem valamilyen bonyolult, jogi, hanem olyan egyszerű folyamat részeként, mint egy fiók létrehozása. Minden részletre kiterjedő, mégis könnyen kezelhető beállításokra van szükség, amelyek a hozzáférés kontrollját a felhasználó kezébe adják. Ha a tartalom törlése mellett dönt a felhasználó, akkor azt a szolgáltató ne archiválja, hanem valóban távolítsa el szervereiről. A szolgáltatóknak már az alkalmazásprogramozó interfészek szintjén nagyobb gondot kellene fordítaniuk az ügyfélélményre, mert a digitális termékek nem létezhetnek elszigetelten. Nem utolsósorban a szolgáltatói stratégiának a következő 100 év innovációjára, a szolgáltatás és a felhasználó teljes élettartamának kezelésére is ki kellene terjednie.

Fontos az emlékek digitális megőrzése, Proust után szabadon: az emlékezet az égből aláeresztett kötél, amely felemel bennünket a nemlét mélységéből. Az internet 25 év alatt az emberiség kollektív emlékezetévé vált. Bár még csak sejtjük, mekkora értéket adhat ez számunkra, a szolgáltatóknak nem szabad szem elől téveszteniük, hogy amikor a felhasználók által a felhőbe feltöltött, nagy adatról beszélünk, akkor mindenekelőtt emberekről beszélünk.

Innováció itthonról
A háromnapos konferencia második napján az Enbrite.ly, a Radoop és a SequenceIQ képviselői kerekasztal beszélgetésen osztották meg feltörekvő céges tapasztalataikat a közönséggel. Példájuk is igazolja, a big data olyan tág teret ad az innovációhoz, hogy az üzleti sikerhez számos különböző út is elvezethet.

Ötszázezer eurós díjat nyert tavaly az Enbrite.ly a Slush 2014 konferencia startup-versenyének győzteseként. Az egyéves cég az online hirdetések ellenőrzésére, a kattintó botokkal elkövetett csalások felderítésére fejlesztett megoldást, amely azóta további 300 ezer euró befektetést is hozott külföldről. Történetük is alátámasztja, hogy a bigdata-piac korántsem telített, ma sem késő új megoldás fejlesztésébe vágni ezen a területen.

Műszaki egyetemi környezetből indult a Radoop, melynek alapítói adatbányászati projekteken dolgoztak. Nehézkesnek találták azonban a munkát a Hadooppal, így pattant ki fejükből az ötlet, hogy összekapcsolják a könnyen használható grafikus kezelőfelületet adó RapidMinerrel. Az akadémiai körökkel szemben a versenyszféra nagy szereplői élénken érdeklődtek a megoldás iránt. Az első licencet személyes találkozó nélkül adták el egy amerikai-indiai vállalatnak, ami egyértelműen jelezte, hogy a termék jó, és jókor jelent meg a piacon. Így látta ezt a RapidMiner is, amely tavaly nyáron felvásárolta a Radoopot.

Korábbi munkahelyüktől megválva tavaly februárban indították a SequenceIQ-t alapítói, hogy MLaaS (machine learning az a service) felhőszolgáltatást indítsanak. Rájöttek azonban, hogy a gépi tanulásra épülő szolgáltatásokhoz szükséges Hadoop klaszterek időigényes konfigurálását és hozzárendelését még senki sem automatizálta. Változtattak ezért az eredeti terven, és nyílt forráskódú automatizációs megoldást fejlesztettek, melynek kódját megnyitották. Miután az Euroventures befektetett a cégbe, jelentkezett az első vállalat is, amely díj ellenében támogatást kért az ingyenes szoftverhez. A SequenceIQ-t hat hónappal ezelőtt a Hortonworks vásárolta fel, amelynek a Clouderához hasonlóan szintén van irodája Budapesten.

Hirdetés

Figyelemre méltó a másik két, hazai startup története is. A Gravity, amely évekig a Netflix adatbányász versenyének élmezőnyében szerepelt, 2010-ben ajánlórendszert fejlesztett a LiveJasmin felnőtt chatportál számára. A céget a valós idejű analitikára épülő internetes ajánlómotort szállító ImpressTV vásárolta fel, amelynek megoldását többek között a Magyar Telekom is használja.

Konkrét alapötlet nélkül indult az SSP, melynek szakemberei egy évet szántak a vállalatok adatelemzéssel kapcsolatos problémáinak térképezésére, és ennek alapján döntöttek a fejlesztés irányáról. Így született meg a Fit Predictor, amely online vásárláskor segít a felhasználóknak a megfelelő ruhaméret kiválasztásában. Keresetté vált a megoldás, miután kiderült, hogy nemcsak csökkenti a cserék számát és a velük összefüggő költségeket, hanem növeli az ügyfelek elégedettségét és a forgalmat is.

Az adatokkal foglalkozó, hazai szakemberek akkor is számos karrierlehetőség közül választhatnak, ha maguk nem indítanának céget. A Budapest Data Forum előestéjén ingyenes állásbörzén találkozhattak a munkát kínáló cégekkel, illetve az adattárház-fejlesztő, adatbányász elemző, BI specialista, big data mérnök, adatkutató és más munkahelyek hirdetéseit a DataJobs.hu oldalon is megtalálják, amely a konferencia idején indult.

Hirdetés
Hirdetés
Hirdetés
X

Úgy tűnik, AdBlockert használsz, amivel megakadályozod a reklámok megjelenítését. Amennyiben szeretnéd támogatni a munkánkat, kérjük add hozzá az oldalt a kivételek listájához, vagy támogass minket közvetlenül! További információért kattints!

Engedélyezi, hogy a https://computerworld.hu értesítéseket küldjön Önnek a kiemelt hírekről? Az értesítések bármikor kikapcsolhatók a böngésző beállításaiban.