Hirdetés
. Hirdetés

Adatok táguló tárháza

|

A nagy adatmennyiségeket kezelő és azokat felhőben tároló rendszerek bevezetése IT-paradigmaváltásra kényszeríti a cégeket.x

Hirdetés

Az L&P Solutions az alábbi kihívásokra ad megoldást azoknak a cégeknek, akiknek muszáj változtatni eddigi gondolkodásmódjukon.

Hirdetés

Mik ezek a kihívások: 
- megnövekedett adatmennyiség, ezért új adattárolási mechanizmusokat kell kialakítani,

- az adatok sokkal gyorsabban állnak elő, ezért meg kell növelni a feldolgozási sebességet,

- az adatok sokkal változatosabbak, ezért az adatmodellezési feladatok is komplexebbé válnak,

- nem elegendő riportokat készíteni, adatelemzésre, adatbányászatra van szükség,

- az ügyfelek meg akarják őrizni a már megteremtett adatvagyonuk értékét, ezért a hagyományos és a bigdata-megoldásoknak együtt kell élniük a vállalati infrastruktúrában.

A hagyományos adatmodellek az adatok tárolásánál törekednek a redundancia csökkentésére (hiszen amikor ezek a módszertanok születtek, az adattárolás igen költséges volt). Az adatokat normalizálták, így a logikailag összetartozó adatok több tábla között kerültek szétosztásra.

A felhőben való adattárolásnál ez az út nem járható. Bár a felhasználó előtt az adattárolás technikai részletei rejtve maradnak, az L&P Solutions szakembereinek pontosan tisztában kell lenniük azzal, hogy a felhőben való adattárolás esetén egy adatpiac táblái akár különböző szervereken is kaphatnak helyet, így a szétdarabolás jelentősen csökkenheti a visszakeresés idejét. Így a cég adatmodellezői olyan denormalizált megoldásokat alakítanak ki, amelyek bár redundánsan tárolják az adatokat, de azok a felhasználó számára gyorsan elérhetőek.

Az L&P Solutions-ben úgy látjuk, hogy a háttértárak áresését nem követte ugyanolyan mértékben a CPU-k áresése, így a tárhely költsége helyett a CPU-idő ára lett az adatfeldolgozás új korlátja. Míg a hagyományos felfogások szerint kialakított rendszerekben a riportáló eszközök futási időben végezték el az adatfeldolgozást, addig az ő megoldásaikban a feldolgozással együtt a mérőszámok is kiszámításra és tárolásra kerülnek, így a riportáló eszközökre csupán az adatmegjelenítés feladata hárul.

A hagyományos ETL-megoldásokban az operatív rendszerekből az adattárházba naponta egyszer történik meg az adatáttöltés és feldolgozás. A megnövekedett adatmennyiségek miatt sok vállalatnál az adatfeldolgozás nem tudott lépést tartani a megnövekedett igényekkel, így T+1 helyett T+2-re álltak elő az adatok (azaz az adattárházban található legfrissebb állapot is a tegnapelőtti állapotot mutatja). Az L&P Solutions-nál felkészültünk arra, hogy az ügyfelek igényei alapján „data streaming” megoldásokat alakítsunk ki. Azaz a tényadatok már az operatív rendszerben való megjelenésük pillanatában átkerülnek az adattárházba, így nem csak a T+1 garantálható, hanem akár az előző órában keletkezett adatok is megjeleníthetők az elemzésekben.

 

Amikor a tárhely drága volt, akkor az is egy módja volt a költségek csökkentésének, hogy csupán a riportáláshoz elengedhetetlenül szükséges adatok kerültek be az adattárházba. Ma már azonban eltűntek ezek a korlátok. Minden olyan adatot érdemes adattárházban tárolni, aminek ma még nem ismerjük a felhasználhatóságát, de azt sejtjük, hogy a jövőben jók lesznek még valamire. Ez azt is jelenti, hogy nincsenek olyan szigorú adatmodellek, mint régebben. A látszólag különálló adatelemek közötti kapcsolat feltárása az L&P Solutions-nál az adatelemzők és adatbányászok feladata. Ők azok, akik rendelkeznek azokkal a tudással, hogy szövegelemzési és statisztikai módszerekkel feltárják és az ügyfelek számára prezentálják az összefüggéseket, segítve az adatokon alapuló döntési folyamatokat.

A riportok alapvetően merevek, a megjelenítendő adatok köre és a mérőszámok számításának módja a specifikáció fázisában kerülnek meghatározásra, és elkészültük után a felhasználó csupán szintén előre meghatározott paraméterek alapján tudja befolyásolni a működésüket. Az L&P Solutions adatelemzőinek munkája ennél lényegesen túlmutat. Először az ügyfelek üzleti szakembereinek segítségével meg kell érteniük azokat a folyamatokat, amelyekből az adatok származnak. Majd miután felvértezték magukat a megfelelő üzleti ismerettel, kezdik el elemezni az adatokat és keresik meg a bennük megbújó összefüggéseket. Ez az alapvetően agilis megközelítés sokszor azt is igényli, hogy az adattárház töltési folyamata is módosuljon, további adatforrásokat vonva be az elemzésbe.

A meglevő adattárházak és a bigdata-rendszerek azért tudnak együtt létezni a vállalati IT-infrastruktúrában, mert a változás nem az alapadatokban történik (sem az ügyfelek száma, sem az autóflotta mérete, vagy a termékpaletta nagysága nem növekszik meg hirtelen). Az adatmennyiség növekedése a gyűjtendő adatok körének kiterjesztéséből adódik (ügyfelek bejegyzései a közösségi oldalakon, az autókban elhelyezett futási adatgyűjtő rendszerek által szolgáltatott adatok, vagy a termékek előállítása során keletkező adatok). Ezen új adatoknak a meglevőkkel való integrálása jelenti azt a kihívást, amelynek kezelésére az L&P Solutions-ben folyamatosan felkészítjük munkatársainkat az ügyfelek jobb, hosszú távú kiszolgálásának érdekében.

Szerzők:

Bacsek Péter – Partner

Dobozy Ottó – Üzletágvezető

Renfer Péter – Üzletfejlesztési vezető

Nagy Ákos – Adattárház szakértő

info@lpsolutions.hu

Hirdetés
0 mp. múlva automatikusan bezár Tovább az oldalra »

Úgy tűnik, AdBlockert használsz, amivel megakadályozod a reklámok megjelenítését. Amennyiben szeretnéd támogatni a munkánkat, kérjük add hozzá az oldalt a kivételek listájához, vagy támogass minket közvetlenül! További információért kattints!

Engedélyezi, hogy a https://www.computertrends.hu értesítéseket küldjön Önnek a kiemelt hírekről? Az értesítések bármikor kikapcsolhatók a böngésző beállításaiban.