Hirdetés

Beszédes adatok

|

Jóllehet a big data hasznosításában óriási szerep jut a gépi adatfeldolgozásnak és a mesterséges intelligenciának, elméleti alapok és emberi kreativitás nélkül bizonytalan a következtetések helyessége. Kritikus esetben akár emberéletekbe is kerülhet a pusztán algoritmusok által hozott eredmény.

Hirdetés

Hogyan változtatják meg életünket az adatok, illetve feldolgozásuk? Hogyan hasznosulnak a kereskedelemben vagy akár a társkeresés során? Várható-e az adatokra épülő kutatásoktól bármilyen nagy változás, áttörés a gyógyításban? Átveszi-e az emberek helyét a tudományban a mesterséges intelligencia? Mennyire van manapság biztonságban a magánéletünk a világhálón? Mi történik azokkal a személyes adatokkal, amelyeket megosztottunk a világhálón? A CEU Határtalan tudás című előadássorozatának december 16-i rendezvényén az előadók ezekre a kérdésekre keresték a választ, illetve ezeket a problémákat világították meg különböző nézőpontokból.

Életünk nyitott könyv
Szinte valamennyi tevékenységünkkel adatokat termelünk. Telefonhívásainkról, e-mailjeinkről, internetes kereséseinkről vagy szociális hálón végzett tevékenységünkről adatok - egészen személyes adatok is - tárolódnak. Az orvosi vizsgálatok során keletkező egészségügyi adataink is bekerülnek egy elektronikus rendszerbe, de minden egyes kártyás vásárlásunk is nyomot hagy, azaz gyakorlatilag fogyasztásunk teljes spektruma tárolódik.

Életünk tehát nyitott könyv, ami lehet jó is, rossz is - kezdte előadását Kertész János Széchenyi-díjas fizikus, hálózatkutató, a CEU Hálózattudományi Tanszékének vezetője. Ha például egy olyan ajánlórendszerről van szó, amelynek segítségével - igény esetén - érdeklődésünknek megfelelő ajánlatokat kapunk, az jó. A személyes adatokkal azonban könnyű visszaélni. Szerencsére Európában jó irányban mozdulnak el a dolgok, a szabályozás kezd viszonylagos biztonságot nyújtani a személyes adatok szempontjából.

Hirdetés

Pozitívumok és negatívumok
Várhatóan 2020-ban megjelenik az első olyan telefon, amelynek tárolóhelye 1 terabájt. A tárolókapacitás növekedése gyakorlatilag követi az adatmennyiség növekedését: mindkettő esetében exponenciális a görbe. Szinte hihetetlen, de úgy fest, hogy az emberiség napjainkban két év alatt annyi adatot termel, mint egész eddigi története során összesen.

Az adatrobbanás egy generáción belül is gyökeresen megváltoztatja életünket. Bárhol, bármikor elérhetőek vagyunk, ezzel összefüggésben megváltoznak a kapcsolatteremtési és -ápolási szokásaink. A felmérések szerint az Egyesült Államokban a párkapcsolatok 40 százaléka már internetes kapcsolatteremtéssel kezdődik. Megváltozik - többek között - a munkavégzés és a tanulás gyakorlata, átalakulnak a vásárlási és a szabadidős szokásaink. Az internet óriási lehetőségeket teremt a társadalmi aktivitás számára.

Ugyanakkor mindennek vannak árnyoldalai is - hívta fel a figyelmet Kertész János. Manapság a hírek egyre inkább nem a hagyományos csatornákon (nyomtatott lapokon, rádión, televízión) jutnak el az emberekhez, hanem előtérbe kerülnek a különféle internetes felületek. Ez utóbbiak szerzői sokszor nem a hír valódiságára, hanem a kattintások számára, azaz a profitra optimalizálnak, következésképpen egyre több álhír lát napvilágot.

Hirdetés

Utópia és disztópia
A hihetetlen mennyiségben termelődő és tárolódó adatok akkor értékesek, ha fel tudjuk őket dolgozni. Ebben óriási szerepet játszik a mesterséges intelligencia (AI/MI). Az adatözönre épülő mesterséges intelligenciának rendkívül nagy hatása van a tudományra. Egyesek szerint az AI alapvetően megváltoztatja a tudományos módszereket. Nincs többé szükség elméletekre, hiszen az AI segítségével felismerhetők a mintázatok, és jóslatok tehetők. - Sokan nem értenek ezzel egyet. Én sem. A tudományos módszerben a deduktív és az induktív oldalnak együtt kell működnie. A deduktív oldalra az AI kiválóan alkalmazható, az induktív területen azonban még a felületet sem karcolja - fogalmazott a Széchenyi-díjas fizikus.

Vajon mit hoz a jövő? Kertész János szerint két véglet van: utópia és disztópia. Az első esetben olyan, mesterséges intelligenciával ellátott eszközök vesznek körül minket, amelyek figyelik szokásainkat, lesik gondolatainkat, vágyainkat. Egy ilyen utópisztikus világban az AI maximálisan segíti életünket: soha nem fogy ki a hűtőből semmi, teljes biztonsággal roboghatunk önvezető autóinkkal, soha nem felejtjük el fontos tennivalóinkat stb. A másik véglet olyan társadalmat ír le, amelyben tökéletes a kontroll, a megfigyelés, a manipuláció. Nem lehet megkülönböztetni az álhíreket a valódiaktól, nőnek a társadalmi különbségek, és a többség felett teljes kontrollt gyakorol egy kisebbség. - Azon kell lennünk, hogy ez utóbbi ne következzen be - zárta előadását a professzor.

Helyes járványprognózis elméleti háttérrel
Hihetünk-e a tisztán adatvezérelt döntéseknek? Tényleg beszélhetünk-e arról, hogy mostantól nincs szükség teóriákra, elméleti kiindulópontra? - tette fel a kérdést Koltai Júlia, az ELTE adjunktusa, a Társadalomtudományi Kutatóközpont munkatársa. A kvantitatív szociológiával foglalkozó kutató amellett érvelt, hogy elmélet nélkül nem érdemes nagy adatokat használni. Álláspontja alátámasztásául több példát hozott fel. Ezek egyike a Google Flu esete.

Egy olyan alkalmazásról van szó, amely a keresési kifejezések, illetve azok területi megoszlása alapján jósolja meg az influenzajárványok megjelenését és terjedését. Az app kezdetben nagyon sikeres volt, ám egy évvel később kifejezetten tévesen jelezte előre, hogy hol, milyen típusú járvány várható. Megvizsgálva a tévedések hátterét, a Google fejlesztői a legfőbb okként a világméretű H1N1 járványt, illetve az emberek abból fakadó viselkedésváltozását nevezték meg. Annyit cikkezett ugyanis a média a

Hirdetés

H1N1-ről, hogy olyan földrajzi területeken is elkezdtek a kapcsolódó kifejezésekre rákeresni, ahol fel sem ütötte a fejét a vírus. Ezt a fajta változást az algoritmus nem tudta lekövetni, így téves előrejelzések születtek. Később természetesen ennek megfelelően korrigálták az algoritmust, ám egy váratlan emberi viselkedésváltozást - legalábbis akkoriban még - nem tudtak az algoritmusok követni.

Jött a kreatív csapat
Egy másik példa a Netflix és az Amazon esete. Mindkét streaming-óriásnál körülbelül azonos időben kezdtek el gondolkozni azon, hogy milyen saját gyártású sorozatot kellene készíteni, mi volna sikeres a nézőik körében. Mivel a szolgáltatók rengeteg adattal rendelkeznek felhasználóik filmnézési szokásairól, preferenciáiról, mindketten ezen adatokból kiindulva kezdtek el kutatásokat folytatni. Mind az Amazon, mind a Netflix arra jutott, hogy amerikai politikusokról szóló sorozatot kellene csinálnia. Ezután azonban eltérő utakat választottak.

Az Amazon elkészített pár próbaepizódot, amelyeket ingyenesen lehetett megnézni. Figyelte a nézők viselkedését, majd az így begyűjtött adatokat tovább elemezte. Arra a megállapításra jutott, hogy nézői alapvetően vígjátékot szeretnének, amely négy republikánus szenátorról szól.

A Netflix nem készített próbarészeket, hanem összehívta kreatív csapatát. Az nem volt kérdés, hogy amerikai politikusokról szóljon a sorozat, ők viszont nem a komédia műfaját választották. Olyan drámát készítettek, amelyben csupán egyetlen demokrata politikus szerepelt.

Hirdetés

És vajon mi lett az eredmény? A Netflix elkészítette a House of Cards című sikersorozatot, miközben az Amazon a talán méltán kevésbé híres Alpha House-t.

- Ha az elméletet, az emberi faktort teljesen kihagyjuk a nagy adatokból, az algoritmusokból, annak súlyos következményei lehetnek, egy önvezető autó esetében például akár emberéletek is múlhatnak rajta. Éppen ezért én is amellett teszem le a voksomat, hogy elmélet nélkül nem érdemes nagy adatokat használni - mondta Koltai Júlia.

Személyre szabott orvoslás
Merre tart az orvoslás? - tette fel a kérdést Veres Dániel kutatóorvos, a Turbine nevű startup alapítója, aki csapatával - mesterséges intelligencia segítségével - a gyógyszerkutatás forradalmasításán dolgozik. A gyógyítás során keletkező adatok mennyiségének rohamos növekedésére, illetve e tény jelentőségére gyakorlati példákon keresztül világított rá.

Első (manapság leggyakoribb) példa: háziorvosi rendelő. A páciens mellkasszorításra panaszkodik. A korlátozott elektronikus kórtörténet, a fizikális vizsgálat és néhány helyszíni mérés (vérnyomás, EKG stb.) alapján átlag 8,5 oldal, azaz közel 0,02 megabájt adat áll rendelkezésre.

Hirdetés

Második (már ma is elérhető) példa: terhesgondozás. Az első helyzethez képest plusz: laborvizsgálatok, ultrahang stb. készítése, az eredmények rögzítése, diagnosztika a helyszínen; kiterjedt, a rendszerek összekapcsolásával hozzáférhető kórtörténet; okoseszközök, amelyek folyamatosan rögzítenek bizonyos élettani adatokat. A tudatos orvos-beteg kapcsolat során így keletkező adatok átlagos mennyisége 43,5 oldal, azaz közel 0,1 megabájt.

Harmadik példa (a jövő): személyre szabott orvoslás, amikor a beteg adott kórtörténetére, tulajdonságaira szabják a terápiát. Egy emlőrákos páciens esetében - a korábbi példákban követett gyakorlaton, illetve rögzített adatokon kívül - a genetikai eltéréseket is vizsgálják (molekuláris profil). A személyes orvoslás során átlag 74,5 oldal adat keletkezik, ami a korábbiakhoz képest sokkal több digitális, képi információt, illetve molekuláris adatot tartalmaz. Így az adatmennyiség jellemzően meghaladja a 2 gigabájtot. E hatalmas adatmennyiség - az interneten fellelhető hasonló esetekre építve, továbbá intelligens döntéstámogatással - segítik a leghatékonyabb terápia kiválasztását.

Ügyfélszolgálati változás!
Hirdetés
Hirdetés

Úgy tűnik, AdBlockert használsz, amivel megakadályozod a reklámok megjelenítését. Amennyiben szeretnéd támogatni a munkánkat, kérjük add hozzá az oldalt a kivételek listájához, vagy támogass minket közvetlenül! További információért kattints!

Engedélyezi, hogy a https://computerworld.hu értesítéseket küldjön Önnek a kiemelt hírekről? Az értesítések bármikor kikapcsolhatók a böngésző beállításaiban.