Hirdetés

Csevegőrobotok csatája

|

Legyenek bár letisztultak, a grafikus kezelőfelületek mégsem méretezhetőek túl jól, mert elvárják a felhasználóktól, hogy alkalmazásokat töltsenek le, kiismerjék magukat a menüpontok között, megértsék és módosítsák a beállításokat, rendszeresen letöltsék a frissítéseket. A mesterséges intelligenciával felvértezett csevegőrobotok ennél sokkal közvetlenebb, automatizált, mégis természetesnek ható párbeszédet tesznek lehetővé ember és gép között. A technológia kirakata azonban még rendezés alatt - a vállalatoknak alaposan mérlegelniük kell, hogy fejlesztéseikhez milyen konverzációs platformot válasszanak.

Nagy visszhangot váltott ki a múlt hónapban, amikor a Google demózta Duplex csevegőrobotját (chatbotját), amely a cég mesterséges intelligenciával bíró digitális asszisztensével karöltve megtévesztően emberi telefonhívásokat tud bonyolítani felhasználója nevében. A bemutató kapcsán felmerülő etikai kérdéseket a média épp csak fogalmazgatta még, amikor a Microsoft ugyancsak bejelentkezett hasonló (full duplex) képességű Xiaoice megoldásával. A különbség csupán annyi, hogy ez a közösségi csevegőrobot a betelefonáló felhasználókkal beszélget el úgy, mint egy ember. (A full duplex technológiát ugyanis nem zavarja, ha a felek egymás szavába vágnak, egy időben beszélnek, ahogyan az két ember párbeszédében előfordul.)

Hirdetés

De arra is a múlt hónapban kaptuk fel a fejünket, hogy az Amazon Alexa intelligens asszisztense az Echo okoshangszórón keresztül felvételt készített tulajdonosának otthoni magánbeszélgetéséről, és azt megosztotta egyik - névjegyzékben szereplő - kollégájával, anélkül, hogy erre utasították volna. Ezek a közelmúltbeli fejlemények is arra figyelmeztetnek, hogy a mesterséges intelligenciával támogatott beszédalapú kezelőfelületek, bár gyorsan fejlődnek, korántsem kiforrottak még, és ellentmondásoktól sem mentesek.

Otthon beszélnek
A Markets and Research előrejelzése (Intelligent Virtual Assistant Market Global Forecast to 2023) szerint az intelligens virtuális asszisztensek (IVA-k) piaca a tavaly mért 2,48 milliárd dollárról 2023-ra több, mint hétszeresére, 17,72 milliárd dollárra fog nőni, azaz ebben az időszakban évente átlagosan 38,82 százalékkal bővül majd. A látványos növekedés elsősorban az ügyfélszolgálatokon és az okosotthonokba kerülő rendszerekben alkalmazott intelligens asszisztensek gyors elterjedésével magyarázható. A korántsem tévedhetetlen csevegőrobotok pontatlansága azonban továbbra is visszafogó erőként hat majd az IVA-piacon.

Legnagyobb részesedést az automatikus beszédfelismerés (automatic speech recognition, ASR) technológiájára épülő intelligens virtuális asszisztensek értek el ezen a piacon. Az ASR-alapú IVA-kat a gyártók például az okosotthonokat benépesítő készülékek - termosztátok, világítótestek, hűtőszekrények, mosógépek stb. - vezérlésére szolgáló okoshangszóróikkal integrálják. Iparági bontásban ezért a fogyasztói elektronikai szektor az IVA-k legnagyobb piaca, de a csevegőrobotok megkezdték térhódításukat a pénzügyi szolgáltatások, az egészségügy, az oktatás, a kereskedelem, a kormányzati és a közműszolgáltatások, valamint az utazás és a vendéglátás területén is.

Minthogy az okoshangszórók elsőként Észak-Amerikában és Európában váltak keresetté, az IVA-piac legnagyobb szeletét jelenleg Észak-Amerika adja, a leggyorsabban azonban már most is az ázsiai és csendes-óceáni térség piaca bővül. Különösen Kínában és Indiában hódít nagy ütemben a csevegőrobotok technológiája, és a Markets and Research arra számít, hogy a 2023-ig terjedő időszakban is ez a régió viszi majd a prímet.

Konverzáció mint kritikus képesség
Nem is olyan régen még csupán a tudományos fantasztikus filmek világában volt természetes, hogy a számítógépek és a robotok értik az emberi szót, a megfogalmazott kérdésekre, kiadott utasításokra természetes nyelven válaszolnak. A mesterséges intelligenciát beszédalapú kezelőfelülettel társító csevegőrobotok intelligens virtuális asszisztensként ezt a képességet ma már a valóságban, a magánéletben és a munkahelyeken, a hivatalos ügyintézésben is mind több alkalmazáshoz adják hozzá. Minden jel arra utal, hogy a technológia gyorsan bekerül majd a fősodorba, és a beszédhang válik majd az egyik, ha nem a legfontosabb kezelőfelületté. A fejlesztőknek fel kell készülniük, hogy ezt az üzlet szempontjából kritikussá váló képességet beépítsék alkalmazásaikba.

Konverzációs platformok közül választhatnak ehhez a munkához, amelyek szállítói között a legnagyobb szoftvergyártó és felhőszolgáltató cégek mellett kisebb, egy-egy réspiacra és speciális képességek kifejlesztésére összpontosító szereplők is versenybe szálltak. A technológia révén a felhasználók természetes nyelven kommunikálhatnak a számítógépes rendszerekkel, akár információt kérnek, akár munkájukat végzik vagy ügyeiket intézik. Míg a végfelhasználók olyan szöveges vagy beszédalapú felületeken keresztül léphetnek kapcsolatba a gépekkel, mint például a Facebook Messenger, az Apple Siri vagy a Microsoft Cortana, a fejlesztők alkalmazásprogramozási interfészeken (API-kon) és a szállítók által közreadott eszközkészletekkel férnek hozzá a konverzációs platformokhoz, érik el az olyan képességeket, mint a természetes nyelv feldolgozása, a beszéd generálása, a kimondott szavak szöveggé alakítása vagy a gépi fordítás.

Minden szállító igyekszik olyan eszközöket adni az alkalmazásfejlesztők kezébe, amelyekkel testre szabott csevegőrobotokat hozhatnak létre, a paletta változatossága és a konverzációs képességek iránti kereslet gyors növekedése mellett azonban nem könnyű kiválasztani a megfelelő, az üzleti igényeket hosszú távon is kiszolgáló platformot.

A Forrester, hogy megkönnyítse ezt, a piac 25 szereplőjét jelenlegi kínálata, termékfejlesztési stratégiája és piaci jelenléte alapján értékelte ki. Az eredményt összegző jelentésében (The Forrester New Wave: Conversational Computing Platforms, Q2 2018) a legjelentősebb szállítók hétcsapatos mezőnyét állította fel. Közülük egyedül az IBM-et nevezte meg piacvezetőként, míg az Amazon, a Google, a Microsoft és a Nuance Communications konverzációs platformját jól teljesítő, versenyképes megoldásnak minősítette. Versenyben van az Oracle is, amely az elemző szerint bizonyos üzleti alkalmazásokhoz szintén jó alternatívát kínál, míg a más súlycsoportban játszó, ígéretes kihívóként megjelenő startup cégnek, a felénk kevéssé ismert Rulainak még van hová fejlődnie.

Fejlesztőbarát és átfogó a Forrester szerint az IBM Watson Assistant megoldása, amely a robusztus technológiát képviselő konverzációs platformot könnyen használható fejlesztőeszközökkel és a szélesebb Watson portfólióval ötvözi, így megkönnyíti az intelligens párbeszéd képességének beépítését a legkülönfélébb alkalmazásokba. Elsősorban üzleti alkalmazásokra kell itt gondolni, mert a vállalaton kívül a Watson Assistant egyelőre kevésbé versenyképes, mint a lakossági piacra szánt eszközök és szolgáltatások terén nagyobb tapasztalattal bíró szállítók megoldásai, tette hozzá a Forrester. A bonyolult vállalati környezetben viszont a Watson Assistant elemében van - fejlett analitikai és AI-képességeire a fejlesztők olyan csevegőrobotokat készíthetnek, amelyek azonnal és intelligensen reagálnak a párbeszéd fordulataira. Kiterjedt iparági szakértelmével az IBM ráadásul a legjobb használati esetek megtalálásához, valamint ahhoz is hozzásegíti a vállalatokat, hogy az új alkalmazásokat a szélesebb nagyvállalati architektúrába integrálják.

Mindez jórészt a piac többi nagy szereplőjéről is elmondható, mivel mindegyikük fejlesztők millióival tart kapcsolatot világszerte, és felhőben ugyancsak globálisan elérhető platformszolgáltatásokat működtet, továbbá a fejlett technológia mellett nagy tapasztalattal és kiforrott folyamatokkal rendelkezik ezen a téren. Eltérések persze vannak, az Amazon és a Google intelligens virtuális asszisztensei például a lakossági piacon kezdték térhódításukat, míg a Nuance platformja a speciális képességeket - például a beszédhang alapján történő biometrikus azonosítást - kereső fejlesztők számára lehet jó választás. A Microsoft és az Oracle b2b megoldásait és szakértelmét viszont aligha kell külön bemutatni.

A piac további fejlődésével a konverzációs platformok egyes szállítói a még hangsúlyosabb szakosodás útját választják a Forrester szerint, míg mások - különösen a felhő és a mesterséges intelligencia területén domináns Amazon és Google - piaci súlyukra is építeni fognak.

Korlátok és távlatok
Idei évre adott technológiai előrejelzésében (Top 10 Strategic Technology Trends for 2018) a Gartner is stratégiai jelentőségűnek minősítette a konverzációs platformokat. Feljövetelük paradigmaváltást hoz, mivel a szándék lefordításának terhét a felhasználó válláról levéve a számítógépre helyezik át. A természetes nyelvet értő és beszélő rendszerek ma már nemcsak egyszerű kérdésekre tudnak válaszolni, például megmondani, hogy milyen lesz az időjárás, hanem szóbeli utasításra olyan összetett feladatokat is elvégeznek, amilyen az asztalfoglalás egy étteremben. A továbbiakban ezek a platformok még bonyolultabb helyzetekben is megállják majd helyüket az elemző szerint, a bűncselekmények tanúinak szóbeli vallomását értelmezve például elkészítik a gyanúsított fantomképét.

Napjainkban azonban a konverzációs platformok még igen strukturált beszédet várnak el a végfelhasználótól, ami gyakran kiábrándító élményt okozhat. A szállítóknak le kell majd bontaniuk az ilyen korlátokat, de megoldásukat az alkalmazott konverzációs és eseménymodellek, valamint API-k robusztusságával, és azzal is megkülönböztethetik a piacon, hogy platformjukról milyen könnyen lehet harmadik féltől származó szolgáltatásokat elérni és összehangolni - hogy az emberi szóból értő számítógépes rendszerek valóban komplex feladatokat láthassanak el.

Hirdetés

Úgy tűnik, AdBlockert használsz, amivel megakadályozod a reklámok megjelenítését. Amennyiben szeretnéd támogatni a munkánkat, kérjük add hozzá az oldalt a kivételek listájához, vagy támogass minket közvetlenül! További információért kattints!

Engedélyezi, hogy a https://computerworld.hu értesítéseket küldjön Önnek a kiemelt hírekről? Az értesítések bármikor kikapcsolhatók a böngésző beállításaiban.