Hirdetés
. Hirdetés

Kiderült, mi okozta a Google múlt heti, globális leállását

|

Egy rosszul kivitelezett fejlesztés, valamint régi és új elemek hibás együttműködése váltotta ki a szolgáltatás-kimaradást. A Google a felügyeleti rendszer fejlesztését ígéri, hogy többé ne következhessen be a december 14-ihez hasonló baleset.

Hirdetés

December 14-én, hétfőn hirtelen világszerte leállt a Google több szolgáltatása, többek között a Gmail és a Drive, de a Workspace sok felhasználója sem tudta folytatni munkáját. A hiba még az Android-felhasználókra is kiterjedt, akik a Play Store-ral kapcsolatos műveleteket nem tudták elvégezni az alkalmazások telepítésétől az adatok felhőbe mentéséig. A leállás egyeseknél nagyjából negyvenöt percig tartott, de voltak, akik másfél órán keresztül "élvezhették" a Google nélküli életet. Az eset után a vállalat vizsgálatot ígért, és most egy posztban tette közzé ennek eredményét.

Hirdetés

Az írás szerint a szolgáltatás-kimaradások középpontjában az áll, hogy a Google az elmúlt hónapokban folyamatosan átállt a fiókadatok hitelesítését végző User ID Service-re, amelynek segítségével hatékonyabban és biztonságosabban lehet majd azonosítani a felhasználókat a különféle Google szolgáltatásokon belül. A probléma gyökere októberre nyúlik vissza, amikor a cég a rendszererőforrások elosztására egy új rendszert vezetett be, de közben még a régi rendszer egy részét is a helyén hagyta.

A régi rendszer azonban az átállás egyik pontján az új elemekkel "összeveszve" egy téves hibaüzenetet eredményezett, majd egyszerűen leállt. Ha a Google nem fokozatos átállásban gondolkodott volna, a téves hibaüzenet már korábban is problémát okozott volt, de így csak december közepén ütött be a baj, amikor az automatizált rendszerek úgy kezdtek működni, mintha valódi lenne a gond. A Google elvileg az ilyen esetek megelőzésére is beépített biztosítékokat, de ezek nem tudták kezelni a hétfői együttállást.  

A Google elnézést kér felhasználóitól a szolgáltatás-kimaradás okozta kellemetlenségekért. A cég hangsúlyozza, hogy rendkívül komolyan vesz minden olyan eseményt, ami befolyásolja ügyfelei elérhetőségét és megbízhatóságát, és ez különösen igaz azokra az incidensekre, amelyek több régiót érintenek. Bár a cég szakemberei viszonylag rövid idő alatt orvolták a bajt, a Googe további intézkedéseket tervez annak érdekében, hogy az eset a jövőben ne ismétlődhessék meg. Az óriáscég javítani akar a kommunkációján, és tökéletesíteni szeretné a felügyeleti rendszereket, hogy hamarabb felfedezzék a hibás konfigurációkat.

A blogposztra reagálva már több valós és önjelölt szakértő kifejtette véleményét különféle fórumokon. Ezek között voltak olyanok, amelyek szimplán azt ecsetelték, miszerint egy ekkora hatalmas vállalat hogy engedhetett meg magának ilyen hanyag munkát, de a mérsékeltebbek inkább szemléletváltásról beszélnek. Egyesek szerint például érdemes lenne az efféle nagyobb horderejű átállásokat derundáns módon véghezvinni, tehát két vagy több, hasonló funkciót végző alrendszerre bontani mindent, és ha egy átalakítás valamelyikben hasonló gondokat eredményez, azonnal át lehetne kapcsolni egy működőre, míg megfejtik az anomália okait.

Hardverek, szoftverek, tesztek, érdekességek és színes hírek az IT világából ide kattintva!

Hirdetés
0 mp. múlva automatikusan bezár Tovább az oldalra »

Úgy tűnik, AdBlockert használsz, amivel megakadályozod a reklámok megjelenítését. Amennyiben szeretnéd támogatni a munkánkat, kérjük add hozzá az oldalt a kivételek listájához, vagy támogass minket közvetlenül! További információért kattints!

Engedélyezi, hogy a https://computerworld.hu értesítéseket küldjön Önnek a kiemelt hírekről? Az értesítések bármikor kikapcsolhatók a böngésző beállításaiban.