Hirdetés
. Hirdetés

A mai számítógépes chipek fejlettségük miatt olykor veszélyesen szeszélyesek

|

Nem mintha a chipek valaha is teljesen megbízhatóak lettek volna...

Hirdetés

A számítógépes chipek olyan mértékben fejlődtek, hogy már nem megbízhatóak: a Google megfogalmazása szerint "szeszélyesekké" váltak, és nem biztos, hogy kiszámítható módon végzik a számításaikat.

Nem mintha a chipek valaha is teljesen megbízhatóak lettek volna. A CPU hibák már olyan régóta léteznek, mint maguk a CPU-k. A hibák nemcsak tervezési okokból, hanem a környezeti feltételekből és a fizikai rendszerhibákból eredő hatásokból is fakadnak. Ezek azonban elég ritkák ahhoz, hogy csak a legérzékenyebb számításokat vessék alá kiterjedt ellenőrzésnek, ha a rendszerek látszólag az elvárásoknak megfelelően működnek. A számítógépes chipeket többnyire megbízhatónak tekintik.

Az utóbbi időben azonban a világ két legnagyobb CPU-terhelést okozó vállalata, a Google és a Facebook egyre gyakrabban észleli a CPU-k hibás viselkedését. Olyannyira, hogy most már arra ösztönzik a technológiai cégeket, hogy működjenek együtt annak érdekében, hogy jobban megértsék, hogyan lehet ezeket a hibákat felismerni és orvosolni.

Hirdetés

A Google mérnökei felfigyeltek rá, hogy a megbízható alkalmazások olykor hibásan működnek. A cég kutatói ezeket az úgynevezett csendes végrehajtási hibákat (CEE) vizsgálva arra a következtetésre jutottak, hogy a "szeszélyes processzor magok" voltak a hibásak. Azaz olyan CPU-k működtek rosszul, amelyek időnként, különböző körülmények között, az előrejelzésnek ellentmondó módon elszámolták magukat - számolt be a The Register.

A hibák nem a chiparchitektúra tervezési hibáiból adódtak, és a gyártási tesztek során nem észlelték őket. A Google mérnökei szerint a hibák inkább azért keletkeztek, mert a félvezetőgyártást olyan szintre emeltük, ahol a hibák egyre gyakoribbá váltak, és nincsenek meg az eszközeink ahhoz, hogy ezeket előre felismerjük.

A kutatók szerint e furcsa hibák legfontosabb oka, hogy egyre kisebb méretekkel dolgoznak a gyártók, és egyre közelebb kerülnek a CMOS-skálázás határaihoz, továbbá az architekturális tervezés komplexitása is egyre növekvszik. Szerintük a meglévő verifikációs módszerek nem alkalmasak a szórványosan vagy a telepítés utáni fizikai romlás következtében fellépő hibák kiszűrésére.

A Facebook is észrevette a hibákat. Az erről szóló dokumentum enyhítési stratégiákat is javasol, de nem foglalkozik a kiváltó okokkal. A Google kutatói úgy látják, hogy a Facebook kiszúrta a megbízhatatlan magok tünetét, a csendes adatkorrupciót. A probléma okának azonosítása és a javítás kidolgozása azonban további munkát kíván.

A rosszul viselkedő magok által jelentett kockázatok közé nem csak az összeomlások tartoznak, amelyeket a hibakezelés meglévő hiba-megállási modellje képes kezelni, hanem a hibás számítások és az adatvesztés is, amelyek észrevétlenül maradhatnak, és különösen nagy léptékben jelentenek kockázatot.

A kutatók beszámoltak egy esetről, amikor a Google hibás hardvere egy automatikus hibás zsarolóprogram-támadást hajtott végre. Az egyik szeszélyes mag elrontotta a titkosítást, méghozzá úgy, hogy csak saját maga tudta visszafejteni azt, amit tévesen titkosított.

A Google kutatói "üzleti okokra" hivatkozva nem voltak hajlandóak felfedni az adatközpontjaiban észlelt pontos CEE-arányokat, csak annyit közöltek, hogy "néhány ezer gépre néhány szeszélyes mag jut", ami hasonlóan a Facebook által bejelentett arányhoz.

A Google ideális esetben automatizált módszereket szeretne látni a megbízhatatlan magok azonosítására, és olyan stratégiákat javasolt, mint a CPU tesztelése a chip teljes életciklusa során, ahelyett, hogy csak a telepítés előtti tesztekre támaszkodna. A probléma kiszűrésűhez használható módszerek azonban még korántsem készültek el, a fejlesztések folynak.

Hardverek, szoftverek, tesztek, érdekességek és színes hírek az IT világából ide kattintva!

Hirdetés
0 mp. múlva automatikusan bezár Tovább az oldalra »

Úgy tűnik, AdBlockert használsz, amivel megakadályozod a reklámok megjelenítését. Amennyiben szeretnéd támogatni a munkánkat, kérjük add hozzá az oldalt a kivételek listájához, vagy támogass minket közvetlenül! További információért kattints!

Engedélyezi, hogy a https://computerworld.hu értesítéseket küldjön Önnek a kiemelt hírekről? Az értesítések bármikor kikapcsolhatók a böngésző beállításaiban.