Skype opět funguje, po dvou dnech výpadku

Prakticky veškerá funkčnost Skype je zpět, s výjimkou skupinového video chatu (byť i ten by už měl snad být funkční také). A co se opravdu stalo, to prozatím Skype nijak nechce komentovat. Není vyloučena ani možnost útoku.

Výpadek Skype postihl miliony uživatelů a ukazuje na fatální slabinu v architektuře . Ta je odkázána na existenci tzv. “supernodes”, počítačů, které slouží ostatním uživatelům pro zajištění funkčnosti Skype. Výpadek, který začal 22. prosince, se podařilo částečně odstranit až prakticky po dvou dnech – a dotkl se desítek milionů uživatelů Skype. Podobně dlouho trval i předchozí velký výpadek v roce 2007.

Skype CEO, Tony Bates, ve video zprávě uživatelům slíbil 30 minut SkypeOut (možnost volat kamkoliv na celém světě) pro neplatící uživatele a uživatele na pay-as-you-go plánu. Platící zákazníci dostanou zdarma kredit odpovídající týdennímu užívání Skype.

Výpadek Skype pro desítky milionů lidí v době před vánočními svátky může být problematický pro další budoucnost služby. Jakkoliv většina uživatelů používá Skype jako příležitostnou komunikační platformu, je zde i skupina zákazníků, kteří Skype nasadili jako VoIP řešení. A pro tuto skupinu uživatelů je několikadenní výpadek kritický.

Supernode a cloud

Závislost Skype na “supernode” architektuře se mu stala osudnou už v minulosti – “supernode” jsou počítače, bez kterých není možné najít další uživatele Skype a které slouží i k směrování “hovorů” mezi uživateli. Právě na existenci velkého množství “supernode” je Skype založené – při malém počtu sice funguje, ale velmi pomalu. A při nedostatečném počtu se zhroutí celá infrastruktura.

Zajímavé na “supernode” počítačích je, že jsou to počítače běžných uživatelů Skype – takových, které se neschovávají za firewall a je možné je “veřejně využít”. A “supernode” jsou zodpovědné za přiřazení další podstatné funkčnosti – určují “relay nodes”, počítače používané pro  směrování “hovorů” mezi uživateli.

Bez “supernode” počítačů nemůže žádný klientský software Skype komunikovat s jiným klienty. A jakkoliv Skype se po výpadku v roce 2007 mírně poučilo a doplnilo ještě malou vrstvu specifických “autentikovaných serverů”, na zachování funkčnosti celé infrastruktury při ztrátě “supernode” počítačů to nestačí.

Co se stalo před třemi dny?

O tom co se opravdu stalo se můžeme jenom dohadovat – z nedostatečných zmínek na @Skype (Twitter) hovořících o problémů s klientským software, které vedlo ke ztrátě velkého množství “supernode” počítačů (“Unfortunately, today, many of them were taken offline by a problem affecting some versions of Skype.“).  A následné informace o tom, že technici Skype začali vytvářet nové “supernode” počítače (“Our engineers are creating new ‘mega-supernodes’ as fast as they can, which should gradually return things to normal“).

Velmi pravděpodobně Skype pro vytvoření nové sítě “supernode” počítačů použilo vlastní servery – výsledkem bylo ale i to, že přestaly fungovat některé pokročilejší možnosti Skype – došlo tak například k vypnutí video komunikace. A desítky milionů uživatelů dožadujících se funkčního Skype situaci vůbec neulehčilo.

Může se podobný výpadek opakovat?

Pokud bude architektura postavená na cloud technologii budované na “využití” počítačů uživatelů služby, tak se podobná situace opakovat může – tedy pokud skutečně došlo k výpadku “supernode” sítě. Co k výpadku vedlo se sice neví, ale možnosti je několik – od chybného update klientů, vliv update operačního systému (k tomu už ostatně došlo v minulosti) až po cílený útok.

O cílený útok by samozřejmě mohlo jít i v případě, že se někomu podařilo odhalit nějaký závažný nedostatek infrastruktury a narušit její komunikaci – bez nutnosti ovlivnit (možná i) miliony “supernode” počítačů, které jsou rozmístěny po celém světě.

Skype má ale v tomto případě velký problém – využití milionů počítačů uživatelů mimo jiné umožňuje i to, že není nutné budovat rozsáhlou infrastrukturu klasického serverového typu. A ani řešit nutnost dostatečné kapacity příchozích a odchozích internetových připojení k takovéto infrastruktuře, včetně vyhnutí se nutnému geografickému pokrytí celosvětového internetu.

Aby se Skype riziku podobného výpadku vyhnulo, muselo by dojít ke změně architektury. A to by mohlo znamenat příliš velké změny, které by Skype nemuselo být schopné financovat, natož technicky realizovat v přijatelném časovém rozmezí.