„Facebook Hack“ – Hrůzostrašný a děsivý seznam jmen se nekoná, jen neškodná statistika

Co přesně je v zveřejněné databází „osobních údajů“ uživatelů Facebooku. Co je pravda, co je lež, a proč čeští novináři zveřejňují lži a bludy. Jak přesně se k Ron Bowes k datům dostal. A co  můžete udělat pro to, abyste nebyli ve veřejném „telefonním“ seznamu Facebooku.

Jeden z prvních solidních cizojazyčných článků na toto téma – Hacker Publishes Profile Data Of 100M Facebook Users – má zcestný jenom titulek, samotný článek správně upozorňuje, že nešlo o žádného hackera. Stejně jako zveřejněná data nejsou žádné osobní údaje. Ron Bowes vpodstatě nabídl ke stažení ekvivalent veřejného telefonního seznamu. V celkem zhruba 16GB dat (po rozbalení) zjistíte, že na Facebooku je 913 465 lidí s příjmením Smith, 977 014 lidí s křestním jménem Michael a nejvíce lidí  se jmenuje Becky Smith (1 230).

Nejčastější příjmení Nejčastější křestní jména Nejčastější jména
913465 smith
571819 johnson
512312 jones
503266 williams
471390 brown
386764 lee
360010 khan
355639 singh
343220 kumar
324972 miller
977014 michael
963693 john
924816 david
819879 chris
640957 mike
602088 james
584438 mark
515686 jason
503658 robert
484403 jessica
1230 becky smith
1229 prashant kumar
1229 brian brown
1228 patricia smith
1228 mike murphy
1228 amy williams
1228 abdul aziz
1227 larry johnson
1226 masud rana
1225 linh nguyen

Takhle vypadají soubory zveřejnění Bowesem. Počet výskytů a jméno/příjmení a kombinace jména a příjmení.

Nic ale nebrání aby to TN.CZ označilo za „hrůzostrašný a děsivý seznam jmen“, iDnes.cz tvrdilo, že ze seznamu budou mít radost spammeři, iHNed.cz do toho přidává něco o fotografiích a Blesk.cz dokonce píše, že jsou tam adresy a telefonní čísla (podrobnější souhrn viz 100 milionů Facebook účtů a hlouposti v českých médiích). Že česká i zahraniční média budou uveřejňova lži a bludy, jsem upozorňoval už v prvním blognutí na toto téma – Údaje 100 milionů uživatelů Facebooku volně k dispozici.

Stejně jako bylo jasné, že si nikdo z „novinářů“ o kauze píšících nestáhne nabízená data – pak by totiž věděli, že Ron Bowes nezveřejnil žádné osobní údaje. Jenom jména, příjmení, facebook ID (což je číslo, nikoliv přihlašovací jméno) a adresu profilu člověka na Facebooku – věci, které jsou volně dostupné jak na webu (kudy je Bowes programově získal pomocí robota) tak pomoci Facebook Open Graph API.

 Výpis adresáře downloadsfbnames 29.07.2010 21:50 300 739 870 facebook-f.last-withcount.txt 29.07.2010 21:50 66 348 431 facebook-f.last-withcount.txt.bz2 29.07.2010 21:50 175 729 831 facebook-first.l-withcount.txt 29.07.2010 21:50 36 932 295 facebook-first.l-withcount.txt.bz2 29.07.2010 19:46 73 134 218 facebook-firstnames-withcount.txt 29.07.2010 19:46 16 375 441 facebook-firstnames-withcount.txt.bz2 29.07.2010 21:50 91 677 133 facebook-lastnames-withcount.txt 29.07.2010 21:50 21 166 232 facebook-lastnames-withcount.txt.bz2 29.07.2010 21:50 2 561 936 569 facebook-names-original.txt 29.07.2010 21:50 504 060 392 facebook-names-original.txt.bz2 29.07.2010 21:50 1 609 962 544 facebook-names-unique.txt 29.07.2010 21:50 479 332 623 facebook-names-unique.txt.bz2 29.07.2010 21:50 2 410 990 224 facebook-names-withcount.txt 29.07.2010 21:50 477 274 173 facebook-names-withcount.txt.bz2 29.07.2010 21:50 10 373 539 515 facebook-urls.txt 29.07.2010 21:50 1 389 556 176 facebook-urls.txt.bz2 29.07.2010 13:31 3 910 facebook.nse 29.07.2010 13:31 1 221 facebook.rb 29.07.2010 13:31 1 710 README Souborů: 19, Bajtů: 20 588 762 508

Připomenu i to, že Bowes mohl nabídnout dat i více než o 100 milionech lidí (ve skutečnosti jich Bowes nabídl 171 milionů) – Facebook jich má 500 milionů a zmíněná data nelze skrýt nastavením soukromím. Jeden z dalších opakovaných bludů. Jméno, příjmení, adresu Facebook profilu a ID (tedy číslo tohoto profilu) nikdy skutečně skrýt nemůžete. .

Kudy se Bowes dostal k datům

Ron Bowes se k datům velmi jednoduše, Facebook People Directory – http://www.facebook.com/directory/ – je prostě „telefonní seznam“ s veřejně dostupnými informacemi. Bowes je mohl „nasbírat“ přímo odtud, nebo mohl využít Google (desítky milionů stránek z tohoto veřejného seznamu jsousoučástí Google). Mě najdete někde na této stránce seznamu. Spolu s řadou dalších „Dočekalů“ na Facebooku.

Facebook People Directory - příklad seznamu
Facebook People Directory – příklad seznamu

Pokud se na Facebook People Directory podíváte, tak zjistíte, že to jsou přesně ty údaje, které Rob Bowes „získal“ a zpracoval – zpracoval do podobystatistiky. Ničeho jiného, než obyčejné a zpropadené statistiky.

Stranky z Facebook People Directory v Google
Stranky z Facebook People Directory v Google

A možná by vás mohlo zajímat, že veřejný přehled začal Facebook poskytovat už někdy v roce 2007 (Public Search Listings on Facebook).

K čemu je dobré mít 171 milionů jmen a přijmení?

Data získaná (a zveřejněná) Ronem Bowese nejsou osobní údaje (a ještě jednou je nutné zopakovat, že jde opravdu jenom o jméno (křestní,  příjmení, případně prostřední) uživatele Facebooku, adresu jeho Facebook profilu a ID (identifikační číslo) tohoto uživatele. Nejsou tam telefonní čísla, nejsou tam mailové adresy, nejsou tam žádné další údaje (byť by tam mohly být, jak můžete zjistit v Jak získat 100 milionů údajů o uživatelích Facebooku .)

Mimo statistické hodnoty je použitelnost těchto dat diskutabilní. Jsou použitelné nicméně pro další automatizované sbírání informací z Facebooku. S pomocí ID uživatelů je možné snáze použít Facebook Open Graph API a začít hledat skutečné osobní údaje – ale k tomu tento seznam ve skutečnosti nepotřebujete, můžete začít bez něj. A nebudete omezení tím, že Bowesův seznam velmi rychle zastarává.

Co dělat, když ve veřejném seznamu být nechcete

Váš účet nemusí být nutně součástí veřejného seznamu – na www.facebook.com/settings/?tab=privacypostačí pokračovat na Applications and Websites (Edit Your Settings) (levý spodní roh, česky viz obrázek vpravo).

Tam už najdete ve spodní části nastavení pro Veřejné hledání (Public Search) u kterého je zcela zcestný český i anglick popis.

Zobrazit náhled profilu tak, jak ho vidí uživatelé, kteří si vás najdou pomocí výhledávače /Show a preview of your Facebook profile when people look for you using a search engine.

Popis ignorujte, rozklikněte a můžete se „skrýt“ z veřejného seznamu.

Facebook - nastavení
Facebook – nastavení „Veřejného vyhledávání“

V seznamu nejste, v Open Graph API ale jste

Skrytí se vůči „telefonnímu“ seznamu Facebooku je jenom zbytečný a kosmetický krok – uživatel na Facebook je stále viditelný v Open Graph API. A pochopitelně, jakmile je někdo přihlášený k Facebooku, tak uživatelé vidí také. A „přihlásit“ se k Facebooku a sbírat údaje (stejně jako to dělal Ron Bowes) je jednoduché.

V Open Graph API se o vás nachází seznam na adrese, která vypadá nějak jako http://graph.facebook.com/Daniel.Docekal (záleží co máte za adresu Facebook profilu) případně http://graph.facebook.com/570949930 (ono číslo je vaše Facebook ID). A pokud si na zkoušku vypnete zobrazování ve veřejném seznamu a zkusíte Facebook Open Graph API, tak uvidíte stále totéž.

{
„id“: „570949930“,
„name“: „Daniel Bradbury Dou010dekal“,
„first_name“: „Daniel“,
„middle_name“: „Bradbury“,
„last_name“: „Dou010dekal“,
„link“: „http://www.facebook.com/Daniel.Docekal“,
„gender“: „male“,
„locale“: „en_US“
}

Pokud chcete vědět víc o Open Graph API, tak pokračujte do Údaje 100 milionů uživatelů Facebooku volně k dispozici. Mimo jiné vám tam možná dojde, že kdyby Ron Bowes použil právě Open Graph API, tak by možná zjistil daleko víc údajů – a skutečně osobních. Byť by měl problém s tím, jak „rychle“ by mohl data sbírat – pokud by nebyl autentikovaný (přes „access token“) měl by limit 100 dotazů na 24 hodin, při autentikaci jde o 600 volání za 600 sekund.