Co přesně je v zveřejněné databází „osobních údajů“ uživatelů Facebooku. Co je pravda, co je lež, a proč čeští novináři zveřejňují lži a bludy. Jak přesně se k Ron Bowes k datům dostal. A co můžete udělat pro to, abyste nebyli ve veřejném „telefonním“ seznamu Facebooku.
Jeden z prvních solidních cizojazyčných článků na toto téma – Hacker Publishes Profile Data Of 100M Facebook Users – má zcestný jenom titulek, samotný článek správně upozorňuje, že nešlo o žádného hackera. Stejně jako zveřejněná data nejsou žádné osobní údaje. Ron Bowes vpodstatě nabídl ke stažení ekvivalent veřejného telefonního seznamu. V celkem zhruba 16GB dat (po rozbalení) zjistíte, že na Facebooku je 913 465 lidí s příjmením Smith, 977 014 lidí s křestním jménem Michael a nejvíce lidí se jmenuje Becky Smith (1 230).
Nejčastější příjmení | Nejčastější křestní jména | Nejčastější jména |
913465 smith 571819 johnson 512312 jones 503266 williams 471390 brown 386764 lee 360010 khan 355639 singh 343220 kumar 324972 miller |
977014 michael 963693 john 924816 david 819879 chris 640957 mike 602088 james 584438 mark 515686 jason 503658 robert 484403 jessica |
1230 becky smith 1229 prashant kumar 1229 brian brown 1228 patricia smith 1228 mike murphy 1228 amy williams 1228 abdul aziz 1227 larry johnson 1226 masud rana 1225 linh nguyen |
Takhle vypadají soubory zveřejnění Bowesem. Počet výskytů a jméno/příjmení a kombinace jména a příjmení.
Nic ale nebrání aby to TN.CZ označilo za „hrůzostrašný a děsivý seznam jmen“, iDnes.cz tvrdilo, že ze seznamu budou mít radost spammeři, iHNed.cz do toho přidává něco o fotografiích a Blesk.cz dokonce píše, že jsou tam adresy a telefonní čísla (podrobnější souhrn viz 100 milionů Facebook účtů a hlouposti v českých médiích). Že česká i zahraniční média budou uveřejňova lži a bludy, jsem upozorňoval už v prvním blognutí na toto téma – Údaje 100 milionů uživatelů Facebooku volně k dispozici.
Stejně jako bylo jasné, že si nikdo z „novinářů“ o kauze píšících nestáhne nabízená data – pak by totiž věděli, že Ron Bowes nezveřejnil žádné osobní údaje. Jenom jména, příjmení, facebook ID (což je číslo, nikoliv přihlašovací jméno) a adresu profilu člověka na Facebooku – věci, které jsou volně dostupné jak na webu (kudy je Bowes programově získal pomocí robota) tak pomoci Facebook Open Graph API.
Výpis adresáře downloadsfbnames 29.07.2010 21:50 300 739 870 facebook-f.last-withcount.txt 29.07.2010 21:50 66 348 431 facebook-f.last-withcount.txt.bz2 29.07.2010 21:50 175 729 831 facebook-first.l-withcount.txt 29.07.2010 21:50 36 932 295 facebook-first.l-withcount.txt.bz2 29.07.2010 19:46 73 134 218 facebook-firstnames-withcount.txt 29.07.2010 19:46 16 375 441 facebook-firstnames-withcount.txt.bz2 29.07.2010 21:50 91 677 133 facebook-lastnames-withcount.txt 29.07.2010 21:50 21 166 232 facebook-lastnames-withcount.txt.bz2 29.07.2010 21:50 2 561 936 569 facebook-names-original.txt 29.07.2010 21:50 504 060 392 facebook-names-original.txt.bz2 29.07.2010 21:50 1 609 962 544 facebook-names-unique.txt 29.07.2010 21:50 479 332 623 facebook-names-unique.txt.bz2 29.07.2010 21:50 2 410 990 224 facebook-names-withcount.txt 29.07.2010 21:50 477 274 173 facebook-names-withcount.txt.bz2 29.07.2010 21:50 10 373 539 515 facebook-urls.txt 29.07.2010 21:50 1 389 556 176 facebook-urls.txt.bz2 29.07.2010 13:31 3 910 facebook.nse 29.07.2010 13:31 1 221 facebook.rb 29.07.2010 13:31 1 710 README Souborů: 19, Bajtů: 20 588 762 508
Připomenu i to, že Bowes mohl nabídnout dat i více než o 100 milionech lidí (ve skutečnosti jich Bowes nabídl 171 milionů) – Facebook jich má 500 milionů a zmíněná data nelze skrýt nastavením soukromím. Jeden z dalších opakovaných bludů. Jméno, příjmení, adresu Facebook profilu a ID (tedy číslo tohoto profilu) nikdy skutečně skrýt nemůžete. .
Kudy se Bowes dostal k datům
Ron Bowes se k datům velmi jednoduše, Facebook People Directory – http://www.facebook.com/directory/ – je prostě „telefonní seznam“ s veřejně dostupnými informacemi. Bowes je mohl „nasbírat“ přímo odtud, nebo mohl využít Google (desítky milionů stránek z tohoto veřejného seznamu jsousoučástí Google). Mě najdete někde na této stránce seznamu. Spolu s řadou dalších „Dočekalů“ na Facebooku.
Facebook People Directory – příklad seznamu
Pokud se na Facebook People Directory podíváte, tak zjistíte, že to jsou přesně ty údaje, které Rob Bowes „získal“ a zpracoval – zpracoval do podobystatistiky. Ničeho jiného, než obyčejné a zpropadené statistiky.
Stranky z Facebook People Directory v Google
A možná by vás mohlo zajímat, že veřejný přehled začal Facebook poskytovat už někdy v roce 2007 (Public Search Listings on Facebook).
K čemu je dobré mít 171 milionů jmen a přijmení?
Data získaná (a zveřejněná) Ronem Bowese nejsou osobní údaje (a ještě jednou je nutné zopakovat, že jde opravdu jenom o jméno (křestní, příjmení, případně prostřední) uživatele Facebooku, adresu jeho Facebook profilu a ID (identifikační číslo) tohoto uživatele. Nejsou tam telefonní čísla, nejsou tam mailové adresy, nejsou tam žádné další údaje (byť by tam mohly být, jak můžete zjistit v Jak získat 100 milionů údajů o uživatelích Facebooku .)
Mimo statistické hodnoty je použitelnost těchto dat diskutabilní. Jsou použitelné nicméně pro další automatizované sbírání informací z Facebooku. S pomocí ID uživatelů je možné snáze použít Facebook Open Graph API a začít hledat skutečné osobní údaje – ale k tomu tento seznam ve skutečnosti nepotřebujete, můžete začít bez něj. A nebudete omezení tím, že Bowesův seznam velmi rychle zastarává.
Co dělat, když ve veřejném seznamu být nechcete
Váš účet nemusí být nutně součástí veřejného seznamu – na www.facebook.com/settings/?tab=privacypostačí pokračovat na Applications and Websites (Edit Your Settings) (levý spodní roh, česky viz obrázek vpravo).
Tam už najdete ve spodní části nastavení pro Veřejné hledání (Public Search) u kterého je zcela zcestný český i anglick popis.
Zobrazit náhled profilu tak, jak ho vidí uživatelé, kteří si vás najdou pomocí výhledávače /Show a preview of your Facebook profile when people look for you using a search engine.
Popis ignorujte, rozklikněte a můžete se „skrýt“ z veřejného seznamu.
Facebook – nastavení „Veřejného vyhledávání“
V seznamu nejste, v Open Graph API ale jste
Skrytí se vůči „telefonnímu“ seznamu Facebooku je jenom zbytečný a kosmetický krok – uživatel na Facebook je stále viditelný v Open Graph API. A pochopitelně, jakmile je někdo přihlášený k Facebooku, tak uživatelé vidí také. A „přihlásit“ se k Facebooku a sbírat údaje (stejně jako to dělal Ron Bowes) je jednoduché.
V Open Graph API se o vás nachází seznam na adrese, která vypadá nějak jako http://graph.facebook.com/Daniel.Docekal (záleží co máte za adresu Facebook profilu) případně http://graph.facebook.com/570949930 (ono číslo je vaše Facebook ID). A pokud si na zkoušku vypnete zobrazování ve veřejném seznamu a zkusíte Facebook Open Graph API, tak uvidíte stále totéž.
{
„id“: „570949930“,
„name“: „Daniel Bradbury Dou010dekal“,
„first_name“: „Daniel“,
„middle_name“: „Bradbury“,
„last_name“: „Dou010dekal“,
„link“: „http://www.facebook.com/Daniel.Docekal“,
„gender“: „male“,
„locale“: „en_US“
}
Pokud chcete vědět víc o Open Graph API, tak pokračujte do Údaje 100 milionů uživatelů Facebooku volně k dispozici. Mimo jiné vám tam možná dojde, že kdyby Ron Bowes použil právě Open Graph API, tak by možná zjistil daleko víc údajů – a skutečně osobních. Byť by měl problém s tím, jak „rychle“ by mohl data sbírat – pokud by nebyl autentikovaný (přes „access token“) měl by limit 100 dotazů na 24 hodin, při autentikaci jde o 600 volání za 600 sekund.