Nedávná studie, kterou provedli tři zaměstnanci Mozilly, se zaměřila na soukromí, které prohlížeče uživatelům internetu nabízejí. Jejich výsledky ukazují, že většina uživatelů má jedinečné webové prohlížeče, které umožňují online inzerentům vytvářet přesné profily.
Tyto profily lze poté použít ke sledování a identifikaci uživatelů v různých sadách dat, i když tyto obsahují pouze malé příklady webové historie uživatele.
Studie odstraňuje mýtus, že ani anonymní historie surfování není pro online inzerenty užitečná. Studie ve skutečnosti ukazuje, že i malý seznam 50–150 oblíbených a nejsledovanějších domén uživatele může inzerentům umožnit vytvořit jedinečný sledovací profil.
Potvrzení podobné studie pro rok 2012
Výzkumný dokument společnosti Mozilla má název „Replikace: Proč stále nemůžeme procházet mír: O jedinečných a znovu identifikovatelných příbězích webové historie“ [PDF]. Tento dokument byl představen na začátku tohoto měsíce na bezpečnostní konferenci USENIX a navazuje na další akademickou studii publikovanou v roce 2012 [PDF].
Tato studie z roku 2012 byla v té době jedním z prvních rozsáhlých průzkumů soukromí uživatelů: analyzovala se data historie prohlížeče od více než 380 000 uživatelů internetu. V období od ledna 2009 do května 2011 vědci použili online testovací web a kód CSS k určení, které stránky z předem definovaného seznamu 6 000 domén uživatelé navštívili.
Studie z roku 2012 ukázala, že 97% uživatelů, kteří navštívili tento testovací web, mělo ve své webové historii jedinečný seznam webů, díky čemuž byla historie procházení účinným prostředkem rozpoznávání uživatelů. Kromě toho, když byli uživatelé požádáni, aby se vrátili na testovací web, vědci uvedli, že mohou uživatele identifikovat na základě jejich historie profilu od první návštěvy.
Míra přesnosti byla 38%, když se výzkumníci podívali na soubor dat webové historie pro 50 nejpopulárnějších domén uživatele a 70% při analýze datových sad v 500 oblastech.
Výsledky studie Mozilla 2020
V loňském roce chtěli vědci z Mozilly přehodnotit, zda je webová historie stále platným vektorem otisků prstů a zda studie z roku 2012 stále platí. Nový experiment byl proveden mezi 16. červencem a 13. srpnem 2019. Vědci Mozilly uvedli, že více než 52 000 uživatelů souhlasilo s účastí a souhlasilo s poskytnutím anonymních informací o surfování.
Ale tentokrát, protože data byla shromažďována z prohlížeče Firefox, a nikoli prostřednictvím webové stránky, která provádí testování CSS, jsou shromážděné informace mnohem přesnější a spolehlivější. Data, která vědci z Mozilly shromažďují, jsou navíc stejného typu, jaké dnešní online analytické společnosti také shromažďují o uživatelích, a to buď prostřednictvím datových partnerství, mobilních aplikací, online reklamy nebo jiných mechanismů.
Stejně jako v roce 2012 byl sběr dat prováděn ve dvou krocích, ve dvou týdnech, kdy uživatelé sdíleli svou webovou historii první týden a poté druhý den, aby vědci z Mozilly viděli, že mohou znovu identifikovat uživatele.
Tým Mozilly celkem uvedl, že shromáždil data o přibližně 35 milionech návštěv webových stránek na 660 000 unikátních doménách. A tento přístup k lepším datům se okamžitě promítl do výsledků studie. Mozilla uvedla, že 99% profilů surfování, které pro studii shromáždili, bylo pro každého uživatele jedinečné. Tato jedinečnost usnadnila vědcům Mozilly identifikovat uživatele během druhého týdne studie.
Přesnost je také vyšší než ve studii z roku 2012. Mozilla tvrdí, že má neidentifikovatelnou míru téměř 50% u datových sad, které obsahují 50 domén ve webové historii uživatele. Tento stupeň opětovné identifikace se zvyšuje na více než 80%, protože vědci Mozilly rozšiřují datovou sadu webové historie na 150 domén.
To naznačuje, že analytické společnosti a inzerenti nepotřebují ke sledování uživatelů rozsáhlé seznamy dat z webové historie a že specifikace každého uživatele a jeho oblíbené stránky mu přestávají poskytovat informace. i když jsou data anonymní a adresy URL jsou zkráceny.
Video z prezentace týmu Mozilly najdete zde.
Zdroj: ZDNet.com