Zde se nacházíte:
DotProfit.cz » SEO » Co se dá vyčíst ze záznamů vyhledávání uniklých firmě AOL?

Co se dá vyčíst ze záznamů vyhledávání uniklých firmě AOL?

Je tomu několik dní, co z firmy AOL uniklo 2.2GB logů používání jejich vyhledávače. Celkově se jedná o 19 milionů jednotlivých vyhledávání 658 tisíci uživateli v době od března do června letošního roku.

Přestože dle AOL jde o pouhá procenta z celkového objemu vyhledávání, získaná data jsou extrémně kvalitní a přesná. Obsahují téměř vše důležité, co lze o chování uživatelů ve vyhledávačích zaznamenávat. Především to jsou jednotlivé vyhledávací fráze a následné údaje o kliknutí, včetně pozice ve výsledcích vyhledávání. Akce jednoho uživatele jsou „spojeny“ jeho unikátním ID.

Původní odkaz již samozřejmě nefunguje, nicméně jednoduše lze dohledat mnoho mirror serverů, kde je a bude archiv (450MB) volně ke stažení. Informace, získané analýzou těchto záznamů budou zajímat každého provozovatele webu, který alespoň minimálně těží jeho viditelnosti ve vyhledávačích.

Ohledně těchto dat vznikly dva užitečné servery, konkrétně AOLDataCollec­tion.com, kde si můžete hrát s SQL rozhranním nad databází obsahující tato data a AOL 500K Wiki, kde je posbíráno mnoho informací, které se zatím z dat podařilo vyčíst.

Nicméně, je až s podivem, jak se ve spršce zpráv o ochraně osobních dat málo mluví o zprávě Picture Of Search tří zaměstnanců AOL, jejíž zveřejnění má podobný příběh.

Původ informací uvedených ve zprávě nemá s únikem dat žádnou přímou spojitost, dokument obsahuje vlastní reference na jiné studie.

Picture Of Search krátce

  • Oborům vyhledávání vládne zábava, následovaná nakupováním. Erotická témata jsou až na třetím místě.
  • Několik málo uživatelů zadává většinu dotazů – 20% uživatelů hledá 70% unikátních vyhledávacích frází (klasické pravidlo 80/20).
    80/20
    Zdroj: A Picture Of Search
  • Vrchol četnosti vyhledávání je kolem deváté hodiny večerní, následuje prudký propad na minimum kolem šesté ranní. Největší nárůst je mezi osmou hodinou ranní a polednem. Je zajímavé, že tento graf se lehce mění podle tématu vyhledávání.
    Frequency
    Zdroj: A Picture Of Search
  • Co se týče délky vyhledávacích frází, zpráva uvádí, že nejčastější dotazy jsou o třech slovech (23%). Následují dvouslovné a čtyřslovné dotazy, obě varianty mají přibližně 20%. Na čtvrtém místě jsou jednoslovné, 15%, a od pětislovných (11%) jde dále trend dolu.
    Length
    Zdroj: A Picture Of Search

Nyní ale již ke skutečným analýzám uniklých dat.

Nejčastější vyhledávání

Slovo Počet vyhledávání
google 298702
ebay 125758
yahoo 117145
yahoo.com 89392
mapquest 79563
google.com 72414
myspace.com 69549
myspace 65047
www.yahoo.com 38570
www.google.com 38400
internet 36022
http 27263

Nic překvapivého. Lidé si pletou vyhledávací proužek s panelem adresy webového prohlížeče a nechápou, základy internetu. Zdroj: http://www.jmir­.org/…Top_Sear­ches.

Pozice a kliky

  • Více než 42% kliknutí byla na první pozici ve výsledcích. Jen 12% kliků bylo na druhou a 8,47% na třetí.
  • Pouze 4,37% kliků bylo na pozice 11 až 20 (druhá stránka) a 2,42% na pozice 21 až 30 (třetí stránka).
  • Pozice 10 (úplně vespod na první straně) si vede lépe než pozice 9 (2,97% oproti 2,82%) a skoro tak dobře jako pozice 8 (2,98%).
  • Skoro 90% kliknutí (89,71%) bylo na odkazy z první strany výsledků.

Zdroj: http://www.web­citation.org/5I­2GgrxZ0

Pozice a kliky přesně

  • Pozice 1: 2075765 kliků
  • Pozice 2: 586100 = 3.5× méně
  • Pozice 3: 418643 = 4.9× méně
  • Pozice 4: 298532 = 6.9× méně
  • Pozice 5: 242169 = 8.5× méně
  • Pozice 6: 199541 = 10.4× méně
  • Pozice 7: 168080 = 12.3× méně
  • Pozice 8: 148489 = 14.0× méně
  • Pozice 9: 140356 = 14.8× méně
  • Pozice 10: 147551 = 14.1× méně

Zdroj: http://www.web­citation.org/5I­8NzDbdU

Kliky na prvních 100 pozic

Pozor, svislá osa má logaritmické měřítko, tedy mezi první a třetí pozicí je rozdíl jednoho desítkového řádu. Lokální výstupky znamenají koncové pozice stránky (10×n-té) – viz výše.

Top 100

Nejčastější domény

Pořadí Doména Počet Procent
1 http://www.go­ogle.com 143666 1,85%
2 http://www.mys­pace.com 65014 0,84%
3 http://www.ya­hoo.com 60996 0,79%
4 http://en.wiki­pedia.org 49940 0,64%
5 http://www.ama­zon.com 42755 0,55%
6 http://www.im­db.com 40220 0,52%
7 http://www.map­quest.com 37885 0,49%
8 http://www.ebay­.com 31348 0,40%
9 http://mail.y­ahoo.com 21675 0,28%
10 http://www.ban­kofamerica.com 19378 0,25%

Odhady počtu kliků

Z počtu kliknutí na jednotlivé pozice vzešel nový SEO nástroj, Expected clicks by Seach Engine and Rank. Kombinuje danou tabulku, počet vyhledávání za uplynulý měsíc dle Overture Keyword Selector Tool a tržní podíl jednotlivých vyhledávačů. Výsledkem je předpověď počtu návštěvníků za měsíc v závislosti na počtu vyhledávání dle Overture a pozicích v jednotlivých vyhledávačích.

Jako většina podobných SEO nástrojů je třeba výsledky brát s rezervou (data z AOL jsou použita na všechny vyhledávače apod.).

Více informací: http://seoblac­khat.com/…e-yahoo-msn/

Zajímavosti

Příběhy lidí, vzešlých z jejich vyhledávacích frází: http://www.in­somniablog.net/…_re­sear.html

Michal Till
Líbilo se? Tak neváhej a