Přestože dle AOL jde o pouhá procenta z celkového objemu vyhledávání, získaná data jsou extrémně kvalitní a přesná. Obsahují téměř vše důležité, co lze o chování uživatelů ve vyhledávačích zaznamenávat. Především to jsou jednotlivé vyhledávací fráze a následné údaje o kliknutí, včetně pozice ve výsledcích vyhledávání. Akce jednoho uživatele jsou „spojeny“ jeho unikátním ID.
Původní odkaz již samozřejmě nefunguje, nicméně jednoduše lze dohledat mnoho mirror serverů, kde je a bude archiv (450MB) volně ke stažení. Informace, získané analýzou těchto záznamů budou zajímat každého provozovatele webu, který alespoň minimálně těží jeho viditelnosti ve vyhledávačích.
Ohledně těchto dat vznikly dva užitečné servery, konkrétně AOLDataCollection.com, kde si můžete hrát s SQL rozhranním nad databází obsahující tato data a AOL 500K Wiki, kde je posbíráno mnoho informací, které se zatím z dat podařilo vyčíst.
Nicméně, je až s podivem, jak se ve spršce zpráv o ochraně osobních dat málo mluví o zprávě Picture Of Search tří zaměstnanců AOL, jejíž zveřejnění má podobný příběh.
- Picture Of Search – původní odkaz
- Picture Of Search (jinde)
Původ informací uvedených ve zprávě nemá s únikem dat žádnou přímou spojitost, dokument obsahuje vlastní reference na jiné studie.
Picture Of Search krátce
- Oborům vyhledávání vládne zábava, následovaná nakupováním. Erotická témata jsou až na třetím místě.
- Několik málo uživatelů zadává většinu dotazů – 20% uživatelů hledá 70%
unikátních vyhledávacích frází (klasické pravidlo 80/20).
Zdroj: A Picture Of Search - Vrchol četnosti vyhledávání je kolem deváté hodiny večerní, následuje prudký
propad na minimum kolem šesté ranní. Největší nárůst je mezi osmou hodinou ranní
a polednem. Je zajímavé, že tento graf se lehce mění podle tématu vyhledávání.
Zdroj: A Picture Of Search - Co se týče délky vyhledávacích frází, zpráva uvádí, že nejčastější dotazy
jsou o třech slovech (23%). Následují dvouslovné a čtyřslovné dotazy, obě
varianty mají přibližně 20%. Na čtvrtém místě jsou jednoslovné, 15%, a od
pětislovných (11%) jde dále trend dolu.
Zdroj: A Picture Of Search
Nyní ale již ke skutečným analýzám uniklých dat.
Nejčastější vyhledávání
| Slovo | Počet vyhledávání |
|---|---|
| 298702 | |
| ebay | 125758 |
| yahoo | 117145 |
| yahoo.com | 89392 |
| mapquest | 79563 |
| google.com | 72414 |
| myspace.com | 69549 |
| myspace | 65047 |
| www.yahoo.com | 38570 |
| www.google.com | 38400 |
| internet | 36022 |
| http | 27263 |
Nic překvapivého. Lidé si pletou vyhledávací proužek s panelem adresy webového prohlížeče a nechápou, základy internetu. Zdroj: http://www.jmir.org/…Top_Searches.
Pozice a kliky
- Více než 42% kliknutí byla na první pozici ve výsledcích. Jen 12% kliků bylo na druhou a 8,47% na třetí.
- Pouze 4,37% kliků bylo na pozice 11 až 20 (druhá stránka) a 2,42% na pozice 21 až 30 (třetí stránka).
- Pozice 10 (úplně vespod na první straně) si vede lépe než pozice 9 (2,97% oproti 2,82%) a skoro tak dobře jako pozice 8 (2,98%).
- Skoro 90% kliknutí (89,71%) bylo na odkazy z první strany výsledků.
Zdroj: http://www.webcitation.org/5I2GgrxZ0
Pozice a kliky přesně
- Pozice 1: 2075765 kliků
- Pozice 2: 586100 = 3.5× méně
- Pozice 3: 418643 = 4.9× méně
- Pozice 4: 298532 = 6.9× méně
- Pozice 5: 242169 = 8.5× méně
- Pozice 6: 199541 = 10.4× méně
- Pozice 7: 168080 = 12.3× méně
- Pozice 8: 148489 = 14.0× méně
- Pozice 9: 140356 = 14.8× méně
- Pozice 10: 147551 = 14.1× méně
Zdroj: http://www.webcitation.org/5I8NzDbdU
Kliky na prvních 100 pozic
Pozor, svislá osa má logaritmické měřítko, tedy mezi první a třetí pozicí je rozdíl jednoho desítkového řádu. Lokální výstupky znamenají koncové pozice stránky (10×n-té) – viz výše.
Nejčastější domény
| Pořadí | Doména | Počet | Procent |
|---|---|---|---|
| 1 | http://www.google.com | 143666 | 1,85% |
| 2 | http://www.myspace.com | 65014 | 0,84% |
| 3 | http://www.yahoo.com | 60996 | 0,79% |
| 4 | http://en.wikipedia.org | 49940 | 0,64% |
| 5 | http://www.amazon.com | 42755 | 0,55% |
| 6 | http://www.imdb.com | 40220 | 0,52% |
| 7 | http://www.mapquest.com | 37885 | 0,49% |
| 8 | http://www.ebay.com | 31348 | 0,40% |
| 9 | http://mail.yahoo.com | 21675 | 0,28% |
| 10 | http://www.bankofamerica.com | 19378 | 0,25% |
Odhady počtu kliků
Z počtu kliknutí na jednotlivé pozice vzešel nový SEO nástroj, Expected clicks by Seach Engine and Rank. Kombinuje danou tabulku, počet vyhledávání za uplynulý měsíc dle Overture Keyword Selector Tool a tržní podíl jednotlivých vyhledávačů. Výsledkem je předpověď počtu návštěvníků za měsíc v závislosti na počtu vyhledávání dle Overture a pozicích v jednotlivých vyhledávačích.
Jako většina podobných SEO nástrojů je třeba výsledky brát s rezervou (data z AOL jsou použita na všechny vyhledávače apod.).
Více informací: http://seoblackhat.com/…e-yahoo-msn/
Zajímavosti
Příběhy lidí, vzešlých z jejich vyhledávacích frází: http://www.insomniablog.net/…_resear.html