Dnes by som vám rád ukázal praktický príklad, ako najväčší český vyhľadávač (pre tých, čo nevedia – áno, v Čechách sa vyhľadáva Seznamom, nie Googlom) indexuje internetové stránky. Najlepšie je demonštrovať na praktickom príklade, takže sa pustime do toho.
Už od októbra mám problémy so Seznamom. Majoritný český vyhľadávač nie je schopný rýchlej indexácie.
1.septembra 2010 som spustil českú stránku o filmoch. Web je postavený na WordPresse, skvelo prelinkovaný a optimalizovaný pre vyhľadávače. V jeho databáze sa nachádza cez 3500 ukážok na filmy, každý film má unikátny popis v českom jazyku. Tak isto všetky názvy filmov sú (ak boli dabované), v čestine. Web som registroval do najdôležitejších katalógov (žiadne stovky, len zopár veľkých a kvalitných). V priebehu asi mesiaca web získal množstvo spätných odkazov od majoritných webov s filmovým zameraním.
V októbri bol celý web zaindexovaný v Google.cz – dokopy niečo vyše 4000 stránok. Presne 2.októbra bol počet zaindexovaných stránok webu 2. Ani o ďalších 10 dní sa situácia nezmenila. Na supporte Seznamu písali o dohľadnej dobe, v ktorej sa indexácia opäť zrýchli.
Máme tu február 2011 a teda 6 mesiacov od spustenia spomínaného webu. Google zaindexoval všetko, Seznam 828 stránok. Zisk z reklamy na tomto webe pritom (samozrejme) závisí od návštevnosti a tá značne vzrastie vždy, keď Seznam zaindexuje zopár stránok navyše. Vlastne sa dá tvrdiť, že Seznam svojou pomalou indexáciou (už nie nového) webu brzí jeho zárobky a celkový rozvoj.
To naozaj za polroka crawlery Seznamu nestihli reindexovať 400 mil. URL, ktoré spomínal pán Jakub Jareš zo supportu a preto je indexácia nových webov tak pomalá?
Ak by sme to chceli počítať, tak:
400 000 000 URL / 182 dní (pol roka) = 2 197 802 URL / deň
2,2 milióna URL stránok za deň je na Seznam asi priveľa, ale s tým museli počítať, keď začali s kompletnou reindexáciou.
Seznam proste ani po pol roku nedokáže dostatočne rýchlo indexovať nové weby.
Môže sa mu to nejak vypomstiť?
Tvorcovia webstránok nové weby určite neprestanú vytvárať a klasický český užívateľ bude na svojej domovskej stránke (www.seznam.cz) v pokoji vyhľadávať ako obvykle. Nové weby firiem, ich produkty v nových eshopoch, nové blogy a proste všetko nové si bude musieť pekne počkať. Alebo sa mýlim?
Pingback: Tweets that mention Seznam.cz a pomalá indexácia nových webstránok – praktický príklad -- Topsy.com