První veřejná verze databáze je v testu
Vážená veřejná odbornosti,
přepsání samotného mechanismu pro získávání stránek s sebou nese změny v logice generování hledací databáze. Proto jsme se jako obvykle rozhodli přistoupit ke zveřejnění testovací verze hledání s dostatečným předstihem před tím, než půjdeme do ostrého provozu. Na tradiční adrese http://searchtest.seznam.cz naleznete obsah nové výdejové databáze. Celkový počet zaindexovaných stránek je zhruba stejný jako v současné výdejové databázi, tj. necelých 400 miliónů.
Pomozte nám při odhalování nedostatků této testovací (alfa) verze databáze. Zkontrolujte prosím své weby.
Co nás zajímá?
Nejde o pořadí. Testujeme obsah databáze. Chceme zjistit, zda v databázi nic důležitého nechybí.
- Zcela chybějící domény
Pokud při hledání s operátorem site: (např. site:seznam.cz) není nalezena žádná stránka z domény. - Málo proindexované domény/počet zaindexovaných stránek pro jednotlivé weby.
Odhad počtu vyhledaných stránek při hledání s operátorem site: by neměl být výrazně nižší než v současném hledání. - Chybějící navigační stránka, typicky hlavní strana webu.
Na navigační dotaz chybí ve výsledcích ta jediná správná stránka (př.: dotaz konopiště -> chybějící HP konopiště) - Četnost návštěv robota na jednotlivých url.
V přístupových lozích vašich webů lze porovnat periody návštěv současného a nového robota. Stránky, které se často mění, by měly být navštěvovány ve výrazně kratším intervalu než stránky neměnné. - Jakékoli další nesrovnalosti a nestandardní chování robota (ignorování návštěvních period, definic v robots.txt, meta tag noindex aj.).
Co není předmětem testování?
Předmětem testování není pořadí stránek. Nejedná se o finální verzi hledání. Pořadí stránek vzhledem ke konkrétním dotazům není konečné, váhy hledání se budou ještě výrazně měnit.
Pokud narazíte na chybějící stránku/doménu nebo jinou chybu související s robotem, dejte nám prosím vědět. Všechny vaše podněty budeme vyhodnocovat, ale není v našich silách jednotlivě odpovídat v komentářích. V případě závažných reportů, k nimž budeme potřebovat detailnější informace, vás kontaktujeme na e-mailu.
Za vaše konstruktivní připomínky předem díky.

[1]Dobrá práce. Mám jednu připomínku, robot nyní špatně indexuje omezení z robots.txt http://searchtest.seznam.cz/?q=site%3Aalbixon.cz hned první odkaz
[2]Dobrá práce, vážně. Už bylo načase. Sice jsem našel stále některé problémy s pořadím relevantních stránek, ale jak sami píšete, o to v testu nejde, a pevně veřím, že se výsledky skutečně zlepší. Ohledně indexace stránek, vyřazení HTTP 404, agragace výsledků apod. již nyní viditelné změny k lepšímu. Jen tak dál.
[3]Ahoj myslím že to vypadá velmi dobře, jen bych si dal pozor na „obejítí“ našeptávače jako se to děje nyní např na slovo půjčky :) Zkuste si v současném vyhledávači začít hledat půjčky a vyskočí vám tam mega fráze: pujcky bez registru bez prijmu bez poplatku bez zastavy zenam na md – což asi není dobře ?
[4]Zdravím, vypadá to podstatné lépe, alespoň co se indexování týče : 1) Starý bot neindexoval už téměř vůbec, nový jede cca 1/10s. 2) Máte občas nevhodně (nebo vhodně?) chycené description : http://searchtest.seznam.cz/?q=site%3Atixik.com+Pa%C5%99%C3%AD%C5%BE&sId=RSM6xGElSBYVsejM20zB&sourceid=top&thru= třetí výsledek Paříž. 3) Zvažujete něco jako WordPress ping? Při vysokém počtu článků denně by bot mohl začít indexovat opravdu rychle zejména ten správný obsah. 4) Sice jste to psali, ale… pevně věřím, že se pořadí opravdu ještě zásadně změní: http://searchtest.seznam.cz/?q=egremni&sId=RSM6xGElZv37sev3yNwg&sourceid=top&thru= pouhé KW v title obrázku namísto téměř elaborátu (http://cs.tixik.com/plaz-egremni-2356296.htm) asi nejsou pro uživatele to pravé.
[5]Koukám že IDN stále neumíte, nechcete se stydět? Teď když už funguje i v .eu, ve všech prohlížečích a vy to pořád ignorujete. Už si konečně zvykněte, že to je standardní rozšíření. Ostuda! Viz např. doména http://xn--hkyrky-ptac70bc.cz/ kterou vůbec nemáte. Srovnejte dotaz „háčky čárky“ třeba na Googlue.
[6]na dotaz http://searchtest.seznam.cz/?q=kralovske+spani&sId=zXk8QYxXOqNkwVHdZSwV&sourceid=top&thru= nenalezne rootovou stranku ale www.kralovske-spani.cz/matrace-do-postele.html
[7][6] do presneni pri site:www.kralovske-spani.cz hlavni strana nenalezena
[8]Několik týdnů stará stránka není v indexu viz http://searchtest.seznam.cz/?q=site%3Abulvy.cz&sId=U-LhVo-iwdeEwVHnRzAG&sourceid=top&thru=
[9]site:www.xparfemy.cz nenalezena HP
[10]alfa verze 82 zaindexovanych stranek, stara verze 1375, je to docela velky rozdil
[11]site:www.dekorace-do-bytu.cz alfa verze 76 zaindexovanych , stara verze pres 6.000
[12]Mám málo zaindexovaných stránek, viz: http://searchtest.seznam.cz/?q=site%3Avezovky.cz vs. http://search.seznam.cz/?q=site%3Avezovky.cz
[13]můj eshop www.smallcars.cz má v původní verzi na site:smallcars.cz celkem 15297 stránek, v nové verzi pak nepatrně víc – 15680. Nicméně při zadání site: na google získám číslo přes 44 tisíc. Takže z tohoto pohledu to pro mne neznamená výraznější změnu, patrně :) držím palce ať to jde :)
[14]Zdravím, v testovací verzi máme o 50% nižší index. 242 162 nalezených stránek nová verze. 444 251 nalezených stránek stará verze. www.hledejceny.cz.
[15]Mam zaindexovanou pouze hlavni stranku na nove verzy, stara verze ma indexovanych 20 stranek ale v sitemap.xml mam 58 stranek takze taky nic moc ;). http://zahrajsi.eu/
[16]site:www.annonce.cz – na betě neukáže homepage
[17]Ahoj Honzo, rád vidím že stále běháš.. Tak Albion jo? :) .. ok.. Měj se fajn, JF
[18]Zdravím, search.seznam.cz – site:gabinka.cz – 776 stránek a searchtest – site:gabinka.cz – 242 stránek
[19]Také se připojuji k pochvale, na všechny testované domény nalezl nový robot více stránek než bylo v původním indexu – někdy i trojnásobek.
[20]Zdravím všechny svoje fanoušky, moje stránky se v novém indexu zmenšily o skoro jednu čtvrtinu.. http://searchtest.seznam.cz/?q=site%3Awww.karelgott.com
[21]Konečně jste přiznali, že výpadek HP není neobvyklý. Škoda že váš helpdesk stále rádí lépe optimalizujte:(
[22]Tohle je ještě na dlouho… Fakt sry ale dmc je to že ten kdo je naučený na seznam hledá seznamem a těžko budete laikovi řikat že seznam je shit di a hledej na google nebo jinde tam se indexuje a katualizuje.Tohle byl podle mě pro seznam nešťasnej (sklik ěťastněj) krok. Osobně nechápu politiku seznamu, spustit něco co neběží pak běží pak zase běží a teď chlácholí že indexuje… Jako psát že „nezajímají nás ranky“ to je jako že potřebujete vědět že to aspoň už indexuje ?? Že to už aspoň po půl roce dělá i relevantní scr ??? To si fakt děláte srandu už nebo sou tady už všichni kolem tak blbi že vám odkejvou všechno
[23]btw: neni co chválit ani atd. dokud nebudete mít hotovo tohle je už fakt hrůza. Namixovat a těžit a na uživatele kašlat
[24]Zamakejte na detekci duplicit, to by indexovaci bot mel take umet. http://searchtest.seznam.cz/?q=zidle druhe a treti misto naprosto totozne weby http://www.kancelarske-zidle-kresla.cz/zidle-do-kancelare/zdravotni-zidle-therapia-maxi-991/ a http://www.kastro.cz/kancelarske-zidle/zdravotni-zidle-therapia-maxi-991/
[25]Dobrý den, při zadání site:eurokosik.cz v testované verzi vyhledávače chybí hlavní stránka www.eurokosik.cz http://searchtest.seznam.cz/?q=site%3Aeurokosik.cz&sId=7afHATCIwSC-LXaoPevV&sourceid=top&thru=
[26]site:easy-prace.cz – chybí zcela v novém robotu HP www.easy-prace.cz, a počet zaindexovaných stránek na současném cca 8000, na novém cca 350
[27]site:hryprokluky.cz – chybí HP
[28]site:jump-tandem.cz – HP indexována, počet indexovaných stránek 1086, na searchtest 271, návštěvnost nového robota je lepší.
[29]site:mozilla.cz – 10 866 vs. 5 093 stránek
[30]Ahoj, snížení ze 100 587 na 68 440 stránek u Stmivani.eu
[31]site:astrocesty.eu – reálný počet stránek je 300+, ostrý Seznam hlásí 81, searchtest hlásí 15, Google hlásí 362
[32]Dobrý den, posílám snížení indexace u některých webů: www.vsenagolf.cz – zde bych prosila přehodnotit celkově, protože stránek má být zaindexováno tak tisíce. Jinak je rozdíl v textu i normálu. www.expert-na-seo.cz – o polovinu méně www.ucetnictvi1.org – o polovinu méně
[33]Aneb jak Seznam Googlu vzhled ukradl. Styďte se! Doufám, že vás Google brzo porazí na hlavu.
[34]Nesrovnalosti u webu www.easy-travel.cz – stránek k indexování 6.000+ – ostrý seznam 251 – searchtest 138 – google 3.000+
[35]Na searchtest „site:dfr.fm“ nebylo nic nalezeno. Na klasickem search nalezeno pouze 21 zaindexovanych stranek a realita je 300+. Homepage neni zaindexovana vubec.
[36]Počet indexovaných stránek klesl na polovinu (z 4895 na 2597), což je fajn vzhledem k tomu, že mám na blogu cca 1200 blogpostů. Možná by více mohl robot věřit souboru sitemap :) Možná by stálo za to naučit crawlera pracovat s nejrozšířenějšími CMS jako WordPress anebo Joomla.
[37]Pokles indexovaných stránek u tří testovaných webů o 30 – 50 procent. jen doufám že to s tím pořadím bude pravda a né že se to zase pak nasadí a výsledky budou lítat zase půl roku.
[38]http://www.prahapopis.info/wear/leginy/letnkozaky/ na různé longtaily se zobrazují tyto nešvary http://ucesy.88i.cz/ucesy-pro-polodlouhe-vlasy.html v testovací verzi je to lepší,
[39]Seznam.cz: site:futon-futony.cz Na dotaz „site:futon-futony.cz“ nebylo nic nalezeno Google mi zaindexoval 2 stránky
[40]Zdravím, tak jsem vyzkoušel a… na dotaz http://searchtest.seznam.cz/?q=vodní+dýmky mi nenajde hlavní stranku www.kurarna.cz jako dosud ale „jen“ www.kurarna.cz/21-sety-vodnich-dymek taktez pocet indexovaných stránek je v novém cca poloviční
[41]Dávám palec nahou indexuje více stránek než ta původní verze. A řekl bych že i vyhledávání je rychlejší. Lukáš
[42]Koukala jsem na všechny weby a všude to je stejně a nebo více nalezených stránek. Seznamu držím palce!
[43]takto je to o moc lepší!!!!! Konečně to vypadá docela dobře
[44]Dobrý den, po kontrole našich webu jsou zásadní rozdíly v počtu indexovaných stránek. puvodní index/beta verze www.soleada.cz 803/1828 www.polarni-plavby.cz 385/23 www.plavbykaribikem.cz 205/122 Děkuji
[45]Proč když zadám site:www.vybornyweb.cz, tak to vrací i výsledky pro doménu blog.vybornyweb.cz ? (dělá to i současná produkční verze)
[46][45] zkuste operator host: popsany je to na http://napoveda.seznam.cz/cz/pokrocile-hledani.html
[47]Dobrý den všem, konečně začal robot pracovat :-) , akorát v novém testovacím robotovi je indexováno méně stránek než v současném a to u webu www.Bebinka.cz a www.Happymum.cz.
[48]Babiččiny recepty (recepty.jiribures.cz): * searchtest: 1 stránka * search: 13 stránek
[49]Babiččiny recepty (recepty.jiribures.cz): * searchtest: 1 stránka * search: 13 stránek
[50]Omlouvám se za duplicitu. Smažte ji. Díky.
[51]Dobrý den, trochu odbočím. Funguje paralelně i starší SeznamBot? Výsledky na stejný dotaz se mění i 3x během dne a již se to nějakou dobu opakuje. Nečeká se na spuštění změn a toho co nasbíral nový Bot?
[52]První slovo (SPŠCHG) je zkratka, robot však nesprávně převádí na variantu s malými písmeny (Spšchg). http://searchtest.seznam.cz/?q=site%3Achemgym.cz
[53]levnehodinky.eu – stará verze indexuje 699 stránek, nová jenom 441
[54]dobrý den, při hledání s operátorem site:podlahy-kladno.cz není doména nalezena. pěkný den
[55]Zatím to vypadá dobře, ale odstraňte z toho fulltextu ty doménové spamy např na kw. český krumlov ubytování atd. také se hodně ukazují domény 3tího řádu na prvních místech což je kravina atd. Chce to ještě ladit.
[56]U sveho webu mam mene nez polovinu zaindexovanych stran.. http://searchtest.seznam.cz/?q=site%3A24development.cz&sId=Rz7m4Z-hwrdO7etZOc22&sourceid=top&thru=
[57]Na slovní spojení koupelny ostrava byl včera web na první straně výsledků, teď z výsledků zmizel… Proč?
[58]Na slovní spojení účetnictví ostrava má být web na první straně výsledků… je na šesté straně. Na googlu je na první straně
[59]Proč to s tou optimalizací nefunguje u Vás tak jak má. Už mě to nebaví fakt
[60]Poloviční počet stran http://search.seznam.cz/?q=site%3Akulina.cz vs. http://searchtest.seznam.cz/?q=site%3Akulina.cz
[61]Přijde mi, že 90% velkých webu má v novém indexu polovinu a méně stránek. Idnes, Ihned, Heureka, samozrejme i muj Bazos.cz i konkurencni Sbazar.cz.
[62][55] proč by měly být domény 3.řádu spamy??? Copak na doméně 3.řádu nemůže být kvalitní obsah? Nedíval jsem se na ty konkrétní výsledky na kw ubytování CK, ale mám na myslí domény 3.řádu obecně…
[63]Je nějaký orientační termín, kdy to půjde do ostrého provozu. Týden, dva, měsíc ?
[64]Nový robot indexuje ještě stále na stránkách www.nej-ceny.cz pouze 854 stránek Starý robot 54582 stránek
[65]Indexuje vesměs stejně, nebo víc. Výsledky vyhledávání jsou námátkou stejné. Od 7. stránky chybí pejskouva stopa u strany 1 :-)
[66]Zdravím, robota už jsem v logu vídával už poměrně dávno (a neustále ho vídám) a zdálo se, že brousil jako zběsilý, ale jediné co je chybné jsou snad jen screenshoty stránek. Zkuste si site:sporehrdinove.cz (Darkspore logo nahoře často chybí)
[67]Stejný dotaz jako výše: Je nějaký orientační termín, kdy to půjde do ostrého provozu. Týden, dva, měsíc ?
[68]site:www.koberce-breno-eshop.cz zaindexovano novym robotem 42 stranek u stareho 780 stranek, takze docela problem, byl bych docela rad kdyby se tady nekdo kompetentni royhodl odpovedet, proc je tak malo zaindexovanych stranek u nekterych webu, je problem na webech nebo v robotovi. Robot 3.0 jinak stranky navstevuje.
[69]Co se přihodilo , tři roky zpět jsme byli ve fultextu vždy mezi 3 prvníma pozicena a nyní padáme každý den o jednu pozici níž, optimalizaci máme v testech skvělou. co se děje , je to nějaká revoluce . kde můžeme otestovat jak na tom jsme nebo jak robot bude pracovat až se spustí naostro?
[70]karel: optimalizaci máme v testech skvělou :-) Ono to bude tím, že seo se neměří na robotech, ale na lidech,
[71]To Karel: No jestli se jedná o váš web nebari.cz, tak je pořád co vylepšovat. Už jen to, že obsah homepage je duplikován z www.nebari.cz na nebari.cz, www.nebari.cz/index.php a nebari.cz/index.php. To už je dost špatně :-)
[72]Podmětů na úpravy by bylo hodně, ale vzledm k tomu že vy po nás něco chcete a sami sem nenapíšete jedinou reakci, neposkytnu nic, co by mohlo váš fulltext vylepšit. Stejně tak geniálně funguje váš helpdesk, kde se člověk nic kloudného nedozví. Některé dotazy na helpdesk musím urgovat, poněvadž na ně nikdo nereaguje. Počkám ještě do podzimu, pak na tom bude Google s fulltextem líp než Seznam – tam má optimalizace ještě smysl. Na Seznamu je to už pasé.
[73]To Jarin: Souhlas, optimalizovat pro Seznam nemá sebemenší smysl. Jednou jste na první straně a jindy k nenalezení. Seznam chce prostě vytěžit z Skliku. Naštěstí si špatných výsledků vyhledávání už všímají i uživatelé internetu, když marně hledají, co znají.
[74]JJ také mě to štvě, že nikdo nekomunikuje a na podpoře slyšítě jen vše je v pořádku. A přitom když zadáte klíčové slovo tak při každém refreshi jiný výsledke a aby toho nebylo málo tak ještě 2- 3 x denně uplně jiné výsledky. Ale prý je vše v pořádku a chování je standardní :-)) Ale pravdou je, že už to vážně trvá hodně dlouho a negativismus vuči Seznamu mnou stále více prorůstá.
[75]Máte nestabilní výsledky – přijde mi to , jako by Vám souběžně běžely dvě databáze vedle sebe. Na dotaz mi to vyhodí web na 1. místě, a za 30 sekund je na devátém. A za pár minut zase první. A takhle pořád dokola
[76]site:klosko.net searchtest=215, search=323, google=4810. Takze asi tak… Jestli to nebude tim, ze ani jeden vas robot stale poradne neumi „HTTP/1.1 301 Moved Permanently“ viz neustle se opakujici nesmyslne requesty, interne obezlickovane pres HTTP301 : http://www.klosko.net/rss_errorlog.xml?type=11
[77]Také se přimlouvám zato aby tady někdo konečně napsal co se děje s řazením výsledků. Odpověď ve smyslu šlapeme na místě a nový systém bude spuštěn co nejdříve, nebo sbíráme data a ověřujeme nové postupy v řazení. Prostě cokoliv. Nebo je Váš cíl aby se tyhle dva grafy protly co nejdříve? http://www.toplist.cz/stat/?a=history&type=4
[78]Škoda,že jste zapomněli, na čem seznam vyrostl – na fulltextu. Dnes jsem dostal během hodiny 4 různé výsledky na tentýž dotaz. Myslíte, že strategie nestabilních výsledků a skliku vám přinese něco dobrého v horizontu 2-3 let?
[79][76] Jo jo presne tak, Seznam ma problem s 302 a 301 je to pro ne proste problem, a jak vidim tak neresitelny
[80]Zdravím a hlásím pokles počtu zaindexovaných stránek na slevy.vyprodeje.cz, inzerce.vyprodeje.cz, zbozi.vyprodeje.cz a 14dnů již čekám na zaindexování velkoobchod.vyprodeje.cz. S HTTP301 je zjevně problém, viz. 301 u maloobchody.vyprodeje.cz směrem na zbozi.vyprodeje.cz . díky (?). Petr :)
[81]Doplnění – samotná site:vyprodeje.cz má s novým Botem naopak více zaindexovaných stránek a pozice při vyhledávání pro nás důležitých slov přesně odpovídají stavu, před překopáním stránek, po kterém marně čekáme na pořádnou reindexaci. Kdyže prosím bude verze nasazena ? :) a nebo ať je kdykoliv, když se do té doby podaří zásahem shůry reindexovat stránky v rámci současné výdejové db ;) díky PG
[82]Dobrý den, Starý robot – site:oblibeny.cz – 40 000 stránek v indexu. Nový robot – site:oblibeny.cz – 24 000 stránek v indexu.
[83]Když do vyhledávače zadám svůj web http://multihry.cz, zobrazí se mi vždy popisek banneru (alt) místo description, či textu ve stránce. Myslím si, že seznam dokáže poznat, co je reklama a co regulérní obsah stránky.
[84]Za březen zaindexováno 395 stránek, duben jen 46, do 21. května dalších 444, což je celkem 885 stránek. Ovšem v sitemap jich je nyní 3482 a Google je má skoro všechny.
[85]Stale to bude indexovat len stranky s ceskym obsahom??
[86]Dobrý den, na naší doméně (www.zahradni-sortiment.cz)- web je nový cca od března 2011 jsme měly cca 50-80 návštěv denně z fulltext Seznamu a zruba stejný počet nám chodí z Google. Pracovali jsme na SEO a šlo to. Po změně robota je drastický pokles cca 6-12 návštěv denně. Klesl počet indexovaných stránek z cca 500 na 350. Prosím o komentář.