Nová verze už běží… v čem je jiná?

Jaký je rozdíl ve vyhledávání mezi starou a novou verzí fulltextu.

Jak jste již správně zaznamenali, nová verze fulltextového vyhledávání byla naostro spuštěna cca někdy před týdnem a půl. Nyní bych rád přiblížil co bylo podstatou změn.

Hlavní změna byla v lepším pochopení dotazu od uživatele a citlivějším zohlednění různých jeho částí. Co to prakticky znamená zkusím popsat na dotazu „vysoka skola ekonomicka v praze„. Doufám, že tím uspokojím ty, kterým se zdál předchozí článek informačně nevýživný ;-)

Stará verze

Následující obrázek představuje jak bylo implementované hledání ve staré verzi.

Stará verze

Hledaly se dokumenty, které obsahovaly všechna slova přiměřeně u sebe. Hlubší vztahy slov nebo jejich významy se moc neřešily. Dotaz byl považován za vektor slov.

Nová verze

Následující obrázek představuje jak chápe stejný dotaz současná verze vyhledávání.

Nová verze

Hlavní změna je ta, že dotaz se rozloží do stromové struktury, která kopíruje význam jeho částí (zde je vidět roztržení dotazu na dvě části „vysoká škola ekonomická“ a „v praze“ – viz nejvrchnější AND operátor).
Stromová struktura sebou přináší daleko více operátorů, které upřesňují vyhodnocování jednotlivých částí stromu. Na slovní spojení „vysoká škola ekonomická“ může tak být kladen jiný nárok (alias jiné nastavení vah) než na spojení „v praze“ a na něj zase jiný, než na spojení obou částí dotazu dohromady.

Dále je na obrázku vidět, že v rozvoji dotazu je použito daleko více slov než jen ta, která zadal uživatel. Algoritmy se snaží pochopit co uživatel myslel a rozšířit dotaz tak, aby byla pravděpodobnost nalezení správné stránky co nejvyšší – viz fráze „vyskoká škola ekonomická“ může být nahrazena zkratkou „VŠE“ a „vysoká škola“ zkratkou „VŠ“.
Předložka „v“ je nahrazena speciálním NULL-operátorem, který říká že se nemá v tomto dotaze hledat. Vyhledávání předložky by bylo technicky příliš drahé a její přínos k relevanci nízký.

Nový systém nám přináší úplně novou dimenzi možností. Další vylepšování hledání bude v průběhu doby samozřejmě pokračovat; účelem tohoto projektu byl technologický upgrade abychom měli novou platformu na které bude možné dále stavět.

Na závěr bych ještě rád dodal, že celé hledání samozřejmě není jen o vyhodnocování on-page faktorů. Do celkové relevance dokumentu se samozřejmě podepíše množství složek, z nichž jen část je ta, kterou jsem zde popisoval.

P.S.1: site: operátor by již měl fungovat normálně.
P.S.2: víme, že některé dotazy obsahují neoptimální výsledky – na nich stále pracujeme.

Rubrika: Vyhledávání

Komentáře k článku: Nová verze už běží… v čem je jiná?

  1. Autor: Milan Kryl | 4.11.2009 | 21:18

    [1]Díky za podrobnější informace! Tohle rozšíření asi bylo hodně problematické vygenerovat, hlavně s ohledem aby to příliš často nevedlo k zavádějícím výsledkům…

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  2. Autor: Jan Tichý | 4.11.2009 | 21:19

    [2]Štěpáne, gratuluju k výraznému posunu s fulltextem! Mám jenom jednu připomínku a zajímal by mě váš názor na to: „fráze ‘vyskoká škola ekonomická’ může být nahrazena zkratkou ‘VŠE’“ V tomhle případě mi přijde, že je pro optimální chod potřeba ještě něco dalšího – a to znalost, zda se v tom či onom dokumentu slovem „VŠE“ myslí „všechno“, nebo „ekonomka“. A obecně si tak myslím, že je chybou rozlišovat synonyma takhle na úrovni dotazu, ale že by se tematizace měla rozlišovat či nějak předzpracovávat už ve fázi indexaci stránky – s ohledem na tematický kontext celé stránky i jednotlivých slov v ní. Což? ;)

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  3. Autor: Martin | 4.11.2009 | 23:09

    [3]Zdravim, mam trosku OT dotaz. WebHledani.cz v paticce uvadi, ze pouziva technologii Seznam. Jedna se o oficialni spolupraci nebo tento web nelegalne tezi data ze seznamu a predhazuje je uzivatelum ? Jake jsou podminky, pro provozovani takoveho portalu, ktery pouziva databazi seznamu ?

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  4. Autor: dev | 4.11.2009 | 23:47

    [4]Díky za popis, ale chtěli jste také nějaké odezvy při zhorší řazení, tak to jsem zaznamenal u názvu kapely „Manowar“, některé nejvíc relevantní weby jsou až na 4. stránce (manowarfans.wz.cz, devastor.sweb.cz) a umístění asi nejlepšího webu kingsofmetal.cz také není ideální.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  5. Autor: Roman | 5.11.2009 | 10:16

    [5]site: operátor rozhodně ještě normálně nefunguje. Načítáte cca. 5% všech stran na webu.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  6. Autor: Solamyl | 5.11.2009 | 11:38

    [6][2] – samozrejme, to je pravda. Dalšímu posunu ve zkvalitnění indexace bychom se chtěli věnovat v dalšim roce. [4] – manowar – kapela mojeho mladi ;-) zkusim se na to kouknout.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  7. Autor: jonnyq | 5.11.2009 | 12:03

    [7]Dobrý článek. Mě by třeba zajímalo, co se děje s indexací stránek? Proč Seznam tak pozdě reaguje na změny, i když se přidá stránka do fulltextu? V tom byl starý vyhledávač lepší.. Díky za odpověď.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  8. Autor: Radúz | 5.11.2009 | 14:07

    [8]Vývoj fulltextu je fajn, ale co SEO SPAM? Řeší to u vás někdo? X-krát jsem upozorňoval formulářem na SEO SPAM např. http://lancome.bleskove.net/, což není nic jinýho než doorway na xparfemy.cz Měsíc utek jako voda a doorway stále ve výsledcích hledání.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  9. Autor: krteQ | 5.11.2009 | 15:56

    [9]Stepane, pokud fulltext ignoruje predlozku ‘v’ (je zahrnuta ve stopword s predpokladam), jakto ze najdete spravne tohle? http://search.seznam.cz/?q=%22v+novinach%22 tam se pouzije jiny mod pro vyhledani presne fraze?

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  10. Autor: Tomáš "Kusi" Kusenda | 5.11.2009 | 22:39

    [10]mno som rad, ze ste odtajnili system na vysledky :) Som velmi rad, inak ja mam na niektorych weboch aj 3x väcsiu navstevnost, som velmi rad :) Inak co sa MFA tyka, tak niektore MFA maju take informacie, ze ich nenajdem ani na webe vyrobcu, su tam osobne skusenosti, vycuc s roznych for a podobne a reklama nie je ani otravna. Cize netreba sa vsetkych MFA zbavit :)

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  11. Autor: Mike | 5.11.2009 | 22:55

    [11]Celkem by me a urcite i spoustu dalsich zajimalo, ktere vsechny faktory jsou zahrnovany pro vyhodnocovani dotazu. Nerikam primo algorytmus a vahy jednotlivych faktoru, nicmene s cim vsim se pocita.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  12. Autor: Yuhů | 6.11.2009 | 00:13

    [12][11] Mike, seznam vyhodnocovaných signálů je přesně to, co nikdy za střízliva neprozradíme. Natož oficiálně. Dlouhodobě ale vždy budeme sledovat pravidlo, že co je dobré pro uživatele, je dobré pro vyhledávač. [9] Předložka „v“ se neignoruje vždy, ignoruje se jenom někdy. Nemáme nic jako seznam stopslov. Komponenta, která strom staví, o vyřazení rozhodne podle různých kritérií. [8] SEO SPAM nikdy nevyřešíme. Jediné, co můžeme zkusit, je tvůrcům spamu jejich práci prodražit, a tak je donutit tvořit místo nesmyslů něco užitečného. Váš hezký příklad http://lancome.bleskove.net/ ukazuje, že se nám to úplně nedaří. Děkujeme za tenhle report. [7] Indexaci jsme teď zásadněji neměnili. Trošku ale jo, a tak postupně reindexujeme všechny stránky včetně těch, které se dlouho neměnily. To způsobuje, že robot má teď delší frontu než obvykle. Nemusíte ale spekulovat o tom, kdy byla poslední indexace, protože index se otáčí každý den. Část stránek dokonce každých asi 15 minut (třeba aktuální články).

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  13. Autor: Yuhů | 6.11.2009 | 00:21

    [13][3] Webhledání je náš partner, který přebírá výsledky oficiálně přes naše API a zobrazuje i Sklik, ze kterého dostává provizi. Takže to opravdu není žádné zneužití výsledků. Pokud máte stránky generující desítky tisíc hledání denně a zajímáte se o podobnou spolupráci, zkuste mi napsat.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  14. Autor: dev | 6.11.2009 | 03:09

    [14]při hledání výrazu K:CMS bych očekával první oficiální stránky kcms.cz

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  15. Autor: bredy | 6.11.2009 | 06:56

    [15]Ad [14]. Já nikoliv. Ta stránka není v indexu, její robots.txt vypadá docela podivně http://www.kcms.cz/robots.txt Jestli ho robot pochopil tak jako já, tedy zákaz indexace homepage, pak je to asi zřejmé.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  16. Autor: Marek | 6.11.2009 | 07:44

    [16]Říkáte, že co je dobré pro uživatele, na to dáváte váhu… Zajímavé je, že po upgradu se prakticky na každý dotaz zobrazuje na první stránce něco z firmy.cz. Není lepší tam tento jeden odkaz dát např. vždy jako první výsledek nějak orámovaný, než to dávat do fulltextu. Nechci z ničeho obviňovat, ale je to divné…

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  17. Autor: Radek Hojgr | 6.11.2009 | 07:57

    [17][16] Koukněte na Google. Ten má vždycky své služby na prvním místě ve výsledcích vyhledávání (pokud se jich dotaz alespoň trochu týká) a nikdo ho za to nebombarduje…

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  18. Autor: Ivan | 6.11.2009 | 08:10

    [18]Zajimave, kdo vi jak se k tomu postavi seznam, jestli tyhle zlodejicky vykope z fulltextu nebo ne. http://www.lupa.cz/clanky/hyperinzerce-krade-inzeraty/

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  19. Autor: Jan Dvořáček | 6.11.2009 | 08:25

    [19]U webu zvkovo.cz jste nám dnes zaindexovali již týden neexistující stránku. Do včera bylo všechno OK. http://search.seznam.cz/?q=betonov%C3%A9+ploty&count=10&from=81&pId=KK_0REtMCQXkWKiIyA5w&source=sug

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  20. Autor: Petr | 6.11.2009 | 10:45

    [20]Nám od těch změn ve fulltextu z výsledku vyhledávání úplně zmizel web. Web má SEO, generuje sitemap atd., dříve byl kolem 10 místa, teď není nikde. Parametr site ukazuje 2295 zaindexovaných stránek (pokud tedy site ukazuje jak má), ale na ani jedno klíčové slovo, ani na kombinace se kterými byl dříve na 2-3 místě ho fulltext nenajde.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  21. Autor: Richi | 6.11.2009 | 10:51

    [21][18] to je hnus!! otázkou je zda může Seznam zabanovat někoho za to že je zloděj

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  22. Autor: Marek | 6.11.2009 | 11:24

    [22][17] Nevím, co konkrétně myslíte, ale jestli to, že do výsledků zařazuje odkazy např. na Google Mapy, tak to je něco zcela jiného. Tam je to vloženo do výsledků vyhledávání, na Seznamu je to součást vyhledávání = zabere to jednu pozici na stránce.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  23. Autor: jonnyq | 6.11.2009 | 14:15

    [23][15] No.. podle dokumentace to naopak znamená, že robot smí všude. Viz http://www.jakpsatweb.cz/robots-txt.html (tedy pokud tento robots.txt nebyl již opraven)

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  24. Autor: dev | 6.11.2009 | 14:49

    [24][23] Myslím, že s ním autor nic nedělal.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  25. Autor: Solamyl | 6.11.2009 | 17:13

    [25][9] – nene, zadny stopslovnik neexistuje, indexuji se uplne vsechna slova. V nekterych pripadech jsou totiz jednopismena slova dulezita – treba „c & a“. O tom jestli se slovo bude hledat nebo nebude se rozhoduje az pri zadani dotazu podle toho jestli je jeho vyznam pro dotaz prinosny nebo zanedbatelny. Podle uplne stejneho algoritmu (ktery predtim predlozku vyradil) se dekomponuje dotaz „v novinach“ takto: http://fulltext.sweb.cz/vnovinach.png

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  26. Autor: Petr | 7.11.2009 | 11:02

    [26]Domnívám se že nyní v hodně případech fulltext vyhodí nějakou podstánku produktu do výsledku, naopak aby předložil více, dle mého názoru relevantní hlavní kategorii na kterou uživatelé odkazují. Pozoruji to na mnoha případech, kdy v long tailu jsou až moc často předhazovány takovéto výsledky. … Jen názor k zamyšlení

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  27. Autor: dev | 7.11.2009 | 17:08

    [27][26] Ano, tak by se i daly vystihnout ty jednotlivé problémy o kterých jsem psal.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  28. Autor: Václav Hlobil | 7.11.2009 | 19:58

    [28]Dobrý den, dotaz k fulltextu. Proč skáčou weby v cca týdenních intervalech o 5 i více míst dopředu/dozadu? Můj web byl na jedno klíčové slovo 7, minulý týden 1, teď zase 7. Žádné velké změny na něm neproběhly.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  29. Autor: Petr | 7.11.2009 | 21:39

    [29][28]Jo jo tancuje to teď až hrůza a přesně jak píšete uplně nevyzpytatelně o desítky pozic. Sleduji více webů co spravuji a jeden den třetí první strana a druhý den dole na druhé straně bez žádných úprav ani on ani off page. Snad se to ustálí. Jsem takoví testovací králíčci :-( To že jsou předřazovány podstránky opriti hlavním to je bohužel fakt, který se minezdá jako ok. Napřáklad na jedno slovo, které mám v jiném sklonu slova a pouze jednou na hlavní straně s vysokým hodnocením Srank, tak nám Seznam vyhodil zacílenou hlavní sekci (podstranu) s nižším rankem. Bohužel je to evidentní důsledek systemu vyhodnocování frází co popisují kluci z fulltextu. :-(

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  30. Autor: Irena | 7.11.2009 | 22:37

    [30]Úplná hloupost, ale pro moji dceru důležitá věc: http://search.seznam.cz/?q=stegosaurus&sId=cPRIOMU9wTzdD2MU-Mc3&source=top Ona toho stegosaura nechce koupit…

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  31. Autor: Pet | 7.11.2009 | 23:35

    [31]Třeba je to tím, že z českých stránek o stegosaurusovi nikdo nic moc nepíše. Když zadáte i do googlu vyhledání českých stránek tak je výsledek podobný mimo wiki..

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  32. Autor: Berlin | 8.11.2009 | 00:35

    [32]30 a 31 no ono je to hlavně tím, že seznam protlačuje monstrweby s velkým množstvím odkazů,typicky eshopy, takže jakmile je to dotaz tohodle typu (kdy hledáme nějakou věc aniž bychom uvažovali o nějaké koupi, ale ono se to koupit dá naběhne plno stránek bez obsahu s obrázkem, cenou a tlačítkem koupit. Co by dal teď hledající za deseti stránkovou minisite… nejsou máme eshopy, případně jiné nerelevantní weby. Co potom, že mě jako hledajícího nezajímá, že si seznam myslí že mi servíruje kvalitu, protože vyhledané weby mají 1000+ podstránek a 1000+ odkazů..

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  33. Autor: Pet | 8.11.2009 | 12:01

    [33][32] Tohle je krok dobrý m směrem, protože ty pár stránkové weby jsou v 99% MFA a jiná podobná haluz.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  34. Autor: Pepin | 8.11.2009 | 12:03

    [34]Tak nejak mi nepřijdou vydledky uplne relevantni http://search.seznam.cz/?q=Converse.cz&mod=f Na druhem miste je pouze Soutez se znackou Converse, na 8.miste Cenyzbozi.cz obsahuji pouze „cz“ a Converse nikde, na 9. miste jakbysmet. 4. a 5. misto odkazuje na duplikatni text. 7. misto odkazuje na kategorii v neprehlednem katalogu se stovkami okamzite schvalovanych odkazu, neodkazuje na presnou polozku (stranku v katalogu) = SPAM. To jste zase eshopistum takhle pred vanocema nadelali vrasky a diry do kapes, ale Sklik vam jiste ted vydela vic.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  35. Autor: me | 8.11.2009 | 20:08

    [35][33] To je pěkná kravina. Doufám, že si to myslíte jenom vy a ne fulltext seznamu. Upřednostňovat jeden web na základě jeho celkové velikosti je kopanec do prdele algoritmům rozebíraným v tomto článku. Taková ubohá úvaha je v seznamu snad nenapadla. Jestli se bude proti MFA bojovat tímto způsobem, tak potěš koště. P.S. Nemám žádný MFA. Mám malý web.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  36. Autor: Berlin | 8.11.2009 | 23:19

    [36]35- No momentálně je to na seznamu realita, ač se to zdá absurdní..

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  37. Autor: Pet | 9.11.2009 | 00:09

    [37][35][36] Není nic jednoduššího než web rozvíjet a budovat kvalitní obsah… toť můj názor.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  38. Autor: me | 9.11.2009 | 09:45

    [38]Proč mám rozvíjet web, na kterém jsou všechny relevantní informace a stačí na to pár stránek? Abych vyhověl podivným pravidlům seznamu, protože jinak nemám šanci aby mě někdo našel? Je tady tedy vyhledávač kvůli stránkám nebo stránky kvůli vyhledávači? A co to zmiňované „co je dobré pro uživatele je dobré pro vyhledávač“? To by v případě upřednostňování velkých webů taky neplatilo, protože v ohromném množství stránek se zároveň rozpouštějí témata. Těžko se bude velký web věnovat relevantnímu tématu (vyhledávané frázi) na tisícovce stran… A pokud je skutečně pravda, že seznam takto upřednostňuje velké weby, tak MFA se tomu přizpůsobí, o tom není pochyb.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  39. Autor: Marek Stejskal | 9.11.2009 | 21:53

    [39]Přirovnání nového robůtka ke spalovacímu motoru(viz. např. článek na novinky.cz) je v 21st. možná opodstatněné zároveň však směšné. Výsledky vyhledávaní haprují jako kdyby robot jel pouze na dva válce. Vyzíváte nás ať o indexaci nespekulujeme, ale jak máme ne-spekulivat při tak kolísajících výsledcích vyhledávání?

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  40. Autor: Johnnypetka | 10.11.2009 | 08:30

    [40]http://search.seznam.cz/?q=l%C3%A9k%C3%A1rna&sId=IXp9LO07weCau6K5ss7P&source=top je tam dvakrát ta samá lékárna. Jednou to háže odkaz z firem a jednou napřímo. Je to tak v pořádku?

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  41. Autor: Honza | 10.11.2009 | 08:57

    [41]Myslím, že toto není zrovna relevantní výsledek. Výpis z firem hned na první straně:http://search.seznam.cz/?q=stany&count=10&from=1&pId=q8KJ23M-OLURuKHqRopA&source=top

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  42. Autor: mic362 | 10.11.2009 | 09:39

    [42]Co třeba tohle : http://search.seznam.cz/?q=www.sudoku.cz&sId=ftV1K_jKwD5Qh6Hg75aW&source=top Jen 2 relevantni vysledky na cele strance, to mi přijde taky jako pekna kravina.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  43. Autor: pavel | 10.11.2009 | 15:13

    [43][43] mate pravdu s tou kravinou. Ale podle me na dotaz www.sudoku.cz je jen jeden spravny vysledek. A to prave www.sudoku.cz, ostani neni relevantni, ale jako doplneni vyhledavani to jde, skoro by mely byt pod carou, nebo rovnou na druhe strane:D

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  44. Autor: mic362 | 10.11.2009 | 15:44

    [44]No jo, ted uz tam jsou jiné výsledky než ráno :)

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  45. Autor: Marek Stejskal | 11.11.2009 | 23:36

    [45]OT: Nedá mi to se nezeptat autorů javascriptu (vyhledávací pole) zda se kód neupravoval? Už cca 10dní mi zničeho nic nejde psát do pole pro vyhledávání na seznamu. Blikající kurzor se přestěhuje do levého horního rohu a pole pro vyhledávání je zamrzlé. Pokud chci pokračovat psát slovo musím udělat reload stránky seznamu a pak již jde psát. Ovšem tato chyba se opakuje několikrát dokola. Jsem jediný? OS: Browser Details :t Mozilla/5.0 (iPhone; U; CPU iPhone OS 3_0 like Mac OS X; cs-cz) AppleWebKit/528.18 (KHTML, like Gecko) Version/4.0 Mobile/7A341 Safari/528.16

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  46. Autor: Marek Stejskal | 11.11.2009 | 23:40

    [46][46]Ještě podotknu, že tato chyba se mě vyskytuje pouze v horním vyhledávacím poli.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  47. Autor: jonnyq | 12.11.2009 | 09:37

    [47]Možná by ještě chtělo vychytat toto: http://search.seznam.cz/?q=e-shop&mod=f

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  48. Autor: kotrmelec | 12.11.2009 | 16:10

    [48]Odpověd na všechny otázky: Maj to posraný.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  49. Autor: Ján Forgáč | 12.11.2009 | 16:57

    [49]Teraz Seznam vracia hodně odlišné výsledky na to iste slovo v různých tvarech: Praha / Prahy / Praze . V minulej verzii si boli výsledky oveľa podobnejšie pri hledání toho samého slova / frááze v různých tvarech. Len neviem posudiť, či je tato diverzita výsledkov pri hladaní stejného slova zmena k lepšiemu, alebo nie. Ale pestrý/bohatý text proste vyhráva.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  50. Autor: Mike | 13.11.2009 | 10:21

    [50]Je mozne nejakym zpusobem nahlasit duplicitni obsah? Seznam nam ukazuje adresu, kterou uz nevyuzivame a vsude propagujeme vice jinou. rel canonical je nastaven, ale ridi se jim seznam? nebo podle ceho urcuje dulezitejsi domenu? podle sranku? diky za info.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  51. Autor: Marek | 13.11.2009 | 10:35

    [51][49] – nemyslím si, že vždy platí, že pestrý a bohatý text vyhrává, kéž by… [50] – google to tuším umožňuje, že si nastavíte, že jste přešli se stejným obsahem na novou doménu, Seznam pokud vím, tak ne…

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  52. Autor: pepinator | 13.11.2009 | 19:29

    [52]Se seznam.cz jsem našel na českých stránkách, co jsem hledal – firmy, výrobky, služby. Doufám, že vydržíte!!!!! Jste svým způsobem hrdinové!

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  53. Autor: Yuhů | 16.11.2009 | 12:32

    [53][45] ta chyba se projevuje na iphonu? [50] rel canonical zatím moc nepoužíváme, stejně má platit jenom uvnitř domény. Nyní je jediné správné řešení dát přesměrování na novou doménu, nebo hoooodně dlouho počkat. [35] v hodnotícím algoritmu žádný signál typu „velký web“ nemáme. Ale občas to tak jakoby vyjde, nepřímo kvůli jiným signálům. Rozhodně není špatný nápad dělat malé weby. [N] Děkujeme za reporty blbých výsledků, koukáme na to.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  54. Autor: Marek Stejskal | 16.11.2009 | 17:09

    [54][53] Ano, mě se tato chyba projevuje v iPhone. Nevím však jak jsou na tom prohlížeč v PC se stejným jádrem WebKit (např.: Safari). Každopádně bych si ještě rád postěžoval na další bug projevující se na zbozi.cz Občas potřebuji vědět v kameném obchodu kolik stojí produkt v e-shopu. Zvolím tedy integrovaný vyhledávač google kam zadám např.: hrábě fiskars zbozi.cz. Google mi zobrazí výsledky i ze zbzi.cz s konkrétní url na výsledek, ovšem script na zbozi.cz mě přesměruje na root m.zbozi.cz. (pozn. dnes už mě script záhadně nepřesměruje)

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  55. Autor: Marek Stejskal | 17.11.2009 | 00:58

    [55][54] Nedám si pokoj a tento bug zareportuji na firmy.cz Zadám-li přesnou url do prohlížeče nebo pokud mi search.seznam.cz nabídne výsledek vyhledávání s odkazem na firmy.cz např.: http://www.firmy.cz/detail/2170072-marek-stejskal-e-shop-praha-cerny-most.html jsem automaticky po kliknutí přesměrován na url m.firmy.cz (používám iPhone) Proč mě to nepřesměruje na http://m.firmy.cz/detail/2170072-marek-stejskal-e-shop-praha-cerny-most.html nebo se nenačte jiný css styl? Mám tušení, že to takto bude fungovat i u vašich ostatních projektech pro většinu mobilních prohlížečů.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  56. Autor: Mike | 17.11.2009 | 09:32

    [56]Jeste by me zajimalo, jak casto se aktualizuje S-Rank? Je to online nebo se vysledky vyhodnocuji napr. jednou mesicne a naraz se zmeni Srank skokove v urcity den?

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  57. Autor: Honza | 18.11.2009 | 17:55

    [57]Ve svém příspěvku píšete v P.S.1, že operátor SITE by již měl fungovat normálně. Bohužel s tím nemohu souhlasit. Pro příklad uvádím www.skoda-auto.cz. Na první stránce vypisujete, že bylo nalezeno 906 stránek, ale postupným stránkováním se počet nalezených stránek snižuje. Na stránce 28 již je pouze 276 nalezených stránek a dál nic. Který údaj je tede správný? Ten z první strany nebo musím zkoušet listovat až na tu poslední?

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  58. Autor: Mike | 19.11.2009 | 08:27

    [58][57] Ono takhle myslim fungovalo vzdycky a funguje to tak z nejakeho duvodu i na googlu. Pravdepodobne proto, ze google vyhazuje ze zobrazeni podobne stranky.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  59. Autor: Honza | 19.11.2009 | 11:22

    [59][58] Dobře, ale který z těchto dvou údajů tedy vyjadřuje skutečný počet zaindexovaných stránek? V mém vlastním případě, nechci si dělat reklamu, to znamená, že mám zaindexovaných cca 69000 stránek, ale na 6 stránce listování zjistím, že jich je jen 58! Mimochodem mi to v podstatě okamžitě snížilo návštěvnost webu z průměrných 12000 lidí na nějakých 7000 denně. Přičemž právě těch 5000 chybějících je z fulltextu Seznamu.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  60. Autor: Honza | 19.11.2009 | 11:28

    [60][58] Ještě doplním, že jsem právě zkoušel google a mám zaindexovaných 46000 stránek. Pokud přejdu na 100 stránku, ukazuje výpis stále 46000 stránek.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  61. Autor: Roman Schulz | 19.11.2009 | 12:57

    [61]Já bych řekl že podobné stránky jako http://www.realitni-kancelar.biz/realitni-kancelare-praha nemají ve vyhledávání co dělat, mají obsah vygenerovaný pro okresní města. Třeba 20x stejný nadpis H1 v těle dokumentu by měl být trestán. Když budete dál sledovat patičky, dostanete se prakticky na stejné weby o autoškolách, autobazarech atd…

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  62. Autor: Sokol | 19.11.2009 | 13:25

    [62]Co chcete na realitní kanceláře najít? mě to připadá jako moc hezký seznam. Spíš mě trápí, že jsem 21.10. spustil, nalinkoval web a do dneška Seznam zná jen 5 podstránek :)

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  63. Autor: phantom | 20.11.2009 | 09:08

    [63]Na klíčové slovo hračky vyběhne tento pěkně naoptimalizovaný shop: http://www.4kids.cz/home.aspx =)

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  64. Autor: Honza | 20.11.2009 | 15:07

    [64][63] … a to má být reklama uvedeného shopu nebo v čem je problém?

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  65. Autor: Radim | 23.11.2009 | 08:55

    [65]Nechápu vyhodnocování výsledků na spojení školení řidičů, stránky, které byly na první straně na 4 místě – www.skoleniridicu.net, jsou již na 4 stránce a neustále klesají, ale proč?? Na stránkách se nic nezměnilo, a kdo jiný by se měl zobrazovat na první straně na toto slovní spojení, než firma která se tak přímo jmenuje Školení řidičů s.r.o. !

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  66. Autor: Lukáš Vodička | 23.11.2009 | 11:52

    [66]Přemýšlím, jakou metriku by Seznam měl zvolit, aby posoudil, zda provedené změny byly k lepšímu nebo k horšímu. Pocity a metafory o motorech by to asi být neměly. ;-) Jeden způsob měření mě napadl – srovnání s Googlem. Za předpokladu, že si Google vezmeme jako etalon (tedy přijmeme za fakt, že jeho výsledky díky výhodám v rúzných oblastech – peníze, technologie, lidi – jsou relevantnější než ty Seznamu), pak změny nedopadly dobře a Seznam ztrácí další procentíčko podílu na trhu. Konkrétní příklad, Omlazení.cz, nejrychleji rostoucí web pro ženy, nominovaný na Křišťálovou lupu. Pokusím se o tabulku podílu na návštěvnosti z Googlu a Seznamu Období / Google / Seznam 09-2008 / 20% / 56% 09-2009 / 31% / 49% 10-2009 / 33% / 47% 11-2009 / 38% / 43% (Listopad je do 22.11.) Možná někde dělám nějakou logickou chybu, ale vychází mi, že za pár měsíců nebude Omlazení Seznam.cz vůbec potřebovat.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  67. Autor: Petr Barták | 26.11.2009 | 21:38

    [67]Zdravím, mám trochu problém s dotazem „Stáj Framon“. Zobrazí se vše možné, jen ne to co bych čekal: www.stajframon.cz. Web je sice cca 14 dní kompletně překopaný, ale bylo zachované u většiny stránek přesměrování přes 301 a Google a Bing to zobrazují zcela normálně. Asi nejmarkantnější je rozdíl v dotazu „site:www.stajframon.cz stáj framon“ mezi Seznamem a konkurencí. Kde může být problém? Díky

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  68. Autor: Mike | 30.11.2009 | 21:00

    [68]Mam dotaz ohledne indexace. Mam dve stranky s duplicitnim obsahem. Web1 seznam normalne indexoval, srank 7, web2 nebral v potaz, srank4 (od predchoziho majitele). Ted se natvrdo nastavilo presmerovani 301 web1 na web2. takze uz bezi jen web2. 1] jak dlouho bude trvat seznamu nez puvodni stranku vyhodi. 2] jak rychle zaradi web2, ktery se doted nezobrazoval 3] bral doted Seznam v potaz odkazy na web2, nebo je zahazoval a zacne si jich vsimat az ted? tzn. srank ted je neaktualni? diky za info Mike

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  69. Autor: Jan Dvořáček | 1.12.2009 | 08:50

    [69]Nevypadly vám zase Statistiky hledanosti dotazů? http://search.seznam.cz/stats?collocation=z%C3%A1jezd&submit=Vyhledat+Seznamem

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  70. Autor: Mike | 2.12.2009 | 22:08

    [70]68) odpovim si sam, trvalo to tri dni :o)

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  71. Autor: Radek | 4.12.2009 | 11:35

    [71]Provozujeme e-shop www.prozdravi.cz. Do doby než byl spuštěn nový fulltext na Seznamu jsme se s našimi stránkami drželi na dobrých pozicích. Bohužel po změně fulltextu se nám každým dnem stránky ve výsledcích hledání propadají níže a níže a nedaří se nám zhoršující se tendenci zastavit. Zkoušeli jsme citlivě zvětšovat hustotu kl. slova na stránce nebo budovat zpětné odkazy ale většinou bezvýsledně. Na e-shopu nepoužíváme nic, co by mohlo být označené jako černé SEO, navíc stránky mají výbornou informační hodnotu s dostatkem textu. Nemohli byste prosím poradit, kde by mohla být chyba a popřípadě, co má nový fulltext na stránkách „nejraději“? Děkuji

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  72. Autor: Tom | 4.12.2009 | 23:17

    [72]CHYBA-Víte že když jednou použijete našeptávač a pak ho použijete podruhé a kliknete v našeptávači na hledanou frázi tak se hledání neprovede?…!

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  73. Autor: Ladislav Šulc | 8.12.2009 | 13:12

    [73]Dobrý den, mám problém ohledně vyhledávání fulltextu. Pracuji jako webový analytik a architekt (+ SEO apod.) a s něčím takovým jsem se ještě nesetkal. Seznam sice stránky mého klienta zaindexuje (malou část a pomalu), ale ani přes jedno z klíčových slov, ani skrze přesné titly NELZE VYHLEDAT. Web je maximálně optimalizován, sitemap, robots, texty, title, nadpisy apod:( Je rozhodne lepsi nez spousta ostatnich, co lze vyhledat i nez puvodni: http://www.floridainc.us/mainpage_ch.html. Můžete mi prosím poradit v čem je problém? Na Google je vše v pořádku. Jedná se web www.floridainvestment.cz. Už je to více jak měsíc a nic se neděje. Děkuji.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  74. Autor: Martin | 14.12.2009 | 09:16

    [74]Dobrý den, gratuluji k tak významnému kroku kupředu! Ještě důležitější teď ale bude doladit nový stroj k dokonalosti, protože má stále spoustu chyb, jako např. že zobrazuje 1 web v prvních třech výsledcích vyhledávání hned 2x viz dotaz „fotobanka“ (http://search.seznam.cz/?q=fotobanka&mod=f) na prvním a třetím místě. Pokud si nevyberu web na prvním místě a půjdu dál, proč je mi totéž podstrkováno na místě třetím?

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  75. Autor: skorozacatecnik | 15.12.2009 | 12:27

    [75]Sleduju, co vy tam v tom Seznamu delate a docela neverim svym ocim. Chvilku byly vysledky dobre, opravdu, relevance stoupla, ale pred nekolika dny se zase neco stalo a je to opravdu „skvele“. No panove, jsou sportovnipodlahy.eu s tim obsahem adekvatni k hledane frazi „aritmie příznaky“ a obsahuje hodnotne informace? Ja nemam ten pocit. http://search.seznam.cz/?q=aritmie+p%C5%99%C3%ADznaky Bohuzel se zase dostavaji do popredi weby, ktere nemaji zadnou hodnotu, nebo to jsou primo MFAcka. Uzivatel je ztracen, najde kdejake kraviny a pak si bude napriklad lecit mozkovou mrtvici bylinkama z vietnamu, chjo.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  76. Autor: Carl114 | 30.1.2010 | 14:42

    [76]Netušil jsem, že dříve Seznam pracoval na tak jednoduchém algoritmu. Můžu se zeptat jak dlouho takto běžel? Nebo spíše od jakého roku? PS: Nový způsob je bezva. Určitě to ještě přinese své klady a zlepšení výsledků vyhledávaní. Docela se těším na další vylepšení.

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  77. Autor: Demaster | 17.2.2010 | 18:13

    [77]Ten nový způsob chválím :-)

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  78. Autor: Jan Křištof | 18.2.2010 | 18:43

    [78]Dobrý den, chtěl bych se dotázat provozujeme www stránky kde dochází k neustále rotaci informací a textu a pozic..má tato skutečnost nějaký vliv na indexování a následné zobrazování hledaného textu zákazníkem který hledá preš seznam .cz ?? Děkuji za odpověď Petr. ať se daří ..

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  79. Autor: Petr Hejda | 19.2.2010 | 16:18

    [79]Dobrý den, měl bych také dotaz. Zajímalo by mě jáký význam má pro seznam.cz slovo „tryskání“ přesněji „tryskani“. Zdá se mi, že váš algoritmus věří že to to slovo bez diakritiky má nějaký smysl (já věřím že nemá). Děkuji, hodně zdaru …

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  80. Autor: Pavel | 10.4.2010 | 02:30

    [80]Dobrý den, sem rád za posun ve vyhledávání opravdu velkým směrem a že se snažíte upřednostnovat uživatele a zaměřovat na to, co má na mysli, když něco hledá. Věřím, že nadále to budete vylepšovat. Sice to ve výsledcích můj web poškodilo,ale snad bude líp…Přeji hodně štěstí!

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  81. Autor: Johnny | 10.6.2010 | 14:08

    [81]Chybička se vloudila – na slovo „káva“ vám výsledky vyhazují na první straně článek „Poslední káva s Petrem Mukem“. Že by hodně odkazů s vysokým rankem (nic proti Petrovi Mukovi)? Pro ty, co hledají informace o kávě nic moc. http://search.seznam.cz/?sourceid=szn-HP&thru=&q=k%C3%A1va

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0

      
  82. Autor: Duch.Veliky | 9.8.2010 | 22:24

    [82]Bude seznam zase někdy aktualizovat S-ranky? Jak často probíhá aktualizace? Už na ní marně čekám asi tak tři měsíce :-/ Děkuji a přeji hezký den

    S tímhle souhlasím 0 S tímhle nemohu souhlasit 0