Jaký je rozdíl ve vyhledávání mezi starou a novou verzí fulltextu.
Jak jste již správně zaznamenali, nová verze fulltextového vyhledávání byla naostro spuštěna cca někdy před týdnem a půl. Nyní bych rád přiblížil co bylo podstatou změn.
Hlavní změna byla v lepším pochopení dotazu od uživatele a citlivějším zohlednění různých jeho částí. Co to prakticky znamená zkusím popsat na dotazu „vysoka skola ekonomicka v praze„. Doufám, že tím uspokojím ty, kterým se zdál předchozí článek informačně nevýživný ;-)
Stará verze
Následující obrázek představuje jak bylo implementované hledání ve staré verzi.

Hledaly se dokumenty, které obsahovaly všechna slova přiměřeně u sebe. Hlubší vztahy slov nebo jejich významy se moc neřešily. Dotaz byl považován za vektor slov.
Nová verze
Následující obrázek představuje jak chápe stejný dotaz současná verze vyhledávání.

Hlavní změna je ta, že dotaz se rozloží do stromové struktury, která kopíruje význam jeho částí (zde je vidět roztržení dotazu na dvě části „vysoká škola ekonomická“ a „v praze“ – viz nejvrchnější AND operátor).
Stromová struktura sebou přináší daleko více operátorů, které upřesňují vyhodnocování jednotlivých částí stromu. Na slovní spojení „vysoká škola ekonomická“ může tak být kladen jiný nárok (alias jiné nastavení vah) než na spojení „v praze“ a na něj zase jiný, než na spojení obou částí dotazu dohromady.
Dále je na obrázku vidět, že v rozvoji dotazu je použito daleko více slov než jen ta, která zadal uživatel. Algoritmy se snaží pochopit co uživatel myslel a rozšířit dotaz tak, aby byla pravděpodobnost nalezení správné stránky co nejvyšší – viz fráze „vyskoká škola ekonomická“ může být nahrazena zkratkou „VŠE“ a „vysoká škola“ zkratkou „VŠ“.
Předložka „v“ je nahrazena speciálním NULL-operátorem, který říká že se nemá v tomto dotaze hledat. Vyhledávání předložky by bylo technicky příliš drahé a její přínos k relevanci nízký.
Nový systém nám přináší úplně novou dimenzi možností. Další vylepšování hledání bude v průběhu doby samozřejmě pokračovat; účelem tohoto projektu byl technologický upgrade abychom měli novou platformu na které bude možné dále stavět.
Na závěr bych ještě rád dodal, že celé hledání samozřejmě není jen o vyhodnocování on-page faktorů. Do celkové relevance dokumentu se samozřejmě podepíše množství složek, z nichž jen část je ta, kterou jsem zde popisoval.
P.S.1: site: operátor by již měl fungovat normálně.
P.S.2: víme, že některé dotazy obsahují neoptimální výsledky – na nich stále pracujeme.

[1]Díky za podrobnější informace! Tohle rozšíření asi bylo hodně problematické vygenerovat, hlavně s ohledem aby to příliš často nevedlo k zavádějícím výsledkům…
[2]Štěpáne, gratuluju k výraznému posunu s fulltextem! Mám jenom jednu připomínku a zajímal by mě váš názor na to: „fráze ‘vyskoká škola ekonomická’ může být nahrazena zkratkou ‘VŠE’“ V tomhle případě mi přijde, že je pro optimální chod potřeba ještě něco dalšího – a to znalost, zda se v tom či onom dokumentu slovem „VŠE“ myslí „všechno“, nebo „ekonomka“. A obecně si tak myslím, že je chybou rozlišovat synonyma takhle na úrovni dotazu, ale že by se tematizace měla rozlišovat či nějak předzpracovávat už ve fázi indexaci stránky – s ohledem na tematický kontext celé stránky i jednotlivých slov v ní. Což? ;)
[3]Zdravim, mam trosku OT dotaz. WebHledani.cz v paticce uvadi, ze pouziva technologii Seznam. Jedna se o oficialni spolupraci nebo tento web nelegalne tezi data ze seznamu a predhazuje je uzivatelum ? Jake jsou podminky, pro provozovani takoveho portalu, ktery pouziva databazi seznamu ?
[4]Díky za popis, ale chtěli jste také nějaké odezvy při zhorší řazení, tak to jsem zaznamenal u názvu kapely „Manowar“, některé nejvíc relevantní weby jsou až na 4. stránce (manowarfans.wz.cz, devastor.sweb.cz) a umístění asi nejlepšího webu kingsofmetal.cz také není ideální.
[5]site: operátor rozhodně ještě normálně nefunguje. Načítáte cca. 5% všech stran na webu.
[6][2] – samozrejme, to je pravda. Dalšímu posunu ve zkvalitnění indexace bychom se chtěli věnovat v dalšim roce. [4] – manowar – kapela mojeho mladi ;-) zkusim se na to kouknout.
[7]Dobrý článek. Mě by třeba zajímalo, co se děje s indexací stránek? Proč Seznam tak pozdě reaguje na změny, i když se přidá stránka do fulltextu? V tom byl starý vyhledávač lepší.. Díky za odpověď.
[8]Vývoj fulltextu je fajn, ale co SEO SPAM? Řeší to u vás někdo? X-krát jsem upozorňoval formulářem na SEO SPAM např. http://lancome.bleskove.net/, což není nic jinýho než doorway na xparfemy.cz Měsíc utek jako voda a doorway stále ve výsledcích hledání.
[9]Stepane, pokud fulltext ignoruje predlozku ‘v’ (je zahrnuta ve stopword s predpokladam), jakto ze najdete spravne tohle? http://search.seznam.cz/?q=%22v+novinach%22 tam se pouzije jiny mod pro vyhledani presne fraze?
[10]mno som rad, ze ste odtajnili system na vysledky :) Som velmi rad, inak ja mam na niektorych weboch aj 3x väcsiu navstevnost, som velmi rad :) Inak co sa MFA tyka, tak niektore MFA maju take informacie, ze ich nenajdem ani na webe vyrobcu, su tam osobne skusenosti, vycuc s roznych for a podobne a reklama nie je ani otravna. Cize netreba sa vsetkych MFA zbavit :)
[11]Celkem by me a urcite i spoustu dalsich zajimalo, ktere vsechny faktory jsou zahrnovany pro vyhodnocovani dotazu. Nerikam primo algorytmus a vahy jednotlivych faktoru, nicmene s cim vsim se pocita.
[12][11] Mike, seznam vyhodnocovaných signálů je přesně to, co nikdy za střízliva neprozradíme. Natož oficiálně. Dlouhodobě ale vždy budeme sledovat pravidlo, že co je dobré pro uživatele, je dobré pro vyhledávač. [9] Předložka „v“ se neignoruje vždy, ignoruje se jenom někdy. Nemáme nic jako seznam stopslov. Komponenta, která strom staví, o vyřazení rozhodne podle různých kritérií. [8] SEO SPAM nikdy nevyřešíme. Jediné, co můžeme zkusit, je tvůrcům spamu jejich práci prodražit, a tak je donutit tvořit místo nesmyslů něco užitečného. Váš hezký příklad http://lancome.bleskove.net/ ukazuje, že se nám to úplně nedaří. Děkujeme za tenhle report. [7] Indexaci jsme teď zásadněji neměnili. Trošku ale jo, a tak postupně reindexujeme všechny stránky včetně těch, které se dlouho neměnily. To způsobuje, že robot má teď delší frontu než obvykle. Nemusíte ale spekulovat o tom, kdy byla poslední indexace, protože index se otáčí každý den. Část stránek dokonce každých asi 15 minut (třeba aktuální články).
[13][3] Webhledání je náš partner, který přebírá výsledky oficiálně přes naše API a zobrazuje i Sklik, ze kterého dostává provizi. Takže to opravdu není žádné zneužití výsledků. Pokud máte stránky generující desítky tisíc hledání denně a zajímáte se o podobnou spolupráci, zkuste mi napsat.
[14]při hledání výrazu K:CMS bych očekával první oficiální stránky kcms.cz
[15]Ad [14]. Já nikoliv. Ta stránka není v indexu, její robots.txt vypadá docela podivně http://www.kcms.cz/robots.txt Jestli ho robot pochopil tak jako já, tedy zákaz indexace homepage, pak je to asi zřejmé.
[16]Říkáte, že co je dobré pro uživatele, na to dáváte váhu… Zajímavé je, že po upgradu se prakticky na každý dotaz zobrazuje na první stránce něco z firmy.cz. Není lepší tam tento jeden odkaz dát např. vždy jako první výsledek nějak orámovaný, než to dávat do fulltextu. Nechci z ničeho obviňovat, ale je to divné…
[17][16] Koukněte na Google. Ten má vždycky své služby na prvním místě ve výsledcích vyhledávání (pokud se jich dotaz alespoň trochu týká) a nikdo ho za to nebombarduje…
[18]Zajimave, kdo vi jak se k tomu postavi seznam, jestli tyhle zlodejicky vykope z fulltextu nebo ne. http://www.lupa.cz/clanky/hyperinzerce-krade-inzeraty/
[19]U webu zvkovo.cz jste nám dnes zaindexovali již týden neexistující stránku. Do včera bylo všechno OK. http://search.seznam.cz/?q=betonov%C3%A9+ploty&count=10&from=81&pId=KK_0REtMCQXkWKiIyA5w&source=sug
[20]Nám od těch změn ve fulltextu z výsledku vyhledávání úplně zmizel web. Web má SEO, generuje sitemap atd., dříve byl kolem 10 místa, teď není nikde. Parametr site ukazuje 2295 zaindexovaných stránek (pokud tedy site ukazuje jak má), ale na ani jedno klíčové slovo, ani na kombinace se kterými byl dříve na 2-3 místě ho fulltext nenajde.
[21][18] to je hnus!! otázkou je zda může Seznam zabanovat někoho za to že je zloděj
[22][17] Nevím, co konkrétně myslíte, ale jestli to, že do výsledků zařazuje odkazy např. na Google Mapy, tak to je něco zcela jiného. Tam je to vloženo do výsledků vyhledávání, na Seznamu je to součást vyhledávání = zabere to jednu pozici na stránce.
[23][15] No.. podle dokumentace to naopak znamená, že robot smí všude. Viz http://www.jakpsatweb.cz/robots-txt.html (tedy pokud tento robots.txt nebyl již opraven)
[24][23] Myslím, že s ním autor nic nedělal.
[25][9] – nene, zadny stopslovnik neexistuje, indexuji se uplne vsechna slova. V nekterych pripadech jsou totiz jednopismena slova dulezita – treba „c & a“. O tom jestli se slovo bude hledat nebo nebude se rozhoduje az pri zadani dotazu podle toho jestli je jeho vyznam pro dotaz prinosny nebo zanedbatelny. Podle uplne stejneho algoritmu (ktery predtim predlozku vyradil) se dekomponuje dotaz „v novinach“ takto: http://fulltext.sweb.cz/vnovinach.png
[26]Domnívám se že nyní v hodně případech fulltext vyhodí nějakou podstánku produktu do výsledku, naopak aby předložil více, dle mého názoru relevantní hlavní kategorii na kterou uživatelé odkazují. Pozoruji to na mnoha případech, kdy v long tailu jsou až moc často předhazovány takovéto výsledky. … Jen názor k zamyšlení
[27][26] Ano, tak by se i daly vystihnout ty jednotlivé problémy o kterých jsem psal.
[28]Dobrý den, dotaz k fulltextu. Proč skáčou weby v cca týdenních intervalech o 5 i více míst dopředu/dozadu? Můj web byl na jedno klíčové slovo 7, minulý týden 1, teď zase 7. Žádné velké změny na něm neproběhly.
[29][28]Jo jo tancuje to teď až hrůza a přesně jak píšete uplně nevyzpytatelně o desítky pozic. Sleduji více webů co spravuji a jeden den třetí první strana a druhý den dole na druhé straně bez žádných úprav ani on ani off page. Snad se to ustálí. Jsem takoví testovací králíčci :-( To že jsou předřazovány podstránky opriti hlavním to je bohužel fakt, který se minezdá jako ok. Napřáklad na jedno slovo, které mám v jiném sklonu slova a pouze jednou na hlavní straně s vysokým hodnocením Srank, tak nám Seznam vyhodil zacílenou hlavní sekci (podstranu) s nižším rankem. Bohužel je to evidentní důsledek systemu vyhodnocování frází co popisují kluci z fulltextu. :-(
[30]Úplná hloupost, ale pro moji dceru důležitá věc: http://search.seznam.cz/?q=stegosaurus&sId=cPRIOMU9wTzdD2MU-Mc3&source=top Ona toho stegosaura nechce koupit…
[31]Třeba je to tím, že z českých stránek o stegosaurusovi nikdo nic moc nepíše. Když zadáte i do googlu vyhledání českých stránek tak je výsledek podobný mimo wiki..
[32]30 a 31 no ono je to hlavně tím, že seznam protlačuje monstrweby s velkým množstvím odkazů,typicky eshopy, takže jakmile je to dotaz tohodle typu (kdy hledáme nějakou věc aniž bychom uvažovali o nějaké koupi, ale ono se to koupit dá naběhne plno stránek bez obsahu s obrázkem, cenou a tlačítkem koupit. Co by dal teď hledající za deseti stránkovou minisite… nejsou máme eshopy, případně jiné nerelevantní weby. Co potom, že mě jako hledajícího nezajímá, že si seznam myslí že mi servíruje kvalitu, protože vyhledané weby mají 1000+ podstránek a 1000+ odkazů..
[33][32] Tohle je krok dobrý m směrem, protože ty pár stránkové weby jsou v 99% MFA a jiná podobná haluz.
[34]Tak nejak mi nepřijdou vydledky uplne relevantni http://search.seznam.cz/?q=Converse.cz&mod=f Na druhem miste je pouze Soutez se znackou Converse, na 8.miste Cenyzbozi.cz obsahuji pouze „cz“ a Converse nikde, na 9. miste jakbysmet. 4. a 5. misto odkazuje na duplikatni text. 7. misto odkazuje na kategorii v neprehlednem katalogu se stovkami okamzite schvalovanych odkazu, neodkazuje na presnou polozku (stranku v katalogu) = SPAM. To jste zase eshopistum takhle pred vanocema nadelali vrasky a diry do kapes, ale Sklik vam jiste ted vydela vic.
[35][33] To je pěkná kravina. Doufám, že si to myslíte jenom vy a ne fulltext seznamu. Upřednostňovat jeden web na základě jeho celkové velikosti je kopanec do prdele algoritmům rozebíraným v tomto článku. Taková ubohá úvaha je v seznamu snad nenapadla. Jestli se bude proti MFA bojovat tímto způsobem, tak potěš koště. P.S. Nemám žádný MFA. Mám malý web.
[36]35- No momentálně je to na seznamu realita, ač se to zdá absurdní..
[37][35][36] Není nic jednoduššího než web rozvíjet a budovat kvalitní obsah… toť můj názor.
[38]Proč mám rozvíjet web, na kterém jsou všechny relevantní informace a stačí na to pár stránek? Abych vyhověl podivným pravidlům seznamu, protože jinak nemám šanci aby mě někdo našel? Je tady tedy vyhledávač kvůli stránkám nebo stránky kvůli vyhledávači? A co to zmiňované „co je dobré pro uživatele je dobré pro vyhledávač“? To by v případě upřednostňování velkých webů taky neplatilo, protože v ohromném množství stránek se zároveň rozpouštějí témata. Těžko se bude velký web věnovat relevantnímu tématu (vyhledávané frázi) na tisícovce stran… A pokud je skutečně pravda, že seznam takto upřednostňuje velké weby, tak MFA se tomu přizpůsobí, o tom není pochyb.
[39]Přirovnání nového robůtka ke spalovacímu motoru(viz. např. článek na novinky.cz) je v 21st. možná opodstatněné zároveň však směšné. Výsledky vyhledávaní haprují jako kdyby robot jel pouze na dva válce. Vyzíváte nás ať o indexaci nespekulujeme, ale jak máme ne-spekulivat při tak kolísajících výsledcích vyhledávání?
[40]http://search.seznam.cz/?q=l%C3%A9k%C3%A1rna&sId=IXp9LO07weCau6K5ss7P&source=top je tam dvakrát ta samá lékárna. Jednou to háže odkaz z firem a jednou napřímo. Je to tak v pořádku?
[41]Myslím, že toto není zrovna relevantní výsledek. Výpis z firem hned na první straně:http://search.seznam.cz/?q=stany&count=10&from=1&pId=q8KJ23M-OLURuKHqRopA&source=top
[42]Co třeba tohle : http://search.seznam.cz/?q=www.sudoku.cz&sId=ftV1K_jKwD5Qh6Hg75aW&source=top Jen 2 relevantni vysledky na cele strance, to mi přijde taky jako pekna kravina.
[43][43] mate pravdu s tou kravinou. Ale podle me na dotaz www.sudoku.cz je jen jeden spravny vysledek. A to prave www.sudoku.cz, ostani neni relevantni, ale jako doplneni vyhledavani to jde, skoro by mely byt pod carou, nebo rovnou na druhe strane:D
[44]No jo, ted uz tam jsou jiné výsledky než ráno :)
[45]OT: Nedá mi to se nezeptat autorů javascriptu (vyhledávací pole) zda se kód neupravoval? Už cca 10dní mi zničeho nic nejde psát do pole pro vyhledávání na seznamu. Blikající kurzor se přestěhuje do levého horního rohu a pole pro vyhledávání je zamrzlé. Pokud chci pokračovat psát slovo musím udělat reload stránky seznamu a pak již jde psát. Ovšem tato chyba se opakuje několikrát dokola. Jsem jediný? OS: Browser Details :t Mozilla/5.0 (iPhone; U; CPU iPhone OS 3_0 like Mac OS X; cs-cz) AppleWebKit/528.18 (KHTML, like Gecko) Version/4.0 Mobile/7A341 Safari/528.16
[46][46]Ještě podotknu, že tato chyba se mě vyskytuje pouze v horním vyhledávacím poli.
[47]Možná by ještě chtělo vychytat toto: http://search.seznam.cz/?q=e-shop&mod=f
[48]Odpověd na všechny otázky: Maj to posraný.
[49]Teraz Seznam vracia hodně odlišné výsledky na to iste slovo v různých tvarech: Praha / Prahy / Praze . V minulej verzii si boli výsledky oveľa podobnejšie pri hledání toho samého slova / frááze v různých tvarech. Len neviem posudiť, či je tato diverzita výsledkov pri hladaní stejného slova zmena k lepšiemu, alebo nie. Ale pestrý/bohatý text proste vyhráva.
[50]Je mozne nejakym zpusobem nahlasit duplicitni obsah? Seznam nam ukazuje adresu, kterou uz nevyuzivame a vsude propagujeme vice jinou. rel canonical je nastaven, ale ridi se jim seznam? nebo podle ceho urcuje dulezitejsi domenu? podle sranku? diky za info.
[51][49] – nemyslím si, že vždy platí, že pestrý a bohatý text vyhrává, kéž by… [50] – google to tuším umožňuje, že si nastavíte, že jste přešli se stejným obsahem na novou doménu, Seznam pokud vím, tak ne…
[52]Se seznam.cz jsem našel na českých stránkách, co jsem hledal – firmy, výrobky, služby. Doufám, že vydržíte!!!!! Jste svým způsobem hrdinové!
[53][45] ta chyba se projevuje na iphonu? [50] rel canonical zatím moc nepoužíváme, stejně má platit jenom uvnitř domény. Nyní je jediné správné řešení dát přesměrování na novou doménu, nebo hoooodně dlouho počkat. [35] v hodnotícím algoritmu žádný signál typu „velký web“ nemáme. Ale občas to tak jakoby vyjde, nepřímo kvůli jiným signálům. Rozhodně není špatný nápad dělat malé weby. [N] Děkujeme za reporty blbých výsledků, koukáme na to.
[54][53] Ano, mě se tato chyba projevuje v iPhone. Nevím však jak jsou na tom prohlížeč v PC se stejným jádrem WebKit (např.: Safari). Každopádně bych si ještě rád postěžoval na další bug projevující se na zbozi.cz Občas potřebuji vědět v kameném obchodu kolik stojí produkt v e-shopu. Zvolím tedy integrovaný vyhledávač google kam zadám např.: hrábě fiskars zbozi.cz. Google mi zobrazí výsledky i ze zbzi.cz s konkrétní url na výsledek, ovšem script na zbozi.cz mě přesměruje na root m.zbozi.cz. (pozn. dnes už mě script záhadně nepřesměruje)
[55][54] Nedám si pokoj a tento bug zareportuji na firmy.cz Zadám-li přesnou url do prohlížeče nebo pokud mi search.seznam.cz nabídne výsledek vyhledávání s odkazem na firmy.cz např.: http://www.firmy.cz/detail/2170072-marek-stejskal-e-shop-praha-cerny-most.html jsem automaticky po kliknutí přesměrován na url m.firmy.cz (používám iPhone) Proč mě to nepřesměruje na http://m.firmy.cz/detail/2170072-marek-stejskal-e-shop-praha-cerny-most.html nebo se nenačte jiný css styl? Mám tušení, že to takto bude fungovat i u vašich ostatních projektech pro většinu mobilních prohlížečů.
[56]Jeste by me zajimalo, jak casto se aktualizuje S-Rank? Je to online nebo se vysledky vyhodnocuji napr. jednou mesicne a naraz se zmeni Srank skokove v urcity den?
[57]Ve svém příspěvku píšete v P.S.1, že operátor SITE by již měl fungovat normálně. Bohužel s tím nemohu souhlasit. Pro příklad uvádím www.skoda-auto.cz. Na první stránce vypisujete, že bylo nalezeno 906 stránek, ale postupným stránkováním se počet nalezených stránek snižuje. Na stránce 28 již je pouze 276 nalezených stránek a dál nic. Který údaj je tede správný? Ten z první strany nebo musím zkoušet listovat až na tu poslední?
[58][57] Ono takhle myslim fungovalo vzdycky a funguje to tak z nejakeho duvodu i na googlu. Pravdepodobne proto, ze google vyhazuje ze zobrazeni podobne stranky.
[59][58] Dobře, ale který z těchto dvou údajů tedy vyjadřuje skutečný počet zaindexovaných stránek? V mém vlastním případě, nechci si dělat reklamu, to znamená, že mám zaindexovaných cca 69000 stránek, ale na 6 stránce listování zjistím, že jich je jen 58! Mimochodem mi to v podstatě okamžitě snížilo návštěvnost webu z průměrných 12000 lidí na nějakých 7000 denně. Přičemž právě těch 5000 chybějících je z fulltextu Seznamu.
[60][58] Ještě doplním, že jsem právě zkoušel google a mám zaindexovaných 46000 stránek. Pokud přejdu na 100 stránku, ukazuje výpis stále 46000 stránek.
[61]Já bych řekl že podobné stránky jako http://www.realitni-kancelar.biz/realitni-kancelare-praha nemají ve vyhledávání co dělat, mají obsah vygenerovaný pro okresní města. Třeba 20x stejný nadpis H1 v těle dokumentu by měl být trestán. Když budete dál sledovat patičky, dostanete se prakticky na stejné weby o autoškolách, autobazarech atd…
[62]Co chcete na realitní kanceláře najít? mě to připadá jako moc hezký seznam. Spíš mě trápí, že jsem 21.10. spustil, nalinkoval web a do dneška Seznam zná jen 5 podstránek :)
[63]Na klíčové slovo hračky vyběhne tento pěkně naoptimalizovaný shop: http://www.4kids.cz/home.aspx =)
[64][63] … a to má být reklama uvedeného shopu nebo v čem je problém?
[65]Nechápu vyhodnocování výsledků na spojení školení řidičů, stránky, které byly na první straně na 4 místě – www.skoleniridicu.net, jsou již na 4 stránce a neustále klesají, ale proč?? Na stránkách se nic nezměnilo, a kdo jiný by se měl zobrazovat na první straně na toto slovní spojení, než firma která se tak přímo jmenuje Školení řidičů s.r.o. !
[66]Přemýšlím, jakou metriku by Seznam měl zvolit, aby posoudil, zda provedené změny byly k lepšímu nebo k horšímu. Pocity a metafory o motorech by to asi být neměly. ;-) Jeden způsob měření mě napadl – srovnání s Googlem. Za předpokladu, že si Google vezmeme jako etalon (tedy přijmeme za fakt, že jeho výsledky díky výhodám v rúzných oblastech – peníze, technologie, lidi – jsou relevantnější než ty Seznamu), pak změny nedopadly dobře a Seznam ztrácí další procentíčko podílu na trhu. Konkrétní příklad, Omlazení.cz, nejrychleji rostoucí web pro ženy, nominovaný na Křišťálovou lupu. Pokusím se o tabulku podílu na návštěvnosti z Googlu a Seznamu Období / Google / Seznam 09-2008 / 20% / 56% 09-2009 / 31% / 49% 10-2009 / 33% / 47% 11-2009 / 38% / 43% (Listopad je do 22.11.) Možná někde dělám nějakou logickou chybu, ale vychází mi, že za pár měsíců nebude Omlazení Seznam.cz vůbec potřebovat.
[67]Zdravím, mám trochu problém s dotazem „Stáj Framon“. Zobrazí se vše možné, jen ne to co bych čekal: www.stajframon.cz. Web je sice cca 14 dní kompletně překopaný, ale bylo zachované u většiny stránek přesměrování přes 301 a Google a Bing to zobrazují zcela normálně. Asi nejmarkantnější je rozdíl v dotazu „site:www.stajframon.cz stáj framon“ mezi Seznamem a konkurencí. Kde může být problém? Díky
[68]Mam dotaz ohledne indexace. Mam dve stranky s duplicitnim obsahem. Web1 seznam normalne indexoval, srank 7, web2 nebral v potaz, srank4 (od predchoziho majitele). Ted se natvrdo nastavilo presmerovani 301 web1 na web2. takze uz bezi jen web2. 1] jak dlouho bude trvat seznamu nez puvodni stranku vyhodi. 2] jak rychle zaradi web2, ktery se doted nezobrazoval 3] bral doted Seznam v potaz odkazy na web2, nebo je zahazoval a zacne si jich vsimat az ted? tzn. srank ted je neaktualni? diky za info Mike
[69]Nevypadly vám zase Statistiky hledanosti dotazů? http://search.seznam.cz/stats?collocation=z%C3%A1jezd&submit=Vyhledat+Seznamem
[70]68) odpovim si sam, trvalo to tri dni :o)
[71]Provozujeme e-shop www.prozdravi.cz. Do doby než byl spuštěn nový fulltext na Seznamu jsme se s našimi stránkami drželi na dobrých pozicích. Bohužel po změně fulltextu se nám každým dnem stránky ve výsledcích hledání propadají níže a níže a nedaří se nám zhoršující se tendenci zastavit. Zkoušeli jsme citlivě zvětšovat hustotu kl. slova na stránce nebo budovat zpětné odkazy ale většinou bezvýsledně. Na e-shopu nepoužíváme nic, co by mohlo být označené jako černé SEO, navíc stránky mají výbornou informační hodnotu s dostatkem textu. Nemohli byste prosím poradit, kde by mohla být chyba a popřípadě, co má nový fulltext na stránkách „nejraději“? Děkuji
[72]CHYBA-Víte že když jednou použijete našeptávač a pak ho použijete podruhé a kliknete v našeptávači na hledanou frázi tak se hledání neprovede?…!
[73]Dobrý den, mám problém ohledně vyhledávání fulltextu. Pracuji jako webový analytik a architekt (+ SEO apod.) a s něčím takovým jsem se ještě nesetkal. Seznam sice stránky mého klienta zaindexuje (malou část a pomalu), ale ani přes jedno z klíčových slov, ani skrze přesné titly NELZE VYHLEDAT. Web je maximálně optimalizován, sitemap, robots, texty, title, nadpisy apod:( Je rozhodne lepsi nez spousta ostatnich, co lze vyhledat i nez puvodni: http://www.floridainc.us/mainpage_ch.html. Můžete mi prosím poradit v čem je problém? Na Google je vše v pořádku. Jedná se web www.floridainvestment.cz. Už je to více jak měsíc a nic se neděje. Děkuji.
[74]Dobrý den, gratuluji k tak významnému kroku kupředu! Ještě důležitější teď ale bude doladit nový stroj k dokonalosti, protože má stále spoustu chyb, jako např. že zobrazuje 1 web v prvních třech výsledcích vyhledávání hned 2x viz dotaz „fotobanka“ (http://search.seznam.cz/?q=fotobanka&mod=f) na prvním a třetím místě. Pokud si nevyberu web na prvním místě a půjdu dál, proč je mi totéž podstrkováno na místě třetím?
[75]Sleduju, co vy tam v tom Seznamu delate a docela neverim svym ocim. Chvilku byly vysledky dobre, opravdu, relevance stoupla, ale pred nekolika dny se zase neco stalo a je to opravdu „skvele“. No panove, jsou sportovnipodlahy.eu s tim obsahem adekvatni k hledane frazi „aritmie příznaky“ a obsahuje hodnotne informace? Ja nemam ten pocit. http://search.seznam.cz/?q=aritmie+p%C5%99%C3%ADznaky Bohuzel se zase dostavaji do popredi weby, ktere nemaji zadnou hodnotu, nebo to jsou primo MFAcka. Uzivatel je ztracen, najde kdejake kraviny a pak si bude napriklad lecit mozkovou mrtvici bylinkama z vietnamu, chjo.
[76]Netušil jsem, že dříve Seznam pracoval na tak jednoduchém algoritmu. Můžu se zeptat jak dlouho takto běžel? Nebo spíše od jakého roku? PS: Nový způsob je bezva. Určitě to ještě přinese své klady a zlepšení výsledků vyhledávaní. Docela se těším na další vylepšení.
[77]Ten nový způsob chválím :-)
[78]Dobrý den, chtěl bych se dotázat provozujeme www stránky kde dochází k neustále rotaci informací a textu a pozic..má tato skutečnost nějaký vliv na indexování a následné zobrazování hledaného textu zákazníkem který hledá preš seznam .cz ?? Děkuji za odpověď Petr. ať se daří ..
[79]Dobrý den, měl bych také dotaz. Zajímalo by mě jáký význam má pro seznam.cz slovo „tryskání“ přesněji „tryskani“. Zdá se mi, že váš algoritmus věří že to to slovo bez diakritiky má nějaký smysl (já věřím že nemá). Děkuji, hodně zdaru …
[80]Dobrý den, sem rád za posun ve vyhledávání opravdu velkým směrem a že se snažíte upřednostnovat uživatele a zaměřovat na to, co má na mysli, když něco hledá. Věřím, že nadále to budete vylepšovat. Sice to ve výsledcích můj web poškodilo,ale snad bude líp…Přeji hodně štěstí!
[81]Chybička se vloudila – na slovo „káva“ vám výsledky vyhazují na první straně článek „Poslední káva s Petrem Mukem“. Že by hodně odkazů s vysokým rankem (nic proti Petrovi Mukovi)? Pro ty, co hledají informace o kávě nic moc. http://search.seznam.cz/?sourceid=szn-HP&thru=&q=k%C3%A1va
[82]Bude seznam zase někdy aktualizovat S-ranky? Jak často probíhá aktualizace? Už na ní marně čekám asi tak tři měsíce :-/ Děkuji a přeji hezký den