Jednou z činností, která se provádí během zpracování dotazu, je expanze zkratek. Expanze zkratek v tomto případě znamená, že se kromě samotné zkratky hledá také její význam. Zjednodušeně řečeno, v případě, že uživatel zadá například dotaz [PPC], hladá se také například Pay Per Click. V ostrém hledání máme v současné době zapnutou pouze expanzi zkratek v jednoslovných dotazech a právě připravujeme také expanzi zkratek v dotazech víceslovných.
V minulosti jsme již expanzi zkratek ve víceslovných dotazech zapnutou měli, ale vzhledem k tomu, že nám způsobovala v určitých případech problémy, rozhodli jsme se pro její vypnutí. V nové a vylepšené verzi jsme se museli například vypořádat se situacemi, ve kterých dotaz obsahuje víceznačnou zkratku, případně s vahou, kterou zkratka do hledání dostane. Abych vám problém trochu přiblížil, vysvětlím jej na dotazu [PPC]. PPC je zkratka, která má minimálně 3 významy:
- PowerPC
- Pocket PC
- Pay Per Click
Abychom uživateli poskytli ucelený přehled o významu zkratky PPC, museli bychom zobrazit z každé expandované formy pár nejrelevantnějších výsledků. Ne vždy je ovšem tento stav vhodný a v určitých případech je dokonce nežádoucí. V každém případě se ovšem musíme vždy podle nějakého kritéria rozhodnout, jakou váhu expandovaná forma zkratky dostane. Jestliže například uživatel preferuje na dotaz [PPC] výsledky pro Pay Per Click, musí dostat Pay Per Click vyšší váhu, než zbylé dva expandované tvary. Váha expandované zkratky má vliv na výslednou relevanci dokumentu.
Jak by mohl například vypadat strom jednoslovného dotazu [PPC]? Konkrétní podoba stromu dotazu může být různá, ale jednou z možných variant je například tato:
A jak je to s víceslovnými zkratkami? Tady je situace poněkud jiná, než v případě zkratek jednoslovných. V rozhodnutí, kterou expandovanou formu zkratky zvolit, nám pomáhá její okolí v dotazu. K čemu nám okolí zkratky v dotazu je? Jednou z podmínek pro doplnění konkrétní expandované formy zkratky do stromu dotazu je tematická příbuznost jejího okolí v dotazu s okolím expandovaného tvaru zkratky v korpusu. Korpusem v tomto případě můžeme rozumět konkrétní množinu indexovaných dokumentů. Tematická příbuznost například zajistí, že na dotaz [PPC reklama] budeme s nejvyšší váhou hledat kombinaci slova reklama právě s expandovaným tvarem Pay Per Click, případně, že zbylé expandované tvary Pocket PC a PowerPC nebudeme hledat vůbec.
A jak by mohl vypadat strom dotazu právě u dotazu [PPC reklama]? Stejně jako v případě jednoslovného dotazu, může i tento strom vypadat různě. Jedna z možných variant je znázorněna níže:
A proč to vlastně řešíme, když se problém vyřeší v dlouhém dotazu sám tím, že dokument musí obsahovat všechna slova v dotazu a těžko se na stránce o Pay Per Click reklamě objeví slova spadající do odvětví kapesního počítače (Pocket PC)? Jelikož tomu tak není, což si můžete ověřit sami, po zadání dotazu [Pocket PC reklama]. Ve výsledcích zjistíte, že existují i stránky o Pocket PC, na kterých se slovo reklama vyskytuje. Přitom dotaz [PPC reklama] by měl spíše mířit na stránky o Pay Per Click reklamě. Kdybychom v tomto případě dotaz [PPC reklama] rozložili chybně do tvaru zobrazeného níže, hledali bychom i netematické dokumenty.
Co si o tomto vylepšení myslíte vy? Uvítáte aktuálně připravovanou změnu? Máte nějaké další nápady jak zvýšit relevanci dotazů obsahující zkratku? Napište nám vaše názory do komentářů pod článkem.




Spousta slov, ale fulltext stoji porad za prd. Nema cenu odebirat tenhle feed
Co se kuje za pikle? Searchtest ukazuje po dlouhé době rozdílné výsledky oproti ostrému fulltextu, nějaké novinky?
Fulltext v posledních dnech má extrémní nedostatky. Vypadávají některé stránky z indexu, některé weby přestože jsou zaindexované se nezobrazují na klíčová spojení, na které se zobrazovaly řadu let. (když jste rok na nějaké pozici na první straně výsledků a najednou nejste ani na 20 straně asi něco není v pořádku). Divím se že Seznam tady řeší nějakou expanzi zkratek a povídá si tady jakoby nic, když vypadává fulltext. Mimochodem to že jste odpojili mail značí o tom, že nejsem sám, komu se nedostatky fulltextu nelíbí.
Můžete být prosím konkrétnější? Konkrétností v tomto případě myslím dvojici: dotaz – url
Ano mohu, jedná se o web http://www.kleindesign.cz/, který zmizel na tyto klíčová spojení:
„tvorba webových stránek“ – zde jsem byl včera na první straně výsledků
„tvorba www stránek“ – zde jsem byl na první straně výsledků
a další, nerad bych to tady řešil na tomto místě, ale nic jiného mi nezvývá, jelikož jste helpdesk pro fulltext zrušili.
O tom už tady píšu dlouho a vůbec nereagují. Zkuste tvorba www stránek Liberec, na první stránce SERPu není ani jedna firma, která dělá weby :-) a to už takhle trvá asi 3 týdny.
tak to je opravdu mazec – TAKTO SE TOTIŽ PODPORUJE SKLIK -fulltext nenajde nic a SKLIK vydělává
Jj, to samé tvorba www stránek ostrava.
mail fulltextu
Já psal např. na podporu fulltextu dotaz kam mi zmizela hlavní stránka z vyhledávání a odpověď klasická několik let „Nevidím zde žádný technický problém, který by bránil indexaci webu. Pokud není ve výsledcích vyhledávání stránka zařazena, je možné, že ji robot vyhodnotil jako nedostatečně relevantní. Doporučuji prostudovathttp://napoveda.seznam.cz/cz/fulltext-hledani-v-internetu/optimalizace-webu/ a poté se pokusit stránku upravit.“ má cenu se rozčilovat – nemá.
Můžete být prosím konkrétnější a uvést kombinaci dvojic dotaz – url, ve kterých jste zaznamenal problém se zmizením stránky z vyhledávání?
např: chorvatsko-365.cz hlavní stránka úplně zmizela z vyhledávání (cca před týdnem) podstránky jsou ok – a takových webů mám několik a jak jsem takových případů jsou stovky
Můžete prosím uvést i další případy?
myslím, že to zatím stačí – pokud se tím chcete zabývat tak si porovnejte výsledky vyhledávání na searchtestu a ostré verzi (různá klíčová slova) jsou to opravdu velké rozdíly (searchtest má databázi starou cca 14 dní) a mezitím se dějí neuvěřitelné věci!!
Zatím z toho mám docela rozporuplné dojmy. Nechápu, že nějaké weby úplně vypadly z fulltextu z prvního místa na např. 3 stránku. Budou se výsledky ještě nějak upravovat, jelikož mi přijde trochu divné aby dobře optimalizovanej web najednou vypadnul??
Že by to bylo právě tím, že je ten web dobře optimalizovanej? Lidi nehledaj dobře optimalizované weby (ty jsou jim úplně šumák), ale především relevantní weby. To většina SEO lidí nechápe nebo spíš nechce pochopit.
Ručně psané texty prohrávají na celé čáře. Auto feed posty a rewrite boti vítězí.
GL + HF
Osobně nepreferuji jakoukoliv formu této umělé inteligence, kdy se stroj snaží si myslet, co jsem myslel. Nemám to rád ve Wordu, kde mi nástroj na automatickou opravu stále dokola opravuje slova, která jsem chtěl napsat na jiná, z číslice na začátku řádku mi hned udělá styl číslování, apod. A nemám to rád ani u vyhledávačů. Chci výsledky na to, co jsem zadal, a když hledám PPC, tak prostě hledám PPC a nechci zkratku nijak rozkládat, až budu chtít hledat pay per click, tak to tam zadám. Docela by mě zajímalo, jak ošetříte třeba to, že občas hledám nějaký produkt podle jeho katalogového čísla – co když tento bude obsahovat znaky nějaké zkratky?
Ještě bych se rád na férovku optal, jak je to s rychlostí indexace. V květnu po nasazení nového robota se toto výrazně zhoršilo. Pár týdnů jsem si říkal, že nový robot musí všechno zaindexovat znovu. Pak jsem pár týdnů věřil pohádkám z podpory a tohoto blogu o tom, že robot zaindexuje všechno, ale vybírá si, co zařadí do SERP. Teď už vím, že to druhé nebyla pravda, protože s odstupem času se nakonec všechny stránky (resp. většina stránek) v SERP objeví, jen to prostě šíleně dlouho trvá. O nějakém výběru tedy nemůže být řeč. Mohli byste nám na férovku napsat, jak to tedy je? Momentálně všem klientům rozmlouvám změnu e-shopu, protože v období květen-červenec přišel jeden z mých klientů řádově o 300 tis. Kč tržeb, když změnil shop a Seznam nebyl schopen zaindexovat nová URL. V SERP byly stále stránky původního shopu, které samozřejmě vedly na již neexistující stránky. Ještě dnes není všechno jak má být, 7 měsíců po změně je zaindexována sotva polovina původního počtu stránek. Předem díky za korektní vysvětlení.
Já jsem před časem udělal novou stránku a odkazy v internetu a do měsíce jsem na Seznamu byl a na dobré pozici. Možná nové stránky seznam indexuje rychleji než staré. Jako kdyby kouknutí se na web znovu bylo někde v pozadí jako nepodstatné, priorita je na nové weby bo co.
souhlasím je to skvělé – mám měsíc starou doménu a už nám v indexu 2 slovy dvě stránky – takže v roce 2999 bude načteno vše co tam je nyní – bravo sezname
http://search.seznam.cz/?q=snapbacks.cz&sId=kgoHhgm-CpB6MUn9ldXo&aq=&oq=&sourceid=top&thru= náš web taky záhadně zmizel z indexu i kfyž tam od prosince byl.