Přejít k hlavnímu obsahu

Seznam.cz Vyhledávání nabízí kvalitnější výsledky než kdykoli dřív. Díky hledání pomocí významových vektorů

redakce 15.11.2021
info ikonka
Zdroj:

Každý druhý Čech využije alespoň jednou měsíčně Vyhledávání od Seznam.cz, který je nejnavštěvovanější stránkou českého internetu.

Už dnes toho služba umí hodně a zároveň spoustu novinek chystá. Aktuálně vylepšuje nedávno nasazenou technologii hledání pomocí významových vektorů, díky nimž zpracuje i komplikované dotazy uživatelů internetu. Po deseti letech tak nastala zásadní změna, která lidem poskytne kvalitnější výsledky k zadaným výrazům na internetu.

„Vyhledávání na Seznamu do loňského roku fungovalo převážně tak, že jsme dotaz od uživatele opravili, analyzovali a přidali k němu další slova, která by mohla pomoci najít to, co uživatel hledal. Takovými slovy mohou být skloňované tvary zadaných slov, synonyma, rozvinuté zkratky apod. Tato slova jsme pak hledali v uložených webových stránkách, nalezené stránky řadili a vydali uživatelům. Vždy tedy zatím bylo potřeba na webové stránce najít nějaký textový ekvivalent toho, co uživatel napsal do dotazu,“ upřesňuje Martina Pomikálková, product manager senior služby Vyhledávání.

Je však řada dotazů, u kterých tato strategie nebyla dostatečně úspěšná. Těžké je třeba najít odpověď na dotaz zadaný v přirozeném jazyce. Čím víc slov uživatel do dotazu zadá, tím menší je pravděpodobnost, že se budou v nějakém tvaru vyskytovat všechna na jedné stránce. Každý si totiž někdy nepamatuje přesný název toho, co hledá, nebo se mu povede zcela originální překlep. To všechno komplikuje práci vyhledávače, který se snaží slova z dotazu najít na webové stránce. Řešení přineslo nově nasazené vektorové hledání, které zvládne rozklíčovat právě tyto složitější formulace a Vyhledávání pomůže výrazně lépe pochopit, co uživatel vlastně potřeboval.

Pokročilé vektorové vyhledávání doručí nejlepší výsledky

V praxi to funguje tak, že se hledání webových stránek, které obsahují konkrétní slova, rozšířilo o hledání stránek, které mají podobný význam jako dotaz, a to i přesto, že v nich některé z požadovaných slov chybí. „Funguje to trochu jako strojový překlad z cizího jazyka. Původní způsob hledání by se dal přirovnat k doslovnému překladu. Vektorový způsob hledání lze přirovnat k překládání pomocí umělých neuronových sítí, kde se text překládá mezi jazyky s mezikrokem, kdy je význam textu převedený do vektoru čísel,“ říká Martin Kirschner, manažer produktového týmu divize Vyhledávání.

Trendem ve Vyhledávání jsou delší dotazy v přirozeném jazyce

A jak si s tím poradí vylepšené Vyhledávání? „Z dotazů i textů webových stránek vyrábíme sadu vektorů, které reprezentují význam daného kusu textu. Embeddingový model, použitý pro výpočet vektorů, je naučený přiřazovat podobné vektory textům, které se obvykle vyskytují v podobných kontextech, tedy jsou si blízké významem. K vektorům dotazu pak hledáme nejpodobnější vektory stránek v mnohorozměrném vektorovém prostoru,“ popisuje metodiku Pomikálková a dodává, že díky ní Vyhledávání umožňuje výrazně lépe pochopit, co uživatel vlastně poptával. Odpadá tak nutnost vymýšlet, jaký dotaz zadat, výsledky budou dobré i při intuitivní formulaci otázky. Stránka s výsledky Vyhledávání obsahuje i chytré informační karty týkající se hledaného výrazu, které obsahují další zajímavé informace nebo fotogalerii.


Máte k článku připomínku? Napište nám

Mohlo by se vám líbit








Všechny nejnovější zprávy

doporučujeme