Rubriky
IT

Jak fungují fulltext vyhledávače? (Google, Seznam)

O vyhledávače se již zajímám delší dobu, takže o nich vím docela dost věcí, teď se tedy podíváme na to jak fungují fulltext vyhledávače konkrétně Google a Seznam o kterých toho vím nejvíce.

Procházení

Aby stránka mohla být indexovaná a zobrazovat se ve vyhledávání tak nejprve musí být objevena a stažena, toto dělají na to určení roboti, Google v jednu chvíli stahuje několik desítek tisíc stránek, u Seznamu tato informace není známá ale určitě to bude méně.

Rozhodnutí (pouze Seznam)

Kvůli tomu že na tom Seznam není finančně nejlépe a stránek na internetu je hodně tak mají krok navíc, rozhodnutí zda má cenu stránku indexovat. Z vlastní zkušenosti vím že je tento algoritmus dost přísný.

Indexace

Indexace je docela složitý proces a nechci tady zabíhat do detailů. Vezmu to tedy zjednodušeně, algoritmus vezme klíčová slova na stránce a přidá k nim v databázi tuto stránku, poté udělá hodnocení podle kterého se potom stránka zobrazuje ve vyhledávání, záleží zde např. na obsahu, stáří domény. Google navíc každou stránku vykresluje a spouští JavaScript, díky tomu může přesně odvodit hodnotu klíčových slov a hodnocení webu.

Vyhledávání

Když někdo zadá dotaz tak vyhledávač zkontroluje jestli výsledky nemá uložené, počítání výsledků je náročná operace. Když ne tak si rozdělí dotaz na jednotlivá slova a vybere stránky z indexu které tyto slova obsahují, potom udělá průsečík stránek. Následně se seřadí na základě několika faktorů. Vyhledávače si výsledky pro časté dotazy připravují aby se nemuselo čekat.

Google vs Seznam (technicky)

U Seznamu je hodně znát že jim chybí peníze, nemohou indexovat tolik webů jako Google. Google je hodně daleko v oblasti umělé inteligence, díky tomu může poskytovat hodně kvalitní výsledky což si taky Seznam nemůže dovolit, také si nemůže dovolit renderovat každý web jako to dělá Google. Ale Seznamu se musí uznat že docela dokáže konkurovat Googlu, to na světě dokáží pouze 4 vyhledávače (svět – Bing, Rusko – Yandex, Čína – Baidu, Česko – Seznam).

Autor: Matěj Strnad

Je mi 14 let, baví mě programování a psaní článků (proto vznikl tento blog). Aktuálně jsem na ŽŠ, poté půjdu nejspíše na všeobecné gymnázium. Jako flegmatik jsem klidný a mírumilovný avšak i drobek líný :)

1 reakce na „Jak fungují fulltext vyhledávače? (Google, Seznam)“

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *