Lže nám Google o vyhledávání? Proč by to vůbec dělal a jaký je názor experta?
- Články
- Adam Kurfürst
- 6.6.2024
- 3
- Google utrpěl masivní únik dat, který prozrazuje tajemství vyhledávače
- V rozsáhlé dokumentaci se našlo mnoho náznaků předešlých lží
- Situace vyvolává mnoho otázek a otevírá dveře k bližšímu chápání algoritmu
Dovolil bych si říct, že Vyhledávač Google patří mezi nejvíc fascinující technologie vůbec. Využívají jej miliony lidí po celém světě, přičemž na něm dohromady každodenně provedou okolo 9 miliard vyhledávání, ale přesto téměř nikdo z nich zcela neví, jak doopravdy funguje. Nevím to já, a přestože vás rozhodně nechci nikterak podceňovat, dal bych ruku do ohně za to, že si jeho skutečným principem nebudete jisti ani vy.
Vyhledávání na Googlu je poháněno nesmírně komplexním algoritmem. Snem každého provozovatele webových stránek – ano, pochopitelně tedy i nás – je umístit se ve výsledcích na co nejvyšší pozici, neboť tím, že se lidem ukážete mezi prvními, se zcela logicky zvýší šance na to, že uživatel zavítá právě k vám. Právě řazení stránek ve výsledcích je však postaveno na neskutečném množství parametrů, o kterých navíc Google neposkytuje zcela transparentní informace. Ba dokonce lidem možná přímo lže.
Proč si lze myslet, že si Google vymýšlí?
Moc dobře si uvědomuji, že obvinit technologický kolos typu Google z šíření nepravdivých tvrzení je velmi závažným obviněním, jež bych měl mít něčím podložené. Stejně tak je to moc dobře jasné expertům v oblasti SEO (Search Engine Optimization, optimalizace pro vyhledávače), které v následujících řádcích hodlám citovat.
Masivní únik dat
Minulý týden, počínaje pondělím 27. května, se internetem prohnala zpráva o masivním úniku, který nám může dát klíčový vhled do toho, jak přesně funguje Vyhledávač Google.
Některý ze zaměstnanců společnosti (zřejmě omylem) umístil na vývojářský portál GitHub více než 2 500 stran interní dokumentace, obsahujících více než 14 014 atributů (funkcí API). O záležitosti prvně informoval někdejší SEO expert Rand Fishkin ve spolupráci s jedním z předních specialistů současnosti Mikem Kingem.
Co je to API?
API neboli “Application Programming Interface” (rozhraní pro programování aplikací), je sada pravidel a protokolů, která umožňují různým softwarovým aplikacím komunikovat mezi sebou. API určuje, jakým způsobem mohou jednotlivé části softwaru vzájemně spolupracovat, a umožňuje vývojářům přistupovat k funkcím nebo datům jiných aplikací či služeb.
Jednoduše řečeno, API je jako most mezi různými softwarovými systémy, který jim umožňuje sdílet data a funkcionality. Například, když aplikace na počasí získává aktuální předpověď, používá k tomu API meteorologické služby.
Na základě anonymních rozhovorů s bývalými pracovníky Googlu se potvrdilo, že jsou uniklé materiály skutečně s nejvyšší pravděpodobností autentické a nejde o prachobyčejný podvrh. Pravost úniku pak přiznal i samotný technologický kolos v prohlášení pro server The Verge.
Co únik poodhalil?
Únik je pochopitelně tak rozsáhlý, že potrvá týdny, ba dokonce možná i měsíce, než se komunitě nadšenců a expertů jej povede zcela rozlousknout a plně využít jeho potenciálu. Z informací, které máme díky jmenovaným specialistům k dispozici momentálně, však víme, že si Google v mnohém protiřečil. Jeho zaměstnanci konkrétně v minulosti tvrdě odmítali, že by vyhledávač při řazení stránek ve výsledcích spoléhal na určité postupy, které však přímo zmiňuje uniklá API dokumentace.
Dříve například zástupci firmy hlásali, že ve vyhledávání nehraje žádnou roli signál Click-Through Rate (CTR), tedy poměr mezi počtem kliknutí na odkaz a počtem lidí, kterým se odkaz zobrazil. Nejenže tohle už v podstatě bylo vyvráceno svědectvím Pandu Nayaka v antimonopolním procesu amerického ministerstva spravedlnosti, kde jsme se dozvěděli o hodnotících systémech NavBoost a Glue, ale také tomu nyní rozporuje samotná dokumentace.
Z úniku dále vyplývá, že Google bere v potaz data z prohlížeče Chrome, ačkoliv to firma dříve popírala, a stejně tak pracuje Vyhledávač také s parametrem autority domény. Bohužel se přesně neví, jak je tato míra vypočítána, ale nyní je dokázáno, že existuje a výsledky vyhledávání více či méně ovlivňuje.
Celá problematika je daleko komplexnější, a pokud se chcete o úniku dozvědět více po technické stránce, znovu vás mohu odkázat na publikace Randa Fishkina a Mikea Kinga.
Proč by Google lhal?
Na tuto otázku vůbec není snadné odpovědět, v dokumentaci se totiž vysvětlení skoro určitě nedohledáme – dá se proto jen v mezích rozumu spekulovat.
Google dost pravděpodobně prohrává válku s nekvalitním obsahem. Optimalizovat svůj web pro vyhledávač je sice dobré pro férové podnikatele, ale najdou se i exemplární příklady těch, kteří SEO metod vyloženě zneužívají pro svůj prospěch a naprosto tak zazdí výrazně kvalitnější a pro spotřebitele přínosnější obsah. Problém s takzvaným SEO spamem potvrzuje i studie, na níž upozornil portál Ars Tecnica.
Teoreticky tak Google nemusí chtít odhalovat všechny své metody z důvodu, aby se jim nedalo uměle přizpůsobit web a ošálit tak vyhledávací algoritmus, který by následně stránku doporučoval i přesto, že její obsah není příliš kvalitní.
Pokud by své postupy přiznal, mohl by se taktéž ocitnout pod náporem nespokojených uživatelů, kterým se nemusí líbit, nebo pod ještě větším drobnohledem regulátorů.
Co si o situaci myslí český SEO specialista Pavel Ungr?
V souvislosti s únikem jsme se spojili s českým SEO expertem Pavlem Ungrem a poprosili jej o vyjádření. Takto situaci exkluzivně okomentoval pro Svět Androida:
Google nám lže? Možná, ale vědět to nikdy nebudeme. Google má vždy 3 typy prohlášení:
- Google říká něco, co je pravda. Typicky – titulek je důležitý obsahový prvek.
- Google říká něco, co není pravda, ale chce, aby se stalo – https na webech. Díky, tomu, že prohlásil, že https je malý signál, většina internetu přešla na https.
- Google říká něco, co není pravda, ale chtěl by aby byla. Typicky, že dokáže rozpoznat kvalitu odkazu a ty nekvalitní zanedbat. Nebo že odkazy jsou méně důležité.
Co je podle vás motivace Googlu neříkat pravdu?
Zdroje: SparkToro, iPullRank, The Verge (1, 2), Ars Technica, Gizmodo, Pavel Ungr
Adam studuje na gymnáziu a technologické žurnalistice se věnuje od svých 14 let. Pakliže pomineme jeho vášeň pro chytré telefony, tablety a příslušenství, rád se… více o autorovi
Komentáře (3)
Přidat komentář