Co se v naší sérii „Jak na GEO“ dozvíte

GEO a SEO. Podobné, a přece trochu jiné. V čem se liší optimalizace pro AI a klasické vyhledávače?
Jak funguje AI. Tokenizace, vektory a mechanismus pozornosti. Poznejte základní principy LLM modelů.
S přístupy různých AI modelů ke zpracovávání obsahu vás seznámí článek AI platformy: Jak ChatGPT, Claude, Gemini, Perplexity a Copilot citují váš obsah.
Jak tvořit obsah, který bude AI milovat? Naučte se udělat z vašeho obsahu preferovaný zdroj AI citací.
Technická optimalizace webu pro AI. Jak se postarat o technické přepoklady k tomu, aby váš obsah AI našla a zpracovala.
Sémantika a jazyk pro AI. Zjistěte, jak AI co nejvíce usnadnit porozumění vašim textům.
E-E-A-T pro AI: Jak budovat důvěryhodnost a autoritu. Jak proměnit vaše stránky ve zdroj věrohodných informací.
Vnější optimalizace pro AI: Budování digitální přítomnosti. Jak kultivovat důvěru ve váš web a značku na internetu.
Optimalizace pro AI agenty. Jak usnadnit umělé inteligenci objednávání a nakupování na vašem webu.
Adversarial GEO - riziko a obrana. Nekalá konkurence vás může poškodit i u AI. Jak se bránit?
Měření úspěšnosti GEO: Metriky, nástroje a vyhodnocení. Jak poznat, že optimalizace pro AI zafungovala?
GEO testování: Praktický framework s kontrolním seznamem a Příklady otázek pro ověřování přítomnosti v AI. Konkrétní doporučení pro AI testování.
Praktický plán pro první měsíc GEO optimalizace. Co udělat jako první, když chcete web u AI zviditelnit.

Má-li mít váš web v době AI šanci, musí jazykové modely váš obsah objevit, správně pochopit a následně využít ve svých odpovědích. Bez solidního technického základu se ale ani ten nejlépe napsaný text do odpovědí AI nedostane. Nebo se dostane, ale bude zkreslený a neúplný. Technická optimalizace je tak podmínkou, bez níž veškerá obsahová práce ztrácí efekt.

Tento návod se zaměřuje výhradně na technickou stránku věci. na to, jak váš web zpřístupnit AI crawlerům, jak strukturovat data a eliminovat technické bariéry, které brání správné interpretaci vašeho obsahu.

Pokud jste ještě nečetli náš návod Jak na GEO optimalizaci, doporučujeme začít tam – vysvětluje základní principy generativní optimalizace, strategie tvorby obsahu a způsoby, jak budovat autoritu v očích jazykových modelů. Tento článek na něj přímo navazuje a představuje konkrétní kroky, které mění strategii v konkrétní praxi.

Na začátek

Nastavení robots.txt pro AI roboty

Soubor robots.txt je jedním z nejstarších nástrojů webové správy. Jeho účel je jednoduchý – říká robotům, které stránky webu mají procházet a které mají přeskočit. Běžně se využívá k usměrňování crawlerů vyhledávačů (Googlebot, Seznam Bot, Bingbot a další), případně botů SEO nástrojů jako Ahrefs či Semrush.

Dnes ale k těmto klasickým botů přistupují ještě AI roboti. Jejich záměry se přitom liší.

Část z nich sbírá data pro trénink jazykových modelů. Jiní procházejí weby v reálném čase, aby mohli odpovídat na aktuální dotazy uživatelů. Další boti vytvářejí vlastní vyhledávací index, podobný indexu klasických vyhledávačů.

GPTBot od OpenAI, ClaudeBot od Anthropic, PerplexityBot nebo Google-Extended. To vše jsou samostatní agenti, kteří se řídí vlastními identifikátory a na které musíte v robots.txt reagovat zvlášť.

Pokud chcete mít nad situací kontrolu, nestačí spoléhat na výchozí nastavení. Musíte se rozhodnout, které AI roboty na svůj web pustíte a za jakých podmínek.

Webu, který chce být citován v odpovědích ChatGPT nebo Perplexity, se rozhodně nevyplatí blokovat jejich crawlery. Naopak, pokud nechcete, aby vaše texty sloužily jako tréninková data bez vašeho svolení, máte právo konkrétní boty s pomocí robots.txt omezit nebo zcela zablokovat.

Nejběžnější typy AI botů a jejich účel

Ne každý AI bot, který navštíví váš web, tam přichází ze stejného důvodu. Některé sbírají data pro trénink modelů, jiné reagují na konkrétní dotaz uživatele v reálném čase. Pokud chcete nastavit robots.txt správně, je třeba vědět, s kým máte tu čest.

Scrapery tréninkových dat

Jedná se o boty, kteří systematicky procházejí weby a shromažďují obsah sloužící k budování znalostní základny AI modelů. To, co sesbírají, se stane součástí trvalé paměti modelu a tato data už nelze zpětně odebrat ani „odnaučit“.

Patří sem například

GPTBot,
ClaudeBot,
Google-Extended,
Bytespider
nebo CCBot.

Jejich návštěvy jsou automatické, nepravidelné a bez předchozího upozornění.

AI asistenti

Fungují na zcela jiném principu. Neskenují váš web plošně, přijdou pouze tehdy, když uživatel v konverzaci s AI přímo požádá o načtení konkrétní stránky. Jde o proces zvaný RAG (Retrieval-Augmented Generation): model doplní své tréninkové znalosti o živý obsah z vaší URL.

Typickými zástupci takovýchto botů jsou například ChatGPT-User nebo DuckAssistBot.

Každá návštěva takového bota je jednorázová a spuštěná člověkem, ne automatem.

AI search crawlery

Jsou nejbližší příbuzní klasických botů vyhledávačů. Indexují váš obsah proto, aby se mohl objevit jako citovaný zdroj v odpovědích jednotlivých AI nástrojů.

Bez jejich indexace nemáte prakticky žádnou šanci na citaci.

Mezi tyto boty patří

OAI-SearchBot,
PerplexityBot,
Claude-SearchBot
nebo Applebot.

Část AI nástrojů jinak spoléhá na indexy Googlu či Bingu, jiné si budují vlastní, případně volí kombinace obojího.

AI agenti

Jsou zatím nejméně rozšířený, ale nejrychleji rostoucí typ. Uživatel jim zadá úkol, třeba porovnat produkty nebo zarezervovat letenku, a oni za něj procházejí weby krok za krokem jako skutečný člověk.

AI agenti neslouží k vyhledávání, ale ke konkrétní akci. ChatGPT Agent, Google Mariner nebo NovaAct generují návštěvy vašich stránek jako vedlejší produkt plnění zadaných úkolů, ne jako výsledek automatického crawlingu.

Podrobnější přehled různých AI crawlerů vám přinese tato stránka.

Jak sledovat AI crawlery na vašem webu

Většina webů sleduje návštěvnost z Google Analytics nebo Search Console. O tom, jak jejich obsah prochází AI crawlery, nemají zpravidla žádnou představu. Právě tato data ale mohou odhalit, proč určité stránky v AI odpovědích chybí a co s tím dělat.

Cloudflare

Pokud váš web běží na Cloudflare, máte k dispozici jeden z nejpřehlednějších nástrojů pro sledování AI botů. Cloudflare zobrazuje, které AI crawlery váš web navštěvují, jak často a zda jsou některé z nich blokovány, ať už záměrně, nebo omylem špatně nastaveným robots.txt. Vidíte konkrétní boty: GPTBot, ClaudeBot, PerplexityBot, Google-Extended a další. Pro každý z nich tak můžete individuálně nastavit, zda má přístup povolen nebo zakázán..

Konkrétní návod, jak Cloudflare ke sledování AI botů využít, je zde, případně zde.

Server logy jako GEO analytický nástroj

I bez Cloudflare lze vaše server logy analyzovat a mít tak v ruce cenný zdroj dat. Logy zaznamenávají skutečné HTTP požadavky, tedy každou návštěvu crawlera s přesným časovým razítkem, user agentem a navštívenou URL. Rovněž z logů zjistíte, kteří AI boti váš web navštěvují, jak často přicházejí a s jakou frekvencí se vracejí na konkrétní stránky.

Pokud například GPTBot navštěvuje vaše starší články, ale ignoruje nové, může to značit problém s interním prolinkováním nebo indexací. Pokud ClaudeBot nechodí vůbec, stojí za to zkontrolovat robots.txt a ověřit, zda není nechtěně blokován.

Co v logu hledat

Při analýze logů se soustřeďte:

Za prvé na to, kteří boti se vůbec objevují. Soustřeďte se na nejrelevantnější GPTBot, OAI-SearchBot, ClaudeBot, PerplexityBot, Google-Extended a Amazonbot.
Za druhé, které stránky crawleři navštěvují nejčastěji. Takové stránky jsou potenciální kandidáti na citaci a stojí za to zkontrolovat jejich strukturu a aktuálnost.
A za třetí, jaká je frekvence návštěv. Pokud se bot vrací pravidelně, dost možná stránku považuje za relevantní zdroj a sleduje její aktualizace.

Takto získáte přehledný obraz o tom, jak AI ekosystém s vaším webem skutečně pracuje a kde jsou mezery, které stojí za zaplnění.

Jaký přístup k AI botům zaujmout

Než začnete upravovat robots.txt, položte si otázku: chcete, aby AI boti váš obsah četli, a pokud ano, do jaké míry?

Odpověď není univerzální, závisí na vašem oboru, obchodních cílech a na tom, jak moc vám záleží na přímé návštěvnosti webu oproti viditelnosti v AI odpovědích.

Například e-shopy a firmy orientované na budování značky mají zpravidla důvod AI crawlery vítat s otevřenou náručí. Čím více botů jejich obsah zpracuje, tím větší šanci mají, že se jejich produkty, služby nebo jméno firmy objeví v odpovědích ChatGPT, Perplexity nebo jiných nástrojů, kde se dnes odehrává stále větší část nákupního rozhodování. Pro tyto weby je blokování AI botů spíše nevýhodou než ochranou.

Vydavatelé, zpravodajské weby a obsahové platformy to mají složitější. Jejich obsah má přímou ekonomickou hodnotu, která se odvíjí od počtu čtenářů na webu. Pokud AI nástroje jejich články shrnují do dvou vět a uživatel pak nemá důvod klikat na originál, může to reálně ohrozit návštěvnost i příjmy z reklamy.

Tady dává smysl přístup diferencovat. Například povolit indexaci pro účely citace, ale omezit scrapery, kteří data využívají výhradně k tréninku modelů.

Dávejte si také pozor, aby nebyli boti blokováni ze strany poskytovatele hostingu, což je také občasným problémem. Podrobněji viz tento článek, jak vám může hosting poškodit viditelnost u AI.

Konkrétní direktivy pro povolení přístupu AI botů v robots.txt

Na různé stránky můžete pouštět různé boty, ať už se jedná o boty vyhledávačů nebo AI.

Pro ChatGPT:

User-agent: GPTBot
Allow: /

User-agent: ChatGPT-User
Allow: /

User-agent: OAI-SearchBot
Allow: /

Pro Claude:

User-agent: ClaudeBot
Allow: /

Pro Perplexity:

User-agent: PerplexityBot
Allow: /

Pro Google Gemini:

User-agent: Google-Extended
Allow: /

Povolením těchto botů umožníte, že vás najdou a je tak větší šance, že váš obsah využijí. U obsahu, který nechcete dávat ke zveřejnění, je zase můžete zablokovat:

User-agent: GPTBot
Disallow: /

User-agent: ClaudeBot
Disallow: /

Abyste zjistili, jestli váš soubor robots.txt funguje správně, umístěte jej do kořenového adresáře vašeho webu, tedy ihned za doménu nejvyšší úrovně. S pomocí Google Search Console nebo obdobných nástrojů můžete následně provést simulaci toho, jak budou různí crawlingoví boti váš web procházet.

Na začátek

XML sitemapy a proč je potřebujete

XML mapy stránek jsou důležitou součástí optimalizace jak pro klasické vyhledávače, tak i pro AI, které ostatně z indexů vyhledávačů rovněž čerpají. Účelem sitemapy je postarat se o to, že se vyhledávače na vaší stránce vyznají a že objeví a zaindexují všechny důležité stránky.

Do sitemapy nemusí a ani by být neměly zahrnuty úplně všechny stránky, které váš web má. Sitemapa má obsahovat především relevantní informační nebo prodejní stránky, které jsou důležité pro vaše návštěvníky, řeší jejich problémy a odpovídají na jejich dotazy.

Kromě klasické sitemapy existují i sitemapy například pro videa či obrázky, takže pokud je váš web bohatý na tento typ obsahu, mohly by se vám rovněž hodit.

Sitemapa nemusí být jen jedna. Zejména velké weby jich mají několik, přičemž hlavní sitemapa odkazuje na nižší sitemapy pro jednotlivé části webu.

Zde najdete podrobnější instrukce, jak takovou sitemapu vytvořit.

Na začátek

Soubor llms.txt - navrhovaný standard pro komunikaci s AI

Soubor robots.txt řeší přístupová práva k vašim stránkám – kdo kam smí a nesmí.

Navrhovaný standard llms.txt má být alternativou robots.txt navrženou speciálně pro AI modely. Namísto kontroly přístupu jim má ale sloužit spíše jako navigátor po vašem obsahu.

Tento soubor umístěný v kořenovém adresáři webu poskytuje jazykovým modelům kontext, který by si jinak musely domýšlet samy.

Říká

které části stránek jsou klíčové,
jak chápat hierarchii obsahu,
na co brát ohled při citování,
nebo které informace upřednostnit, když sestavují odpověď.

Pomáhá také s pochopením vaší případné API dokumentace.

Jde o relativně mladý koncept, který je zatím spíše ve fázi návrhu. Vzešel ale z praktické potřeby, kdy si tvůrci obsahu začali uvědomovat, že AI modely sice jejich web navštíví, ale ne vždy ho správně uchopí.

llms.txt je pokus tuto mezeru překlenout přímou komunikací. Místo aby model obsah interpretoval podle vlastního uvážení, dostane od vás instrukce, jak to udělat správně.

Podpora konceptu zatím není plošná. Jeho vliv na chování modelů není zcela měřitelný a žádný z velkých AI hráčů zatím do svých crawlingových protokolů llms.txt oficiálně nezapojil. Ačkoliv třeba společnost Anthropic (Claude) vlastní llms.txt zveřejnilo a Google tento standard začlenil do svého protokolu Agents to Agents (A2A). Další AI firmy se vesměs vyjadřují ke konceptu llms.txt pozitivně.

Standard je nicméně stále ve vývoji a probíhají diskuse o jeho finální podobě.

Přesto má smysl ho zavést už teď. Pokud llms.txt nefunguje, nepřijdete o nic. Pokud funguje, nebo až začne fungovat naplno, budete mít před konkurencí náskok, který byste jinak těžko doháněli zpětně. Poměr rizika a potenciálního přínosu tady hraje jednoznačně ve váš prospěch.

Struktura llms.txt souboru

Podle navrhovaného standardu by měl být soubor llms.txt strukturován a zapisován v jazyce Markdown.

Markdown je jednoduchý značkovací formát založený na čistém textu, který umožňuje přehledně strukturovat obsah bez složité syntaxe. Jde o stejný formát, jaký se běžně používá například v README souborech na GitHubu, a zároveň je velmi dobře čitelný a interpretovatelný pro AI systémy.

Nejčastějšími Markdown prvky v llms.txt souborech jsou:

pro hlavní nadpis (H1), ## pro podnadpisy (H2), ### pro další úrovně struktury atd.*
> pro zvýrazněné bloky textu, například důležitá vysvětlení nebo kontext
– nebo pro nečíslované seznamy
[text](url) pro odkazy na relevantní stránky či zdroje
: pro doplnění krátkého popisu k odkazu, který vysvětluje jeho účel
„` pro bloky kódu při uvádění technických ukázek

Oficiální specifikace llms.txt uvádí pouze velmi jednoduchý ukázkový zápis. Pokud je však váš web rozsáhlejší nebo obsahově složitější, je možné strukturu dále rozšířit — třeba pomocí nadpisů H3 a H4 pro podsekce, přidáním tabulek pro přehlednější organizaci informací nebo bloků kódu pro demonstraci práce s API.

Markdown je pro AI crawlery plně srozumitelný a při dodržení platné syntaxe by neměl být problém. Naopak, detailnější struktura může AI systémům poskytnout více kontextu a usnadnit správnou interpretaci obsahu.

Jednoduchý příklad llms.txt souboru podle základní specifikace může vypadat třeba takto:

# Název společnosti

> Stručný popis toho, čím se společnost zabývá

## Produkty

– [Produkt 1](https://example.com/product-1): Krátký popis produktu

– [Produkt 2](https://example.com/product-2): Stručné vysvětlení, k čemu slouží

## Dokumentace

– [Začínáme](https://example.com/docs/getting-started): Úvod do platformy

– [API dokumentace](https://example.com/api): Kompletní technický přehled API

Tento základ můžete dále rozšiřovat podle potřeb vašeho webu a množství informací, které chcete AI systémům zpřístupnit.

Jak llms.txt soubor implementovat

Jde o poměrně technický úkon, proto je ideální zapojit vývojáře a postupovat systematicky podle následujících tří kroků.

Určete, jaký obsah chcete AI systémům zpřístupnit

Ještě před samotným vytvořením souboru si ujasněte, které části webu mají být pro AI crawlery prioritní.
Pokud plánujete llms.txt pro celý web, zaměřte se minimálně na následující sekce:

stránky s produkty nebo službami
aktuální a relevantní články na blogu
ceník
stránku „O nás“
kontaktní stránku

Právě tyto typy obsahu dávají AI nejrychlejší a nejpřesnější přehled o tom, čím se vaše firma zabývá, jakou hodnotu nabízí a komu pomáhá.

Vytvořte soubor llms.txt

Otevřete libovolný textový editor, například Poznámkový blok, Visual Studio Code nebo jiný editor, a založte nový soubor s názvem llms.txt.

Soubor musí být zapsán ve zmíněném jazyce Markdown, což je další důvod, proč je vhodné mít u tvorby vývojáře. Markdown umožňuje jasnou strukturu a je dobře čitelný pro AI systémy.

Základní struktura může vypadat například takto:

# Název webu

> Stručné vysvětlení, čemu se web věnuje

Důležité informace:

– Hlavní odlišnost vaší nabídky

– Podstatné omezení nebo specifikum vašeho podnikání

– Další klíčový bod, který definuje vaši hodnotu

## Produkty

– [Produkt 1](https://example.com/product-1): Krátký popis hlavní funkce a přínosu

– [Produkt 2](https://example.com/product-2): Stručné vysvětlení, k čemu slouží

– [Produkt 3](https://example.com/product-3): Hlavní výhoda pro zákazníka

## Blog

– [Název článku 1](https://example.com/blog-post-1): O čem článek je a proč je užitečný

– [Název článku 2](https://example.com/blog-post-2): Stručný popis tématu a přínosu

– [Název článku 3](https://example.com/blog-post-3): Jaký problém článek řeší

## Společnost

– [O nás](https://example.com/about): Informace o firmě, misi a týmu

– [Kontakt](https://example.com/contact): Jak se s námi spojit

– [Ceník](https://example.com/pricing): Přehled plánů, funkcí a cen

Strukturu můžete samozřejmě přizpůsobit rozsahu a typu webu, důležité ale je, aby byla srozumitelná a konzistentní.

Nahrajte soubor na správné místo

Hotový soubor je potřeba umístit tak, aby jej AI crawlery mohly najít.

Umístění závisí na tom, jaký rozsah má llms.txt pokrývat:

Pokud se vztahuje na celý web, nahrajte jej do kořenového adresáře domény, aby byl dostupný na adrese
https://vasedomena.cz/llms.txt
Pokud se týká pouze dokumentace nebo konkrétní sekce, umístěte jej do odpovídajícího podadresáře, například
https://docs.vasedomena.cz/llms.txt

Tímto krokem dáváte AI systémům jasný a strukturovaný přehled o tom, jaký obsah má pro ně největší význam a kde jej na vašem webu najdou.

Na začátek

Soubor llms-full.txt nabídne kompletní obsah na jednom místě

Vedle souboru llms.txt se navrhuje ještě jeho doplněk llms-full.txt. Ten by měl nabízet shrnutí vašeho webu jako celku, včetně kompletního textu, ukázkového kódu, API specifikace atd.

Tam, kde llms.txt funguje jako kurátorská mapa webu s vybranými odkazy a stručnými popisy, je llms-full.txt v podstatě zhuštěným obsahem webu najednou. Oba soubory jsou psány ve stejném jazyku Markdown.

Návrh llms-full.txt vznikl ve spolupráci společností Mintlify a Anthropic a má nabízet způsob, jak dostat celou dokumentaci k AI modelům naráz bez nutnosti složitě se probírat HTML kódem.

Oba soubory obsluhují jiné typy AI.

Soubor llms.txt nejlépe využijí AI boti pracující v reálném čase, kteří jej rychle zpracují, pochopí strukturu vašeho webu a rozhodnou se, kam na webu dál a kde hledat nejdůležitější obsah například k citování.
Soubor llms-full.txt je naopak určen pro RAG (Retrieval-Augmented Generation) systémy a kódovací asistenty (Cursor, GitHub Copilot), kteří potřebují kompletní kontext bez dalšího proklikávání.

Co se týče velikosti, llms.txt by ideálně měl zůstat pod 10 000 tokeny. U llms-full.txt jsou limity volnější a soubor do přibližně 100 KB zpracují bez problémů všechny současné modely. Nezapomeňte přitom na fakt, že modely přikládají větší váhu informacím na začátku a konci textu, takže nejdůležitější obsah patří nahoru.

Souborů llms-full.txt může být dokonce více, například větší weby a e-shopy klidně uplatní až desítky takových llms-full.txt, každý věnovaný jiné kategorii produktů. Soubor llms.txt pak zároveň slouží jako rozcestník k různým llms-full.txt.

AI agent si pak stáhne pouze to, co pro svůj dotaz skutečně potřebuje.

Na začátek

Markdown verze stránek servíruje čistý obsah bez balastu

Jazykové modely se při zpracování webových stránek musí prokousat vrstvami kódu, které pro ně nemají žádnou informační hodnotu. Různá navigační menu, JavaScripty, cookie bannery a desítky vizuálních HTML prvků jsou pro pochopení vašeho obsahu umělou inteligencí zcela nepotřebná.

Verze stránek ve zmíněném formátu Markdown tento problém řeší.

Princip vychází přímo ze specifikace llms.txt a je jednoduchý. Každá stránka, která obsahuje obsah užitečný pro jazykové modely, by měla mít svou čistou Markdown verzi dostupnou na stejné URL s příponou .md.

Článek na vasedomena.cz/blog/clanek tak dostane svůj protějšek na vasedomena.cz/blog/clanek.md. Jde o prostý text se zachovanou strukturou nadpisů, bez veškerého vizuálního obalu. Tento přístup už dnes přebírají Cloudflare, Anthropic, Stripe nebo Vercel.

Aby AI crawler věděl, že čistší verze existuje, stačí do HTML hlavičky každé stránky přidat alternativní odkaz:

Tento tag funguje podobně jako hreflang pro jazykové varianty a říká crawlerům, že existuje alternativní reprezentace téhož obsahu, tentokrát optimalizovaná přímo pro jejich potřeby.

Někteří provozovatelé pak rovnou implementují automatické servírování Markdownu pro konkrétní AI boty.

Například s pomocí platformy Fern lze nastavit detekci příchozího LLM bota a nabídnout mu Markdown verzi stránky, čímž se podle dostupných dat snižuje spotřeba tokenů o zhruba 90 %.

Vlastní řešení lze postavit server-side detekcí user-agenta – při příchodu GPTBota, ClaudeBota nebo jiného AI crawleru server odpoví Markdownem namísto standardní HTML stránky. Pro větší weby s vysokou frekvencí AI návštěv to může mít i měřitelný dopad na serverovou zátěž.

Vytvořit Markdown verzi stránek není těžké a je spousta bezplatných nástrojů na konverzi HTML na Markdown, třeba https://htmlmarkdown.com/.

Markdown není jedinou možností, jak AI crawlerům servírovat obsah bez zbytečného šumu. Alternativou je redukovaný HTML – standardní stránka očištěná od navigace, reklam, cookie bannerů a dalších elementů bez přidané hodnoty pro AI.

Pro tabulková data se zase vyplatí využívat zápis JSON, nebo ještě lépe formát CSV, který dokáže ušetřit podstatné množství tokenů.

Jsou 2 verze téže stránky cloaking?

Při všem, co bylo řečeno, možná někomu vyvstává otázka – není podávání jiného obsahu různým návštěvníkům cloaking – technika, kterou Google explicitně zakazuje a která může vést k penalizaci? Odpověď je ne – za předpokladu, že obsah zůstává shodný. Cloaking nastává tehdy, když crawlerům podstrčíte odlišné informace, než které vidí uživatel, s cílem manipulovat hodnocením. Pokud ale pouze odstraňujete prezentační vrstvu a samotný text, nadpisy ani strukturální informace se nemění, jde o legitimní optimalizaci.

Markdown a ekonomie “Context Window”

Každý AI model pracuje s omezeným kontextem – množstvím textu, které dokáže najednou zpracovat a držet „v paměti“ při generování odpovědi.

Tento takzvaný context window není nekonečný a při sestavování odpovědi na dotaz ho model neplní jen vaším obsahem. Vejít se musí samotný dotaz uživatele, instrukce systému, obsah z více zdrojů současně a průběžně generovaná odpověď. Váš článek tedy od začátku soutěží o prostor s dalšími stránkami, které model považuje za relevantní.

Na tokenech záleží

Token je základní jednotka, se kterou AI modely pracují. Může jít o celé slovo, jeho část, nebo třeba jen jednotlivý znak. Každý zbytečný token, který model zpracuje bez informační hodnoty, je token, který mohl být využit pro hodnotnější obsah z vaší stránky nebo jiného zdroje.

Z hlediska psaní pro AI je důsledek ten, že nejde jen o to, co napíšete, nýbrž i o to, kolik prostoru vaše sdělení zabere. Rozvláčný úvod, opakující se závěry nebo věty plné výplňových slov jsou tokeny spotřebované bez návratu.

HTML versus Markdown

Již bylo řečeno, že standardní webová stránka v HTML představuje pro AI modely hromadu zcela zbytečných tokenů.

Markdown verze téže stránky může oproti HTML ušetřit až 90 % tokenů. Ze stejného context window tak AI vytěží výrazně více hodnotného obsahu.

Jak se AI vyhledávání stává složitějším a modely zpracovávají stále více zdrojů najednou, právě efektivní alokace tokenů a informační hustota bude čím dál více rozhodovat. O tom, který obsah se do AI odpovědí dostane a který se kontextovým oknem zkrátka neprotlačí.

Na začátek

Strukturovaná data aneb Jak dát obsahu význam

Přirozený jazyk je pro stroje nejednoznačný. Slovo „Apple" může označovat firmu, ovoce nebo hudební vydavatelství. Bez přidaného kontextu AI jen odhaduje, o čem je řeč.

Strukturovaná data tento problém řeší tím, že obsahu přiřazují explicitní sémantický význam. Místo aby model musel kontext dovozovat z textu, dostane přesný návod: toto je článek, napsal ho tento autor, vyšel tehdy a tehdy, toto jsou otázky a odpovědi v FAQ sekci.

Standardem, na který se dnes soustředí jak SEO, tak GEO optimalizace, je kombinace dvou věcí.

Schema.org je společný slovník vyvinutý ve spolupráci Googlu, Microsoftu, Yahoo a Yandexu. Definuje, co všechno lze popsat - například Article, Product, Person, Organization, FAQPage a stovky dalších typů - a jaké vlastnosti každý typ má. Je to jazyk, jeho gramatika i slovní zásoba zároveň.

JSON-LD (JavaScript Object Notation for Linked Data) je pak způsob, jak tímto jazykem psát. Jde o formát zápisu, který se vkládá přímo do sekce <head> stránky jako samostatný blok kódu, oddělený od HTML struktury.

To je jeho hlavní praktická výhoda oproti starším alternativám jako Microdata nebo RDFa: JSON-LD lze upravovat a aktualizovat bez zásahu do vizuální vrstvy webu, což výrazně zjednodušuje správu i debugging.

Strukturovaná data nejsou sama o sobě izolovaným faktorem. Google i AI platformy je využívají jako jeden ze signálů důvěryhodnosti v rámci E-E-A-T hodnocení.

Správně propojená data, například schema.org/Person s atributem sameAs odkazujícím na LinkedIn nebo Google Scholar profil autora dohromady tvoří jeden z nejsilnějších technicky měřitelných signálů autority, které AI systémy dokáží zpracovat.

Strukturovaná data tedy nejsou jen navigační pomůcka pro roboty, ale aktivní součást budování důvěryhodnosti vašeho obsahu v očích jazykových modelů.

Například Article schema je typ strukturovaných dat ze slovníku Schema.org, který explicitně říká, že daná stránka obsahuje článek. Umožňuje předat klíčové informace jako název, autora, datum publikace nebo perex ve strojově čitelné podobě, bez nutnosti je odvozovat z textu. Konkrétní zápis strukturovaných dat a využití Article schematu může vypadat třeba takto:

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "Article",
  "headline": "Jak začít s pěstováním zeleniny na balkoně",
  "author": {
    "@type": "Person",
    "name": "Petra Zahradníková",
    "description": "Zahradní architektka se zaměřením na městské pěstování",
    "url": "https://urbanzahrada.cz/o-mne/",
    "jobTitle": "Zahradní konzultantka",
    "sameAs": [
      "https://instagram.com/petrazahradnikova",
      "https://facebook.com/urbanzahrada"
    ]
  },
  "datePublished": "2025-03-20",
  "dateModified": "2025-09-28",
  "publisher": {
    "@type": "Organization",
    "name": "Urban Zahrada s.r.o.",
    "logo": {
      "@type": "ImageObject",
      "url": "https://urbanzahrada.cz/images/logo.png"
    }
  },
  "description": "Praktický průvodce pro začátečníky, jak si vypěstovat vlastní zeleninu na balkoně - od výběru nádob po sklizeň.",
  "mainEntityOfPage": {
    "@type": "WebPage",
    "@id": "https://urbanzahrada.cz/clanky/balkonova-zelenina"
  }
}
</script>

Tento záznam obsahuje řadu informací, které pomohou AI modelům správně pochopit váš obsah. Nejprve údaje o autorovi včetně jeho odborného zaměření a odkazů na profesní profily. Dále obsahuje časové značky s přesným datem vzniku a poslední revize obsahu. Obsahový popis poskytuje stručnou anotaci, která umožňuje pochopit tematické zaměření článku. Nakonec jsou zde uvedeny i údaje o vydavateli obsahu.

Mezi další schema zápisy, bez kterých se při optimalizaci neobejdete, patří především FAQ schema. To má pro AI modely velkou hodnotu, jeho struktura totiž kopíruje způsob, jakým lidé kladou dotazy jazykovým modelům. Když uživatelé komunikují s AI, formulují své požadavky převážně jako otázky. FAQ formát přímo koresponduje s tímto komunikačním stylem a výrazně zvyšuje šanci, že AI vytáhne právě váš obsah jako odpověď na podobně položený dotaz.

Lokální podniky rozhodně musí implementovat LocalBusiness schema, které poskytuje informace o vaší adrese, kontaktech, otevírací době, atd.

A pokud provozujete třeba e-shop nebo prodáváte konkrétní produkty, pak budete zase potřebovat Product schema, které vám poslouží ke kompletní specifikaci produktu – od cenových informací a skladové dostupnosti až po zákaznická hodnocení a recenze. Díky těmto strukturovaným údajům budou AI modely schopny poskytovat uživatelům přesné a aktuální informace o vašem zboží, když se na něj kdokoliv dotáže.

Hlavní databázi tisíců různých schema zápisů najdete na adrese Schema.org.

Na začátek

Sémantické HTML

Každá webová stránka se skládá z bloků obsahu – hlavní text, navigace, postranní panel, zápatí, obrázky s popisky. Otázka je, zda váš kód toto rozčlenění jen vizuálně simuluje, nebo ho přímo vyjadřuje.

Sémantické HTML dělá to druhé. Je to způsob psaní kódu sloužící k označování obsahu a pomáhající ozřejmit jeho smysl a roli na stránce.

Specifické tagy sémantického HTML jako <main>, <aside>, <footer>, <article>, <section> či <figure> jednoznačně definují účel a charakter daného obsahu, na rozdíl od generických elementů jako je třeba <div>.

Díky sémantickému HTML dokáží AI systémy lépe rozpoznat hierarchii informací na stránce - co je hlavní obsah, co je navigace, co je doplňková sekce. Schopnost rozlišovat význam těchto různých částí webu výrazně zlepšuje kvalitu interpretace vašeho obsahu i šanci na jeho využití v AI odpovědích.

Vedlejší výhodou je i přístupnost vašeho webu pro zrakově postižené. Weby postavené na sémantickém HTML jsou přirozeně lépe čitelné pro čtečky obrazovky, což je faktor, který Google dlouhodobě zohledňuje při hodnocení kvality stránky.

Konkrétní příklad sémantického HTML může vypadat například takto:

<article>
<h1>Pěstování rajčat na balkoně pro začátečníky</h1>
<address>Marie Zahradníková</address>
<section>
<h2>Výběr odrůdy a nádoby</h2>
<p>Pro balkonové pěstování jsou ideální cherry rajčata nebo kompaktní keříčkové odrůdy...</p>
<p>Minimální objem květináče by měl být 10 litrů, lépe však 15-20 litrů...</p>
</section>
<section>
<h2>Základní péče</h2>
<p>Rajčata potřebují pravidelnou zalévku a dostatek slunečního světla...</p>
<ul>
<li>Zalévejte každý den ráno nebo večer</li>
<li>Hnojte jednou týdně speciálním rajčatovým hnojivem</li>
<li>Odstraňujte boční výhonky u tyčkových odrůd</li>
</ul>
</section>
<footer>
<p>Publikováno: 15\. května 2025</p>
</footer>
</article>

V našem příkladu tag <article> signalizuje, že se jedná o kompaktní obsah, který není závislý na zbytku stránky nebo webu a lze jej případně přemisťovat dle libosti. Obvykle jde o nějaký článek, post nebo zprávu.

Tag <h1> označuje hlavní nadpis článku, <h2> jeho další podnadpisy.
Tag <section> vymezuje blok textu který je nějak tematicky spřízněn.
Elementy <p> a <ul>/<li> zajišťují správnou strukturu textu a výčtů.
Tag <address> obsahuje informace o autorovi.
<footer> je patička článku, co může obsahovat další podrobnosti o autorovi, datum publikace, kontaktní info, copyright apod.

Pro přehlednost si zde uveďme ještě přehled sémantických elementů, díky nimž dokáže AI efektivněji uchopit váš text.

Strukturální elementy

<header> - Označuje záhlaví stránky nebo sekce, slouží k identifikaci portálu a primární navigaci

<nav> - Definuje navigační bloky, pomáhá rozlišit menu od obsahového materiálu

<main> - Označuje primární obsah stránky, signalizuje, kde hledat hlavní informace (měl by být na stránce pouze jeden)

<article> - Vymezuje samostatný obsahový celek (blogový příspěvek, článek, produkt), který by mohl existovat nezávisle

<section> - Definuje tematickou sekci dokumentu, pomáhá AI strukturovat obsah do logických celků

<aside> - Označuje vedlejší obsah související s hlavním obsahem (boční panel, související odkazy). AI díky tomu ví, že jde o sekundární informace

<footer> - Vymezuje zápatí stránky nebo sekce, typicky obsahuje metadata, kontakty, autorské informace

Významové elementy

<strong> - Označuje důležitý text (ne jen vizuálně tučný), AI jej interpretuje jako klíčovou informaci

<em> - Zdůrazňuje text s významovým přízvukem (ne jen vizuální kurzívou)

<mark> - Zvýrazňuje text relevantní pro aktuální kontext nebo vyhledávací dotaz

<time> - Sémanticky označuje datum a čas, AI díky tomu dokáže přesně interpretovat časové údaje

<address> - Vymezuje kontaktní informace a adresní údaje

Datové struktury

<figure> a <figcaption> - Spojují obrázek s jeho popiskem, AI tak snáze pochopí vztah mezi vizuálem a textem

<blockquote> - Identifikuje citace z externích zdrojů, AI rozlišuje přímé citace od vlastního obsahu

<code> - Označuje fragmenty programového kódu, AI je pak neinterpretuje jako běžný text

<dl>, <dt>, <dd> - Využívají se pro termíny a jejich definice, ideální pro glosáře a vysvětlení pojmů

Kompletní přehled všech HTML elementů jinak najdete zde.

Na začátek

Architektura webu a vnitřní odkazování mezi stránkami

Způsob, jakým váš web organizuje a propojuje obsah, je jednak otázka uživatelské přívětivosti, jednak také signál, podle kterého AI modely vyhodnocují, jak moc danému tématu rozumíte.

Web, kde na sebe stránky tematicky navazují a vzájemně na sebe odkazují, vypadá pro jazykový model jinak než hromada izolovaných článků bez zjevné struktury.

Osvědčeným přístupem je architektura obsahu postavená na hlavních pilířích a s nimi souvisejících podstránkách. Anglicky se tento model nazývá “pillar and cluster”.

Pilířová stránka pokrývá téma v širokém záběru. Jde o dlouhý, autoritativní přehled, sloužící jako vstupní brána k dané tematice. Třeba náš článek Co je SEO je klasickým příkladem takového pilíře, který nastavuje kontext, definuje pojmy a odkazuje dál.

Satelitní stránky pak jednotlivá dílčí témata rozvíjejí do hloubky. Popisují konkrétní techniky, procesy nebo nástroje, které by pilířový článek jen stručně shrnul.

Tato hierarchie AI modelům pomáhá dvěma způsoby. Jednak jim ukazuje, jak spolu témata souvisí a jak hluboce se do nich váš web noří. Kromě toho je také známkou odbornosti. Web, který má ke každému klíčovému tématu jak přehledový článek, tak sérii specializovaných podstránek, působí jako relevantní zdroj a ne náhodná sbírka textů.

Zvláštní kategorií jsou FAQ sekce. Strukturované odpovědi na konkrétní otázky jsou pro AI modely mimořádně snadno zpracovatelné. Přímo totiž odpovídají formátu, v jakém modely generují odpovědi. Dobře napsaná FAQ stránka má proto nadprůměrnou šanci skončit jako citovaný zdroj.

Podobně fungují případové studie s reálnými daty a měřitelnými výsledky, jako jsou například naše SEO případové studie.

Konkrétní čísla a zdokumentované výsledky jsou typy obsahu, které AI modely při odpovídání preferují, neboť jsou ověřitelné, specifické a nesou informaci, kterou obecné texty podat nedokáží.

Principy efektivního propojení

Aby celá vaše obsahová struktura fungovala a vyhledávače i AI modely se na vašem webu mohli dobře orientovat, bude potřeba váš pilířový i další obsah vzájemně propojit interními odkazy. Ty fungují jako explicitní instrukce, které modelům říkají, jaký vztah mezi dvěma stránkami existuje a co na té odkazované najdou.

Pro interní odkazy doporučujeme maximálně využívat deskriptivní anchor texty s jasným kontextem a nikoliv obecné fráze typu „klikněte sem“.

Deskriptivní anchor text, který přesně vystihuje obsah cílové stránky, naopak funguje jako mini-popis. AI model z něj okamžitě pochopí, co ho na druhé straně odkazu čeká a jak tato informace souvisí s aktuálním textem.

Pokud například v článku o technickém SEO odkazujete na průvodce strukturovanými daty, bude anchor text „jak implementovat strukturovaná data Schema.org“ je výrazně nosnější než jakákoli generická fráze.

Důkladná síť interních odkazů plní ještě jeden důležitý účel: přenáší autoritu. Stránky, na které z vašeho webu vede více odkazů, AI modely i vyhledávače přirozeně vnímají jako důležitější.

Pilířový obsah by proto měl být propojen z co největšího počtu relevantních podstránek. A naopak, každá satelitní stránka by měla odkazovat zpět na svůj pilíř.

Princip tematického seskupení v praxi

Představme si třeba web zaměřený na fotografování. Hlavním pilířem by mohla být centrální stránka věnovaná úvodu do fotografování, která poskytuje komplexní přehled celé oblasti. Z této pilířové stránky pak vycházejí dílčí tematické celky.

Jedním z těchto celků bude třeba přehled základních fotografických technik. Tento přehledový článek pak odkazuje na samostatné detailní stránky věnující se například expozici, ostření nebo kompozici. Každé téma má tak vlastní prostor pro důkladné vysvětlení.

Dalším tematickým blokem budou různé typy fotografie. Opět jde o přehledovou stránku, která čtenáře naviguje k samostatným článkům o portrétu, krajinné nebo makro fotografii.

Web by dále mohl obsahovat sekci s nejčastějšími dotazy a praktického průvodce, kde najdeme konkrétní rady. Třeba jak fotografovat svatby nebo jak zvládnout noční fotografii.

Praktická ukázka interního propojení

Stránky v rámci tohoto tematického celku by měly být vzájemně provázané relevantními odkazy. Článek o expozici tak může obsahovat třeba takovéto odkazy:

<p>Správné nastavení expozice úzce souvisí s <a
href="/fotografovani/zakladni-techniky/ostrost-a-hloubka/">
volbou clony a hloubkou ostrosti</a>, které společně
ovlivňují finální vzhled fotografie.</p>
<p>Chcete vidět tyto principy v praxi? Podívejte se na náš
<a href="/fotografovani/prakticky-pruvodce/nocni-fotografie/">
praktický průvodce noční fotografií</a>, kde najdete konkrétní
nastavení a postupy.</p>

Takováto provázanost následně vytváří ucelenou tematickou síť, která umožňuje AI lépe určit vzájemné vztahy mezi jednotlivými koncepty. Snadněji tak rozpoznají váš web jako kvalitní a komplexní zdroj informací v oboru.

Na začátek

Technická optimalizace podle typu webu

Tomu, zda provozujete e-shop, informační blog nebo třeba prodáváte služby, byste měli přizpůsobit i různé postupy technické optimalizace. Pojďme se podívat na pár konkrétních doporučení pro každý typ webu.

Zpravodajské weby

Ve zpravodajství hraje rychlost prim a zpravodajské weby tak musí při optimalizaci klást důraz na rychlou indexaci. Důležitá je i otázka autorství a důvěryhodnosti osoby, která za textem stojí. To znamená využívat strukturovaná data typu Person schema a sestavit podrobnou autorskou biografii.
Pro větší zviditelnění zpravodajských webů v AI odpovědích je nezbytné i využití protokolu IndexNow, který umožňuje okamžitě informovat vyhledávače o nově publikovaném obsahu.
Stejně důležitá je implementace sémantického HTML5 značkování, které jasně strukturuje různé části článku - nadpisy, perex a samotné tělo textu. Nezapomeňte také na precizní časové značky pomocí atributu <time>, které explicitně definují, kdy byl článek publikován a kdy naposledy aktualizován.
Zpravodajství musí být také transparentní a důvěryhodné, nezapomeňte proto přidávat odkazy a citace zdrojů, ze kterých čerpáte.
Zvláštní pozornost věnujte také implementaci NewsArticle schema, což je specifický podtyp Article schema navržený přímo pro zpravodajský obsah. Umožňuje předat dodatečné informace jako dateline, tiskovou agenturu nebo žánr článku, které obecné Article schema nenabízí.

E-shopy

E-shopy mají oproti jiným typům webů výhodu, že jejich obsah je přirozeně strukturovaný. Produkty, kategorie, ceny, hodnocení – to vše lze popsat pomocí strukturovaných dat způsobem, který AI modely zpracovávají mimořádně efektivně.

Základem je Product schema s kompletně vyplněnými atributy včetně ceny, dostupnosti, hodnocení, nebo EAN kódu. AI modely tyto informace aktivně využívají při odpovídání na nákupní dotazy, a čím více relevantních dat poskytnete, tím přesnější odpověď mohou sestavit.
Stejně důležitá je logická kategorizace produktů. AI modelům umožní pochopit celkovou strukturu vaší nabídky a vztahy mezi jednotlivými produktovými skupinami.
Produktové stránky by měly obsahovat podrobné textové popisy, které nejdou jen po technických parametrech, ale vysvětlují konkrétní benefity a reálné způsoby využití. Zákazníci se AI nástrojů stále častěji ptají stylem „jaký vysavač je vhodný pro domácnost se psem“, a model potřebuje mít v popisu produktu dost kontextu, aby ho dokázal relevantně doporučit.
Nesmí chybět ani komplexní sekce s nejčastějšími dotazy, která pokrývá nejen samotné produkty, ale i praktické věci jako způsob dopravy, platební možnosti nebo proces reklamace.
A v neposlední řadě je vhodné nasadit BreadcrumbList schema, které AI pomáhá orientovat se v navigační struktuře vašeho e-shopu a chápat, jak jsou jednotlivé produkty kategorizovány.
Pro větší e-shopy stojí za zvážení také segmentovaný llms-full.txt rozdělený po produktových kategoriích. AI agenti tak mohou načíst pouze relevantní část katalogu a nemusí se pouštět do zpracování celého sortimentu najednou.

Odborné a akademické weby

Pro odborné a akademické weby je důležité především ScholarlyArticle schema, které specificky označuje vědecké publikace a akademické články. Tento typ schématu umožňuje detailně popsat metodologii, závěry a akademický kontext práce.
Důležité je i Person schema s důrazem na akademické tituly, publikační historii, oblast výzkumu a příslušnost k univerzitám nebo výzkumným institucím. AI modely pak dokážou lépe posoudit autoritu a odbornost autora.
EducationalOrganization nebo obecnější Organization schema slouží pro označení univerzit, výzkumných ústavů a fakult a pomáhají identifikovat institucionální zázemí obsahu.
Pro vzdělávací obsah se hodí Course schema, detailně popisující studijní programy, kurzy a jejich parametry.
Doplňkově může být užitečné Dataset schema pro výzkumná data a ResearchProject schema pro popis probíhajících projektů.
Citation schema nebo přinejmenším správně strukturované citace v textu jsou zase nezbytné pro akademickou kredibilitu.
Neopomínejte ani FAQPage schema pro zodpovězení častých otázek k výzkumu, studijním programům nebo akademickým postupům.
Zvláštní pozornost je třeba věnovat také implementaci standardizovaných akademických identifikátorů – především ORCID pro autory a DOI pro publikované články. Tyto identifikátory umožňují jednoznačnou identifikaci výzkumníků a jejich prací v globálním měřítku.

Modelový příklad využití některých schémat pro odborné weby může vypadat například takto:

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "ScholarlyArticle",
  "headline": "Aplikace strojového učení v diagnostice diabetu",
  "datePublished": "2025-08-20",
  "author": {
    "@type": "Person",
    "name": "MUDr. Petr Novák, Ph.D.",
    "honorificPrefix": "MUDr.",
    "honorificSuffix": "Ph.D.",
    "jobTitle": "Lékař a výzkumník",
    "affiliation": {
      "@type": "EducationalOrganization",
      "name": "Lékařská fakulta Masarykovy univerzity",
      "url": "https://med.muni.cz"
    }
  },
  "publisher": {
    "@type": "EducationalOrganization",
    "name": "Masarykova univerzita"
  },
  "description": "Studie zkoumající přesnost algoritmů strojového učení při včasné detekci diabetu 2. typu na základě rutinních krevních testů.",
  "abstract": "Výzkum porovnává pět různých algoritmů strojového učení a jejich schopnost predikovat diabetes 2. typu. Nejlepší model dosáhl přesnosti 94,3%.",
  "keywords": "diabetes, strojové učení, diagnostika, prediktivní medicína",
  "articleSection": "Klinický výzkum",
  "wordCount": "5200",
  "license": "https://creativecommons.org/licenses/by/4.0/"
}
</script>

Odborné weby musí splňovat nároky akademické integrity a důvěryhodnosti. To znamená transparentní prezentace výzkumné metodologie, použitých dat a všech zdrojů, na kterých jsou založena uvedená tvrzení a závěry. Každý fakt by měl být ověřitelné prostřednictvím strukturovaných citací s přímými odkazy na primární literaturu a výzkumné práce.

Na začátek

Rychlost stránky a její vliv na AI citace

Vztah mezi rychlostí načítání a šancí na citaci v AI odpovědích je překvapivě přímočarý. Stránky s First Contentful Paint (tedy dobou, kdy se zobrazí první prvek stránky) pod 0,4 sekundy získávají průměrně 6,7 citací, zatímco stránky s FCP nad 1,13 sekundy jen 2,1 — tedy třikrát méně.

Rychlost tak není jen technická metrika důležitá pro SEO a uživatelský zážitek, ale zřejmě i signál kvality, který AI modely při výběru zdrojů zohledňují.

Pokud tedy váš web špatně obstojí v Core Web Vitals, povede se mu hůře nejen u Googlu. Pomalé stránky jsou hůře průchozí pro roboty, hůře indexovatelné a evidentně také méně citované v AI odpovědích. Rychlost webu a viditelnost v AI odpovědích jsou spojené nádoby.

Téma zrychlení stránek jde svým rozsahem nad rámec našeho článku, proto jej probíráme separátně v našem návodu 11 tipů, jak zrychlit načítání stránek.

Na začátek

Technické SEO pro AI v krocích

Krok 1: Audit současného stavu

Prvním krokem je důkladná revize současného stavu vašeho webu. Ověřte si, že klíčové stránky jsou správně indexovány tradičními vyhledávači a jsou přístupné i pro roboty AI systémů. Identifikujte případné problémy s dostupností obsahu.

Krok 2: Konfigurace robots.txt

Upravte konfigurační soubor robots.txt, aby umožňoval průchod relevantním AI crawlerům a neblokoval jejich přístup k důležitému obsahu. V závislosti na vaší strategii můžete bránit v přístupu botům používaným k tréninku AI modelů, ale povolit třeba přístup pro vyhledávání na dotazy v reálném čase.

Krok 3: XML sitemapy

Vytvořte nebo zaktualizujte XML sitemapy tak, aby obsahovaly ty nejkvalitnější a nejprioritnější z vašich stránek, které mají aktuální a hodnotný obsah. Pravidelně pak sitemapy aktualizujte a kontrolujte jejich správnou indexaci vyhledávači.

Krok 4: Nasazení strukturovaných dat

Implementujte JSON-LD schémata pro všechny významné typy obsahu:

Article schema pro blogové příspěvky a články
Product schema pro katalogové položky
FAQPage markup pro sekce s dotazy a odpověďmi
Person schema pro autorské a expertní profily
LocalBusiness schema pro místní firmy a provozovny

Následně

Využijte Google Rich Results Test pro ověření správnosti strukturovaných dat (https://search.google.com/test/rich-results)
Proveďte test strukturovaných dat s pomocí Schema Markup Validator (https://validator.schema.org/) a nástroje Testing Tool for Structured Data (https://search.google.com/structured-data/testing-tool)

Krok 5: Revize HTML struktury

Projděte zdrojový kód a postarejte se o maximální využití sémantických elementů tam, kde to dává smysl. Věnujte pozornost zejména logické hierarchii nadpisových tagů (H1 až H6), použití kontextových elementů jako article, section, figure, time. Označování podobných typů obsahu napříč vaším webem se snažte sjednotit.

Pro ověření sémantického HTML využijte W3C Markup Validation Service (https://validator.w3.org/)

Krok 6: Přestavba webové architektury

Uspořádejte obsah vašeho webu do jasných tematických celků. Na související materiály odkazujte prostřednictvím deskriptivních anchor textů, které AI pomohou pochopit vztahy mezi stránkami.

Krok 7: Implementace IndexNow

Nastavte protokol IndexNow pro okamžité oznámení změn na vašem webu vyhledávačům Bing a Yandex. Vygenerujte verifikační klíč a nastavte automatické API volání při publikaci nebo aktualizaci obsahu. Výrazně tak zrychlíte indexaci veškerých změn a AI modely tak budou mít přístup k nejčerstvějším informacím z vašeho webu.

Krok 8: Optimalizace rychlosti načítání

Bonusové body vám může přinést i technická rychlost webu a Core Web Vitals metriky z klasického SEO. Komprimujte obrázky, implementujte lazy loading, minimalizujte CSS a JavaScript, zvažte využití CDN pro rychlejší doručování obsahu. Rychlý web je plusový bod pro návštěvníky i crawlery.

Krok 9: Nasazení llms.txt a llms-full.txt

Vytvořte a implementujte soubor llms.txt, který poskytne AI modelům instrukce, jak pracovat s vaším obsahem. Definujte, které sekce prioritizovat a kde najít kontextové informace. I když jde o relativně nový standard, jeho raná adopce vám může zajistit konkurenční výhodu, jakmile získá širší podporu. V této souvislosti doporučujeme vytvořit i soubor llms-full.txt, s jehož pomocí můžete ve zhuštěné podobě naservírovat AI modelům kompletní obsah vašeho webu.

Krok 10: Optimalizace multimediálního obsahu

Doplňte všechny vizuální a audio prvky o příslušné texty. Přidejte popisné alt atributy k obrázkům, vytvořte titulky a transkripty pro videa, doplňte textové verze audio obsahu. AI modely aktuálně primárně pracují s textem, takže tyto alternativy jsou velice důležité pro pochopení vašeho netextového obsahu.

Krok 11: Posílení zabezpečení webu

Postarejte se, aby váš web používal HTTPS protokol, měl platný SSL certifikát a dodržoval pravidla ochrany osobních údajů. Dobré zabezpečení má vliv na celkovou důvěryhodnost vašeho webu. Web bez HTTPS může být považován za méně spolehlivý zdroj informací.

Krok 12: Analýza konkurence

Systematicky sledujte, zda a jak dělá AI optimalizaci vaše konkurence a nakolik je v AI odpovědích viditelná. Zadávejte oborové dotazy různým AI modelům a sledujte, které weby jsou citovány nejčastěji a proč. Identifikujte jejich silné stránky a hledejte příležitosti, kde můžete být lepší.

Krok 13: Buďte vidět v Knowledge Graph

Vytvořte nebo aktualizujte entity na Google My Business, Wikidatech a dalších Knowledge Graph platformách. Implementujte rozšířená strukturovaná data, abyste zvýšili šanci na zobrazení v Google Knowledge Panel. Lepší viditelnost v Knowledge Graphu má vliv na to, zda AI modely rozpoznají vaši značku nebo osobu jako autoritativní a budou na ni odkazovat v kontextu relevantních témat.

Krok 14: Správa canonical tagů

Nastavte canonical tagy pro řešení duplicitního obsahu, který může crawlery zmást. Jasně definujte kanonickou verzi každé stránky, zejména pokud máte produkty v různých kategoriích nebo obsah dostupný na více URL. To pomůže AI modelům identifikovat primární zdroj informací.

Krok 15: Zálohování obsahu

Obsah vašeho webu průběžně zálohujte. Uchovávejte historické verze důležitých stránek pro možnost návratu k předchozím verzím, pokud by nová optimalizace nepřinesla očekávané výsledky. Dokumentujte změny a jejich dopady na citovanost v AI odpovědích.

Krok 16: Testování AI interpretace

Aktivně ověřujte, jak vaše stránky vnímají různé AI platformy. Pokládejte oborově relevantní dotazy ChatGPT, Claude i dalším modelům a analyzujte, zda vaše obsahy citují a jak. Vzorovými otázkami se více zabýváme v článku Příklady otázek pro ověřování přítomnosti v AI.

Krok 17: Monitoring návštěvnosti z vyhledávačů

Nastavte v Google Analytics segmentaci pro monitoring návštěvnosti s parametrem utm_source=chatgpt.com. Vytvořte i dimenze pro sledování dalších AI platforem. Takovéto metriky vám ukážou reálný dopad vaší optimalizace. Podrobnější informace viz náš článek Jak měřit úspěšnost GEO: Metriky, nástroje a vyhodnocení.

Počítejte s tím, že AI modely se neustále vyvíjí a do budoucna to ještě bude vyžadovat průběžné přizpůsobování vaší strategie těmto změnám. Výše uvedené body jsou nicméně osvědčené pilíře každé optimalizace a žádný web by je neměl ve vlastním zájmu opomíjet.

Technická optimalizace je ale jen jedním dílem celkové skládačky. Bez hodnotného obsahu, který je pro AI maximálně “stravitelný”, jsou vaše šance na citace mizivé. V dalším z našich článků Jak tvořit obsah pro AI si řekneme, jak na vaší technické základně postavit ještě solidní dům obsahu.

Na začátek

Zdroje

https://aioseo.com/what-is-llms-full-txt/
https://blog.cloudflare.com/ai-crawler-traffic-by-purpose-and-industry/
https://www.botify.com/insight/ai-crawler-bots
https://buildwithfern.com/post/how-to-write-llm-friendly-documentation
https://dejan.ai/blog/how-big-are-googles-grounding-chunks/
https://developers.google.com/search/docs/crawling-indexing/sitemaps/build-sitemap
https://github.com/a2aproject/A2A/blob/6351e4c45abaf2f0a6817d66540660af277e7772/llms.txt
https://www.ibm.com/think/topics/context-window
https://www.jakpsatweb.cz/html/
https://llmstxt.org/
https://morningscore.io/how-to-cloudflare-track-analyze-ai-bot-server-log/
https://www.qwairy.co/blog/understanding-ai-crawlers-complete-guide
https://seranking.com/blog/how-to-optimize-for-chatgpt/
https://topranker.cz/jak-zrychlit-nacitani-webovych-stranek/
KUBÍČEK, Michal. Optimalizace webu pro AI [e-kniha]. Ostrava: Mediatoring.com s.r.o., 2025. ISBN 978-80-11-08429-5 (PDF). ISBN 978-80-11-08430-1 (ePub).
https://optimalizace.ai/

Technická optimalizace webu pro AI. Jak usnadnit zpracování vašeho obsahu AI modely

Nastavení robots.txt pro AI roboty

Nejběžnější typy AI botů a jejich účel

Scrapery tréninkových dat

AI asistenti

AI search crawlery

AI agenti

Jak sledovat AI crawlery na vašem webu

Cloudflare

Server logy jako GEO analytický nástroj

Co v logu hledat

Jaký přístup k AI botům zaujmout

Konkrétní direktivy pro povolení přístupu AI botů v robots.txt

XML sitemapy a proč je potřebujete

Soubor llms.txt - navrhovaný standard pro komunikaci s AI

Struktura llms.txt souboru

Jak llms.txt soubor implementovat

Soubor llms-full.txt nabídne kompletní obsah na jednom místě

Markdown verze stránek servíruje čistý obsah bez balastu

Jsou 2 verze téže stránky cloaking?

Markdown a ekonomie “Context Window”

Na tokenech záleží

HTML versus Markdown

Strukturovaná data aneb Jak dát obsahu význam

Sémantické HTML

Strukturální elementy

Významové elementy

Datové struktury

Architektura webu a vnitřní odkazování mezi stránkami

Principy efektivního propojení

Princip tematického seskupení v praxi

Technická optimalizace podle typu webu

Zpravodajské weby

Rychlost stránky a její vliv na AI citace

Technické SEO pro AI v krocích

Zdroje

Související články