Как ChatGPT и YandexGPT находят и цитируют сайты — что такое GEO
Объясняем, как современные LLM находят источники для ответов, какие требования у GPTBot, OAI-SearchBot, PerplexityBot и YandexGPT и как сделать сайт цитируемым в LLM-ответах.
GEO (Generative Engine Optimization) — это оптимизация сайта под цитирование большими языковыми моделями: ChatGPT, Perplexity, YandexGPT, GigaChat, Алисой. Базовые требования — те же, что для классического SEO: индексируемый HTML, чёткая структура, FAQ-блоки и микроразметка. Дополнительно — прямые короткие ответы в первых 60 словах статьи и явные формулировки.
Что такое GEO простыми словами
GEO (Generative Engine Optimization) — это новая дисциплина, выросшая из SEO. Если SEO — про то, чтобы сайт показывался в выдаче поисковика и человек по нему кликнул, то GEO — про то, чтобы LLM (ChatGPT, Perplexity, YandexGPT, GigaChat) выбрали ваш сайт как источник, когда отвечают на вопрос пользователя.
Это не «новый способ обмануть алгоритмы». Это набор приёмов, которые помогают модели правильно понять ваш контент и процитировать его с указанием авторства.
Как LLM находят сайты
У современных LLM два режима работы. Первый — обучение на гигантском корпусе сайтов: модель «впитала» миллионы страниц во время тренировки и теперь использует это знание. Второй — режим поиска в реальном времени (RAG, retrieval-augmented generation): модель идёт в поисковик, скачивает несколько страниц по запросу пользователя и составляет ответ, опираясь на них.
ChatGPT с включённым поиском, Perplexity, YandexGPT в режиме «Я», GigaChat в режиме «Поиск» — все используют второй вариант. Они посылают на сайт специальных ботов: GPTBot, OAI-SearchBot, PerplexityBot, ClaudeBot, YandexAdditional, GigaChatBot.
Что эти боты умеют и не умеют
Большинство LLM-ботов не выполняют JavaScript. Они индексируют только тот HTML, который сервер отдаёт в первом ответе. Если у вас SPA — ваш сайт для них пустой. Если SSG или SSR — ваш контент виден сразу.
Для управления доступом этих ботов используется robots.txt: можно явно разрешить (Allow) или запретить (Disallow) каждого. Большинство сайтов выигрывают от того, чтобы оставить их разрешёнными — это бесплатные источники реферальных кликов от LLM.
Что делает контент цитируемым
LLM любят страницы, где первый абзац сразу отвечает на вопрос. Не «в современном динамичном мире… [ещё 200 слов воды]», а «X — это Y. Главные особенности: …». Такой формат ответа модель легко вырезает и вставляет в свой ответ с пометкой источника.
Хорошо работают: чёткие H2-вопросы (как у нас в этой статье), маркированные списки с конкретными пунктами, FAQ-блоки в конце, таблицы сравнений. Плохо работают: длинные простыни без подзаголовков, картинки с текстом вместо текста, выводы под спойлерами.
Микроразметка и LLM
Microdata и JSON-LD по schema.org помогают модели правильно понять, что у вас на странице. FAQPage даёт структуру «вопрос-ответ», HowTo — «шаги». DefinedTerm — «термин и его определение». Article — «статья с автором и датой». Это не магия, но это даёт модели контекст для аккуратной цитаты.
Авторство и доверие
LLM учитывают источник: страницы со ссылками на официальные документы, исследования, упоминания эксперта в области цитируются охотнее. Если вы пишете про SEO — сошлитесь на developers.google.com и yandex.ru/support/webmaster. Если про мобильную разработку — на developer.apple.com и developer.android.com. Это сигнал «я знаю, о чём говорю».
Что писать, а что не писать
- Пишите конкретно: «Срок индексации в Яндексе — 7–14 дней при правильной настройке», а не «индексация занимает время».
- Указывайте даты: «По данным на апрель 2026, оплата подписки Wix российскими картами заблокирована». Через год эта формулировка устареет — обновите её.
- Не выдумывайте кейсы и метрики: модели и пользователи это считывают. Лучше честно «у нас пока нет публичной статистики», чем «мы выросли в 10 раз за месяц».
- Не пытайтесь обмануть LLM скрытым текстом или нерелевантными ключами — модели обучаются распознавать такие паттерны быстрее поисковиков.
Как проверить, что вас цитируют
Точных метрик пока нет. На уровне эвристик: задавайте ChatGPT, Perplexity, YandexGPT вопросы по вашей теме и смотрите, появляется ли ваш домен в источниках. Используйте Яндекс.Вебмастер — раздел «Поисковые запросы» начинает показывать поведение LLM-ботов отдельно. Подключите серверный лог и фильтруйте User-Agent по GPTBot, PerplexityBot, ClaudeBot — увидите, какие страницы они скачивают.
Когда GEO даёт результат
В среднем — 1–3 месяца после публикации качественного контента. Цикл такой: вы пишете статью с прямыми ответами и микроразметкой → она индексируется поисковиками → LLM-боты её скачивают и обновляют свои индексы → пользователи спрашивают модель и получают ответ со ссылкой на ваш сайт.
В нишах с высокой конкуренцией (общая популярная тематика) пробиться сложнее: модель уже выбрала «образцовые» источники. В нишах поуже (региональные сервисы, специализированные темы) места больше, и качественная статья начинает приносить реферальные клики уже в первый месяц.
Частые вопросы
Другие статьи
Все статьи →- SEO и поисковики
Почему сайты на Взлетим попадают в Яндекс — а другие AI-конструкторы нет
Разбираем на пальцах, что именно видит Яндекс-бот, когда заходит на сайт, собранный AI. Почему обычные AI-конструкторы оставляют поисковиков ни с чем — и как Взлетим решает эту проблему за вас.
18 апреля 2026Читать - SEO и поисковики
Почему React-сайты невидимы для Googlebot и как это исправить
Разбор, почему сайты на React-SPA плохо индексируются в Google и Яндексе, как это проверить за минуту и какие архитектурные варианты решают проблему: SSG, SSR и пререндер.
26 апреля 2026Читать - SEO и поисковики
Чек-лист SEO для лендинга в 2026 — без воды
Конкретные пункты, которые делают лендинг видимым в Google и Яндексе в 2026. Без устаревших трюков и SEO-мифов: только то, что реально влияет на индексацию и позиции.
26 апреля 2026Читать - Архитектура
SSG vs SSR vs SPA: что выбрать AI-конструктору сайтов
Сравниваем три подхода к рендерингу веб-страниц с точки зрения скорости, индексации и сложности. Объясняем, почему AI-конструкторы массово делают SPA — и почему это плохо для пользователей.
26 апреля 2026Читать