Стоит ли разрешать GPTBot в robots.txt?

Если ваша цель — максимальная видимость и реферальный трафик, да. Если вы строго против использования вашего контента в обучении моделей, можно запретить. Большинство коммерческих сайтов выигрывают от того, чтобы быть видимыми в LLM-ответах: это новый канал, аналогичный поиску.

GEO заменит классическое SEO?

Нет, дополнит. Поисковики и LLM используют сильно пересекающиеся сигналы качества. Сайт, который хорошо ранжируется в Google и Яндексе, обычно цитируется и в LLM. Делайте качественно для людей — выиграете везде.

Можно ли запретить LLM использовать мой контент?

Через robots.txt можно запретить ботам сканировать ваши страницы — большинство уважающих себя моделей это соблюдают. Но контент, уже использованный для обучения предыдущих версий модели, удалить нельзя.

Как пишет статьи команда Взлетим?

Сами руками, на основе своего опыта работы с продуктом и публичных источников. Без выдуманных метрик, без купленных ссылок, без AI-генерации мусора. Это не быстро, но это единственный способ заработать доверие и людей, и поисковиков, и LLM.

Как ChatGPT и YandexGPT находят и цитируют сайты

GEO (Generative Engine Optimization) — это оптимизация сайта под цитирование большими языковыми моделями: ChatGPT, Perplexity, YandexGPT, GigaChat, Алисой. Базовые требования — те же, что для классического SEO: индексируемый HTML, чёткая структура, FAQ-блоки и микроразметка. Дополнительно — прямые короткие ответы в первых 60 словах статьи и явные формулировки.

Что такое GEO простыми словами

GEO (Generative Engine Optimization) — это новая дисциплина, выросшая из SEO. Если SEO — про то, чтобы сайт показывался в выдаче поисковика и человек по нему кликнул, то GEO — про то, чтобы LLM (ChatGPT, Perplexity, YandexGPT, GigaChat) выбрали ваш сайт как источник, когда отвечают на вопрос пользователя.

Это не «новый способ обмануть алгоритмы». Это набор приёмов, которые помогают модели правильно понять ваш контент и процитировать его с указанием авторства.

Как LLM находят сайты

У современных LLM два режима работы. Первый — обучение на гигантском корпусе сайтов: модель «впитала» миллионы страниц во время тренировки и теперь использует это знание. Второй — режим поиска в реальном времени (RAG, retrieval-augmented generation): модель идёт в поисковик, скачивает несколько страниц по запросу пользователя и составляет ответ, опираясь на них.

ChatGPT с включённым поиском, Perplexity, YandexGPT в режиме «Я», GigaChat в режиме «Поиск» — все используют второй вариант. Они посылают на сайт специальных ботов: GPTBot, OAI-SearchBot, PerplexityBot, ClaudeBot, YandexAdditional, GigaChatBot.

Что эти боты умеют и не умеют

Большинство LLM-ботов не выполняют JavaScript. Они индексируют только тот HTML, который сервер отдаёт в первом ответе. Если у вас SPA — ваш сайт для них пустой. Если SSG или SSR — ваш контент виден сразу.

Для управления доступом этих ботов используется robots.txt: можно явно разрешить (Allow) или запретить (Disallow) каждого. Большинство сайтов выигрывают от того, чтобы оставить их разрешёнными — это бесплатные источники реферальных кликов от LLM.

Что делает контент цитируемым

LLM любят страницы, где первый абзац сразу отвечает на вопрос. Не «в современном динамичном мире… [ещё 200 слов воды]», а «X — это Y. Главные особенности: …». Такой формат ответа модель легко вырезает и вставляет в свой ответ с пометкой источника.

Хорошо работают: чёткие H2-вопросы (как у нас в этой статье), маркированные списки с конкретными пунктами, FAQ-блоки в конце, таблицы сравнений. Плохо работают: длинные простыни без подзаголовков, картинки с текстом вместо текста, выводы под спойлерами.

Микроразметка и LLM

Microdata и JSON-LD по schema.org помогают модели правильно понять, что у вас на странице. FAQPage даёт структуру «вопрос-ответ», HowTo — «шаги». DefinedTerm — «термин и его определение». Article — «статья с автором и датой». Это не магия, но это даёт модели контекст для аккуратной цитаты.

Авторство и доверие

LLM учитывают источник: страницы со ссылками на официальные документы, исследования, упоминания эксперта в области цитируются охотнее. Если вы пишете про SEO — сошлитесь на developers.google.com и yandex.ru/support/webmaster. Если про мобильную разработку — на developer.apple.com и developer.android.com. Это сигнал «я знаю, о чём говорю».

Что писать, а что не писать

Пишите конкретно: «Срок индексации в Яндексе — 7–14 дней при правильной настройке», а не «индексация занимает время».
Указывайте даты: «По данным на апрель 2026, оплата подписки Wix российскими картами заблокирована». Через год эта формулировка устареет — обновите её.
Не выдумывайте кейсы и метрики: модели и пользователи это считывают. Лучше честно «у нас пока нет публичной статистики», чем «мы выросли в 10 раз за месяц».
Не пытайтесь обмануть LLM скрытым текстом или нерелевантными ключами — модели обучаются распознавать такие паттерны быстрее поисковиков.

Как проверить, что вас цитируют

Точных метрик пока нет. На уровне эвристик: задавайте ChatGPT, Perplexity, YandexGPT вопросы по вашей теме и смотрите, появляется ли ваш домен в источниках. Используйте Яндекс.Вебмастер — раздел «Поисковые запросы» начинает показывать поведение LLM-ботов отдельно. Подключите серверный лог и фильтруйте User-Agent по GPTBot, PerplexityBot, ClaudeBot — увидите, какие страницы они скачивают.

Когда GEO даёт результат

В среднем — 1–3 месяца после публикации качественного контента. Цикл такой: вы пишете статью с прямыми ответами и микроразметкой → она индексируется поисковиками → LLM-боты её скачивают и обновляют свои индексы → пользователи спрашивают модель и получают ответ со ссылкой на ваш сайт.

В нишах с высокой конкуренцией (общая популярная тематика) пробиться сложнее: модель уже выбрала «образцовые» источники. В нишах поуже (региональные сервисы, специализированные темы) места больше, и качественная статья начинает приносить реферальные клики уже в первый месяц.

Как ChatGPT и YandexGPT находят и цитируют сайты — что такое GEO

Что такое GEO простыми словами

Как LLM находят сайты

Что эти боты умеют и не умеют

Что делает контент цитируемым

Микроразметка и LLM

Авторство и доверие

Что писать, а что не писать

Как проверить, что вас цитируют

Когда GEO даёт результат

Частые вопросы

Другие статьи

Почему сайты на Взлетим попадают в Яндекс — а другие AI-конструкторы нет

Почему React-сайты невидимы для Googlebot и как это исправить

Чек-лист SEO для лендинга в 2026 — без воды

SSG vs SSR vs SPA: что выбрать AI-конструктору сайтов

Попробуйте Взлетим