ИИ и нейросети

RAG

Также: retrieval-augmented generation, генерация с поиском

Подход, при котором языковая модель перед ответом ищет нужную информацию во внешних источниках и отвечает на её основе, а не только «из памяти». Снижает выдумки.

RAG (retrieval-augmented generation) — схема «сначала найди, потом отвечай». Вместо того чтобы полагаться на знания, зашитые в модель при обучении, система по запросу достаёт релевантные документы (обычно поиском по эмбеддингам) и передаёт их модели как контекст для ответа.

Какую проблему решает

У языковых моделей два ограничения: знания заканчиваются датой обучения, а на незнакомые вопросы они склонны к галлюцинациям. RAG лечит оба: модель отвечает по свежим документам, которые ей только что нашли, и может сослаться на источник.

RAG и MCP — родственники

Оба подхода дают модели доступ к внешним данным, но по-разному. RAG — про поиск по базам знаний и документам. MCP — про живые инструменты: не «найди в архиве», а «сходи в сервис, запроси актуальные цифры, выполни действие». Для рекламного кабинета нужен именно второй путь: статистика меняется ежедневно, и ассистент должен читать её в момент вопроса — так работает Direct Manager с Claude и ChatGPT.

Связанные термины

Большая языковая модель (LLM)Эмбеддинги Галлюцинации ИИ

Читайте в блоге

MCP-сервер простыми словами: что это, зачем нужен и как работает

MCP-сервер — переходник между ИИ-ассистентом и внешним сервисом: он даёт Claude или ChatGPT реальные инструменты вместо текстовых советов. Объясняем на пальцах, зачем он нужен и как работает, на примере Яндекс Директа.