Роль инструмента	Политика при отказе по умолчанию	Что недопустимо	Что увидит пользователь
Проверка прав доступа перед отбором кандидатов	Жесткий отказ на расширение области доступа, при необходимости мягкий откат на более узкий безопасный путь	Нельзя расширять доступ только потому, что проверка не сработала	Меньше результатов допустимо, несанкционированные результаты недопустимы
Разбор запроса перед отбором кандидатов	Откат на исходный запрос и базовый путь	Нельзя заменять здоровый базовый путь неподтвержденным переписыванием	Базовая выдача остается доступной
Обогащение верхних результатов после повторного ранжирования	Откат на базовую выдачу с подавлением неподтвержденных утверждений	Нельзя позволять отсутствующим признакам незаметно перетасовать выдачу	Ответ строится без живого утверждения, порядок базовой выдачи сохраняется
Действие после выбора ответа	Жесткий отказ за контуром согласования	Нельзя выполнять побочный эффект при таймауте, двусмысленности или отказе в согласовании	Путь ответа остается доступным, путь действия выключается

Паттерн	Когда использовать	Основная польза	Главный риск	Влияние на задержку	Что нужно для управляемости	Стратегия отката
Структурированный разбор до отбора кандидатов	Шумные запросы, поиск с правами доступа, извлечение фильтров, маршрутизация между индексами	Улучшается структура запроса без смены поискового контракта	Переписывание запроса начинает уходить от исходного намерения	Низкое или среднее	Строгие схемы, ограниченный выходной контракт, логирование исходного и интерпретированного запроса	Возврат к исходному запросу и базовому поиску
Поиск первым, инструменты только по правилам	Базовый поиск закрывает большинство запросов, а части из них нужны уточнение или проверка актуальности	Главный поисковый путь сохраняется, бюджет инструментов тратится только на спорные случаи	Со временем эскалация в инструменты превращается в путь по умолчанию	Низкое для основной массы трафика, среднее для эскалаций	Явные правила эскалации, бюджеты инструментов на запрос, понятные пороги отката	Ответ из базовой выдачи с более узкими утверждениями или меньшей уверенностью
Обогащение верхней части выдачи после ранжирования	Качество выдачи зависит от динамических признаков: наличия, прав доступа, политик	Свежие сигналы повышают точность там, где это действительно важно	Частичные сбои инструментов искажают повторное ранжирование	Среднее	Таймауты на инструмент, значения по умолчанию для признаков, проверки устойчивости повторного ранжирования	Сохранить базовую выдачу и пометить обогащение недоступным
Действие после ответа через согласование	Пользователю нужно, чтобы система действовала после выбора результата	Выше завершение задачи без выхода из поискового сценария	Побочные эффекты, злоупотребление доступом, дубль действий	Среднее или высокое	Контур согласования, минимальные права, ключи идемпотентности, журнал действий	Путь ответа остается, путь действия выключается, дальше эстафета у детерминированного процесса

Группа метрик	Примеры	Что показывают	Пример релизного гейта
Отбор кандидатов	Recall@K, nDCG@K, отличие между исходным и интерпретированным запросом	Насколько разбор запроса или переписывание меняют качество свидетельств	Блокировать вывод, если качество отбора падает ниже согласованного порога
Повторное ранжирование	Win rate, изменение релевантности, покрытие признаков	Продолжает ли повторное ранжирование улучшать набор кандидатов после обогащения инструментами	Блокировать вывод, если win rate падает или покрытие признаков становится нестабильным
Инструменты	Доля вызовов, доля лишних вызовов, доля некорректных параметров, доля таймаутов	Остается ли место инструментов ограниченным и надежным	Блокировать вывод, если доля вызовов или таймаутов выходит за бюджет
Задержка	p95, p99, добавка по задержке от инструментов, доля отмен	Ломает ли второй контур основное SLO	Блокировать вывод, если накладка по задержке выходит за лимит
Управляемость	Доля откатов, доля согласований, попытки небезопасных действий	Сохраняет ли система управляемость на реальном трафике	Блокировать вывод, если откаты или небезопасные попытки растут
Экономика	Стоимость успешной сессии, доля стоимости инструментов, рост токенов	Оправдана ли добавленная функциональность эксплуатационной ценой	Блокировать вывод, если экономика сессии ухудшается без выигрыша по качеству

Режим отказа	Симптом	Почему возникает	Что делать
Спам инструментами	Растут доля вызовов, расход токенов и p95 без выигрыша по релевантности	Инструменты становятся путем по умолчанию вместо пути эскалации	Жестко ограничивать место инструментов, использовать `tool_choice`, белые списки и бюджеты вызовов на запрос через управляющие примитивы function calling у OpenAI
Взрыв задержек	Растет p99, увеличиваются отмены, давление расползается по downstream	Многошаговые цепочки инструментов умножают хвост задержек и повторные попытки	Прокидывать дедлайны, ограничивать ретраи и опираться на Google SRE: Addressing Cascading Failures и Handling Overload
Дрейф отбора кандидатов	После изменения интерпретации запроса офлайн-метрики отбора начинают вести себя иначе	Переписывание запроса меняет саму задачу, которую решает отбор	Логировать исходный и интерпретированный запрос, оценивать оба варианта и ставить гейты по их расхождению
Искажение повторного ранжирования	Элементы с успешным обогащением поднимаются выше более релевантных элементов с отсутствующими признаками	Частичный отказ инструментов просачивается в решения повторного ранжирования	Держать бюджеты таймаутов, задавать значения по умолчанию для признаков и иметь детерминированный путь отката для повторного ранжирования
Дрейф контракта инструмента	Растет доля некорректных параметров, структурированные ответы перестают совпадать с ожиданиями downstream, падает покрытие признаков	Описание инструмента, схема или форма ответа изменились без replay-тестов и обновления оценок	Версионировать контракты, валидировать выход, фиксировать схемы и прогонять replay-тесты по каждому инструменту до релиза
Дрейф прав доступа	Появляются пропавшие или несогласованные результаты, всплески отказов в согласовании и странные расхождения между средами	Меняются области доступа, ломается проверка token audience, регрессирует путь согласования или неправильно настроена граница доверия MCP	Разводить права на чтение и запись, валидировать token audience, логировать согласования и отказы и запускать auth regression tests по каждому инструменту
Разрастание бюджета рассуждения	p95, расход токенов и стоимость успешной сессии растут без заметного выигрыша по качеству	Шаг планирования или эскалация в инструменты тихо становятся путем по умолчанию	Ограничивать reasoning effort, бюджеты вызовов инструментов и сравнивать путь с обогащением с базовым путем на уровне сессии
Косвенная инъекция через найденный контент	Найденный текст начинает влиять на параметры инструмента или толкает систему к небезопасным действиям	Поисковые корпуса часто содержат недоверенный текст	Считать найденный текст недоверенным и применять меры из NIST Generative AI Profile и OpenAI Agent Safety Guidance

Что такое агентный поиск в продакшн-поиске

Почему отбор кандидатов и повторное ранжирование остаются главным контуром управления

Что слою инструментов запрещено менять

Результаты инструментов должны входить в систему как типизированные признаки, а не как свободный текст

Где вызывать инструменты в поисковой системе

До отбора кандидатов

После повторного ранжирования

После выбора ответа

Где нужен мягкий отказ, а где жесткий

Четыре рабочих паттерна для отбора кандидатов, повторного ранжирования и вызовов инструментов

Как держать вызовы инструментов под контролем

1. Строгие схемы и ограниченный выходной контракт

2. Списки разрешенных инструментов и дисциплина вызовов

3. Контур согласования и границы доверия в MCP

3.5 Права доступа, согласие и границы токенов входят в контроль ранжирования

4. Оценка по трассам и метрики времени работы

4.5 Телеметрический контракт для второго контура управления

5. Аварийные выключатели, автоматические размыкатели и деградированный режим

Какие метрики и релизные гейты нужны агентному поиску

Разобранный пример: поиск по маркетплейсу с обогащением верхних результатов

Шаг 1. Структурированный разбор

Шаг 2. Отбор кандидатов и повторное ранжирование

Шаг 3. Обогащение верхней части выдачи

Шаг 4. Путь ответа

Шаг 5. Путь действия

Поведение при откате

За какими сигналами здесь следить

Частый сбой из практики

Типовые режимы отказа, которые первыми ломают качество поиска

Дисциплина вывода в рабочий трафик: этапы 0-3

Этап 0. Сохраняется базовый путь без инструментов

Этап 1. Добавляется одна ограниченная роль инструмента

Этап 2. Добавляются оценки по трассам и релизные гейты

Этап 3. Действия появляются только за контуром согласования

Практический список проверки

Финальный тезис

Что посмотреть дальше

Стандарты и источники

FAQ

Что такое агентный поиск в продакшн-поиске?

Где безопаснее вызывать инструменты в поисковой системе?

Когда инструмент нужен до retrieval, а когда после reranking?

Могут ли результаты инструмента менять финальный порядок выдачи?

Какие метрики первыми показывают деградацию агентного поиска?

Как безопасно использовать MCP-инструменты в поиске?