Инженерный разбор пайплайна, который превращает продуктовые логи поиска, рекомендаций и мультимодального поиска в данные для SFT, DPO, GRPO и модели-судьи.
LLM и агентные системы
Материалы о LLM и агентных системах: выбор архитектуры, оценка качества, безопасность, управление инструментами и надежная эксплуатация.
Инженерная статья о слое отбора контекста вокруг GPT, Claude и Gemini: как искать, ранжировать и упаковывать PDF, таблицы, скриншоты и visual evidence для grounded LLM-ответов.
Практический разбор для поисковых команд: как встроить вызовы инструментов в продакшн-поиск и не потерять качество выдачи, задержки, безопасность и возможность отката.
Практический план миграции с OpenAI Assistants API на Responses API и Conversations API: сроки, новая модель объектов, состояние, retrieval, tool calling, streaming и проверка паритета.
Подробный инженерный фреймворк выбора между workflow и агентом: критерии, архитектурные паттерны, evals, безопасность, стоимость и план внедрения.
Практический гайд по запуску RAG-агента поддержки с tool-calls: архитектурный контракт, release-gates, policy-контроль, observability и FinOps.
У моего сайта теперь есть второй режим - OS. Там живет AI-ассистент, который управляет окнами и приложениями. Что это, как попасть и зачем оно вообще нужно.