Статьи

Опубликовано 12 материалов по поиску, рекомендациям, LLM и MLOps: архитектура, качество, надежность и стоимость.

Голосовой агент on-prem: закрытый контур и полсекунды

Как проектировать on-prem голосового агента без облака: задержка первого звука, barge-in, turn detection, Audio2Face, одна GPU и релизные проверки.

Evals для LLM-агентов: минимальный набор для продакшна

Агенты

Инженерный разбор evals для LLM-агентов: карта отказов, уровни оценки, грейдеры, pass^k, статистика прогонов, калибровка LLM-as-judge, архитектура харнесса и релизные гейты.

Логи поиска и рекомендаций как данные для LLM post-training

Поиск

Инженерный разбор пайплайна, который превращает продуктовые логи поиска, рекомендаций и мультимодального поиска в данные для SFT, DPO, GRPO и модели-судьи.

Мультимодальный поиск для LLM

Поиск

Инженерная статья о слое отбора контекста вокруг GPT, Claude и Gemini: как искать, ранжировать и упаковывать PDF, таблицы, скриншоты и visual evidence для grounded LLM-ответов.

Как встроить вызовы инструментов в поиск и не ломать отбор кандидатов

Поиск

Практический разбор для поисковых команд: как встроить вызовы инструментов в продакшн-поиск и не потерять качество выдачи, задержки, безопасность и возможность отката.

Миграция с Assistants API на Responses API

Агенты

Практический план миграции с OpenAI Assistants API на Responses API и Conversations API: сроки, новая модель объектов, состояние, retrieval, tool calling, streaming и проверка паритета.

Offline-online разрыв в RecSys: 11 релизных гейтов и регламент инцидентов

RecSys

Практическое руководство по offline-online разрыву в RecSys: feedback loops, delayed labels, train/serve skew, ограничения OPE, 11 релизных гейтов и регламент инцидентов.

Агент или workflow: как выбрать архитектуру без хайпа

Агенты

Подробный инженерный фреймворк выбора между workflow и агентом: критерии, архитектурные паттерны, evals, безопасность, стоимость и план внедрения.

MLOps для RAG-агента поддержки в 2026: релизы, безопасность и стоимость

MLOps

Практический гайд по запуску RAG-агента поддержки с tool-calls: архитектурный контракт, release-gates, policy-контроль, observability и FinOps.

MLOps для production ML: 7 релизных гейтов для управляемой выкладки

MLOps

Практический каркас MLOps для релиза модели: какие гейты обязательны до выкладки, как держать качество, SLO и стоимость под контролем.

Навайбкодил: igorOS - ПК с агентом

Агенты

У моего сайта теперь есть второй режим - OS. Там живет AI-ассистент, который управляет окнами и приложениями. Что это, как попасть и зачем оно вообще нужно.

Обучение гибрида LLM и рекомендательной системы на Semantic IDs

RecSys

Как научить языковую модель понимать каталог через семантические идентификаторы и делать управляемые рекомендации с объяснениями