LLM и агентные системы

Материалы о LLM и агентных системах: выбор архитектуры, оценка качества, безопасность, управление инструментами и надежная эксплуатация.

Голосовой агент on-prem: закрытый контур и полсекунды

Агенты

Как проектировать on-prem голосового агента без облака: задержка первого звука, barge-in, turn detection, Audio2Face, одна GPU и релизные проверки.

Evals для LLM-агентов: минимальный набор для продакшна

Агенты

Инженерный разбор evals для LLM-агентов: карта отказов, уровни оценки, грейдеры, pass^k, статистика прогонов, калибровка LLM-as-judge, архитектура харнесса и релизные гейты.

Логи поиска и рекомендаций как данные для LLM post-training

Поиск

Инженерный разбор пайплайна, который превращает продуктовые логи поиска, рекомендаций и мультимодального поиска в данные для SFT, DPO, GRPO и модели-судьи.

Мультимодальный поиск для LLM

Поиск

Инженерная статья о слое отбора контекста вокруг GPT, Claude и Gemini: как искать, ранжировать и упаковывать PDF, таблицы, скриншоты и visual evidence для grounded LLM-ответов.

Как встроить вызовы инструментов в поиск и не ломать отбор кандидатов

Поиск

Практический разбор для поисковых команд: как встроить вызовы инструментов в продакшн-поиск и не потерять качество выдачи, задержки, безопасность и возможность отката.

Миграция с Assistants API на Responses API

Агенты

Практический план миграции с OpenAI Assistants API на Responses API и Conversations API: сроки, новая модель объектов, состояние, retrieval, tool calling, streaming и проверка паритета.

Агент или workflow: как выбрать архитектуру без хайпа

Агенты

Подробный инженерный фреймворк выбора между workflow и агентом: критерии, архитектурные паттерны, evals, безопасность, стоимость и план внедрения.

MLOps для RAG-агента поддержки в 2026: релизы, безопасность и стоимость

MLOps

Практический гайд по запуску RAG-агента поддержки с tool-calls: архитектурный контракт, release-gates, policy-контроль, observability и FinOps.

Навайбкодил: igorOS - ПК с агентом

Агенты

У моего сайта теперь есть второй режим - OS. Там живет AI-ассистент, который управляет окнами и приложениями. Что это, как попасть и зачем оно вообще нужно.