# Игорь Якушев > Практические статьи и кейсы по ML-инженерии: MLOps, GenAI/RAG, рекомендации. Опыт с 10M+ запросов в день. Результаты: +14% конверсия, −40% latency. - Locale: ru - Canonical: https://igor-ya.ru/ - Alternate locale: https://igor-ya.com/ - Generated: 2026-02-19T22:58:15.385Z ## Core pages - [Главная](https://igor-ya.ru/) - Практические статьи и кейсы по ML-инженерии: MLOps, GenAI/RAG, рекомендации. Опыт с 10M+ запросов в день. Результаты: +14% конверсия, −40% latency. - [Обо мне](https://igor-ya.ru/about/) - Senior ML Engineer: поиск и рекомендации на 10M+ запросов в день. Опыт в Google, ViSenze, Ozon. Фокус: архитектура production ML. - [Статьи](https://igor-ya.ru/posts/) - Практические статьи по ML-инженерии из продакшен-опыта: архитектура систем, практики MLOps, кейсы. Узнайте паттерны, антипаттерны и решения с метриками. - [Проекты](https://igor-ya.ru/projects/) - Кейсы production ML: GenAI/RAG, MLOps и рекомендательные системы. В каждом кейсе: проблема, архитектура и измеримый результат. - [Для найма](https://igor-ya.ru/formats/) - Открыт к full-time Senior/Staff ML Engineer. Системный дизайн и end-to-end ownership для Search, Ranking, Recsys, GenAI/RAG и MLOps. ## Latest posts - [Агент или workflow: как выбрать архитектуру без хайпа](https://igor-ya.ru/posts/agent-vs-workflow-architecture-framework/) 2026-02-18 | tags: LLM, Agents, Workflow, System Design, AgentOps, Evals, AI Security, FinOps | category: Agents | reading: 12 мин - Подробный инженерный фреймворк выбора между workflow и агентом: критерии, архитектурные паттерны, evals, безопасность, стоимость и план внедрения. - [MLOps для RAG-агента поддержки в 2026: релизы, безопасность и стоимость](https://igor-ya.ru/posts/mlops-rag-agent-support-release-gates-security-cost-2026/) 2026-02-10 | tags: MLOps, RAG, AgentOps, LLMOps, AI Security, Observability, FinOps | category: MLOps | reading: 34 мин - Практический гайд по запуску RAG-агента поддержки с tool-calls: архитектурный контракт, release-gates, policy-контроль, observability и FinOps. - [MLOps для production ML: 7 релизных гейтов для управляемой выкладки](https://igor-ya.ru/posts/mlops-release-gates-production-ml/) 2025-12-26 | tags: MLOps, Model Registry, CI/CD, Observability, Drift Detection, FinOps, SRE, AI Security | category: MLOps | reading: 13 мин - Практический каркас MLOps для релиза модели: какие гейты обязательны до выкладки, как держать качество, SLO и стоимость под контролем. - [Навайбкодил: igorOS - ПК с агентом](https://igor-ya.ru/posts/igoros-alternative-site/) 2025-12-15 | tags: Web OS, Tool calling, UX, React, TypeScript | category: Agents | reading: 4 мин - У моего сайта теперь есть второй режим - OS. Там живет AI-ассистент, который управляет окнами и приложениями. Что это, как попасть и зачем оно вообще нужно. - [Обучение гибрида LLM и рекомендательной системы на Semantic IDs](https://igor-ya.ru/posts/semantic-ids-llm-recsys/) 2025-01-20 | tags: LLM, Recommendations, Semantic IDs, RQ-VAE, Qwen3, Retrieval, Ranking, SASRec | category: RecSys | reading: 25 мин - Как научить языковую модель понимать каталог через семантические идентификаторы и делать управляемые рекомендации с объяснениями ## Latest projects - [Платформа оценки стоимости ML‑инференса](https://igor-ya.ru/projects/ml-cost/) 2025-12-15 | tags: MLOps, Torch, ONNX, Profiling, Cost Optimization - Внутренний инструмент для профилировки latency, throughput и $/req моделей в проде - [Голосовой AI для колл-центра](https://igor-ya.ru/projects/voice-ai-contact-center/) 2025-09-28 | tags: Voice AI, Realtime GenAI, Agentic Workflow, MLOps, Call Center, RAG - On-prem голосовой AI-оператор закрывает 72% звонков без человека за 0.96 с со снижением стоимости на 58%. - [RAG-ассистент для каталога](https://igor-ya.ru/projects/rag-search/) 2025-07-15 | tags: RAG, Vector Search, LLM Serving, KServe, MLOps - MVP чат-поиск с автоматизацией деплоев, экспериментов и мониторинга качества - [Антифрод-аналитика Telegram для медиапланов](https://igor-ya.ru/projects/telegram-antifraud/) 2025-05-15 | tags: Telegram, Ad Verification, Anomaly Detection, Fraud, MLOps, Python, FastAPI - Система детекции накрутки сокращает неэффективные расходы на 24% и автоматизирует проверку 100 каналов за 12 минут - [Система поиска и рекомендаций](https://igor-ya.ru/projects/search-recommend/) 2025-04-30 | tags: Multimodal, Vector Search, MLOps, Kubernetes, Cost Optimization - Мультимодальная платформа поиска и рекомендаций с полным CI/CD-контуром, мониторингом и A/B-экспериментами ## Full posts index - [Агент или workflow: как выбрать архитектуру без хайпа](https://igor-ya.ru/posts/agent-vs-workflow-architecture-framework/) 2026-02-18 | tags: LLM, Agents, Workflow, System Design, AgentOps, Evals, AI Security, FinOps | category: Agents | reading: 12 мин - Подробный инженерный фреймворк выбора между workflow и агентом: критерии, архитектурные паттерны, evals, безопасность, стоимость и план внедрения. - [MLOps для RAG-агента поддержки в 2026: релизы, безопасность и стоимость](https://igor-ya.ru/posts/mlops-rag-agent-support-release-gates-security-cost-2026/) 2026-02-10 | tags: MLOps, RAG, AgentOps, LLMOps, AI Security, Observability, FinOps | category: MLOps | reading: 34 мин - Практический гайд по запуску RAG-агента поддержки с tool-calls: архитектурный контракт, release-gates, policy-контроль, observability и FinOps. - [MLOps для production ML: 7 релизных гейтов для управляемой выкладки](https://igor-ya.ru/posts/mlops-release-gates-production-ml/) 2025-12-26 | tags: MLOps, Model Registry, CI/CD, Observability, Drift Detection, FinOps, SRE, AI Security | category: MLOps | reading: 13 мин - Практический каркас MLOps для релиза модели: какие гейты обязательны до выкладки, как держать качество, SLO и стоимость под контролем. - [Навайбкодил: igorOS - ПК с агентом](https://igor-ya.ru/posts/igoros-alternative-site/) 2025-12-15 | tags: Web OS, Tool calling, UX, React, TypeScript | category: Agents | reading: 4 мин - У моего сайта теперь есть второй режим - OS. Там живет AI-ассистент, который управляет окнами и приложениями. Что это, как попасть и зачем оно вообще нужно. - [Обучение гибрида LLM и рекомендательной системы на Semantic IDs](https://igor-ya.ru/posts/semantic-ids-llm-recsys/) 2025-01-20 | tags: LLM, Recommendations, Semantic IDs, RQ-VAE, Qwen3, Retrieval, Ranking, SASRec | category: RecSys | reading: 25 мин - Как научить языковую модель понимать каталог через семантические идентификаторы и делать управляемые рекомендации с объяснениями ## Full projects index - [Платформа оценки стоимости ML‑инференса](https://igor-ya.ru/projects/ml-cost/) 2025-12-15 | tags: MLOps, Torch, ONNX, Profiling, Cost Optimization - Внутренний инструмент для профилировки latency, throughput и $/req моделей в проде - [Голосовой AI для колл-центра](https://igor-ya.ru/projects/voice-ai-contact-center/) 2025-09-28 | tags: Voice AI, Realtime GenAI, Agentic Workflow, MLOps, Call Center, RAG - On-prem голосовой AI-оператор закрывает 72% звонков без человека за 0.96 с со снижением стоимости на 58%. - [RAG-ассистент для каталога](https://igor-ya.ru/projects/rag-search/) 2025-07-15 | tags: RAG, Vector Search, LLM Serving, KServe, MLOps - MVP чат-поиск с автоматизацией деплоев, экспериментов и мониторинга качества - [Антифрод-аналитика Telegram для медиапланов](https://igor-ya.ru/projects/telegram-antifraud/) 2025-05-15 | tags: Telegram, Ad Verification, Anomaly Detection, Fraud, MLOps, Python, FastAPI - Система детекции накрутки сокращает неэффективные расходы на 24% и автоматизирует проверку 100 каналов за 12 минут - [Система поиска и рекомендаций](https://igor-ya.ru/projects/search-recommend/) 2025-04-30 | tags: Multimodal, Vector Search, MLOps, Kubernetes, Cost Optimization - Мультимодальная платформа поиска и рекомендаций с полным CI/CD-контуром, мониторингом и A/B-экспериментами ## Machine-readable endpoints - [LLM JSON Index](https://igor-ya.ru/api/llm-index.json) - [Sitemap](https://igor-ya.ru/sitemap-index.xml) - [Robots](https://igor-ya.ru/robots.txt)