# Игорь Якушев
> Практические статьи и кейсы по ML-инженерии: MLOps, GenAI/RAG, рекомендации. Опыт с 10M+ запросов в день. Результаты: +14% конверсия, −40% latency.

- Locale: ru
- Canonical: https://igor-ya.ru/
- Alternate locale: https://igor-ya.com/
- Generated: 2026-02-19T22:58:15.385Z

## Core pages
- [Главная](https://igor-ya.ru/) - Практические статьи и кейсы по ML-инженерии: MLOps, GenAI/RAG, рекомендации. Опыт с 10M+ запросов в день. Результаты: +14% конверсия, −40% latency.
- [Обо мне](https://igor-ya.ru/about/) - Senior ML Engineer: поиск и рекомендации на 10M+ запросов в день. Опыт в Google, ViSenze, Ozon. Фокус: архитектура production ML.
- [Статьи](https://igor-ya.ru/posts/) - Практические статьи по ML-инженерии из продакшен-опыта: архитектура систем, практики MLOps, кейсы. Узнайте паттерны, антипаттерны и решения с метриками.
- [Проекты](https://igor-ya.ru/projects/) - Кейсы production ML: GenAI/RAG, MLOps и рекомендательные системы. В каждом кейсе: проблема, архитектура и измеримый результат.
- [Для найма](https://igor-ya.ru/formats/) - Открыт к full-time Senior/Staff ML Engineer. Системный дизайн и end-to-end ownership для Search, Ranking, Recsys, GenAI/RAG и MLOps.

## Latest posts
- [Агент или workflow: как выбрать архитектуру без хайпа](https://igor-ya.ru/posts/agent-vs-workflow-architecture-framework/) 2026-02-18 | tags: LLM, Agents, Workflow, System Design, AgentOps, Evals, AI Security, FinOps | category: Agents | reading: 12 мин
  - Подробный инженерный фреймворк выбора между workflow и агентом: критерии, архитектурные паттерны, evals, безопасность, стоимость и план внедрения.
- [MLOps для RAG-агента поддержки в 2026: релизы, безопасность и стоимость](https://igor-ya.ru/posts/mlops-rag-agent-support-release-gates-security-cost-2026/) 2026-02-10 | tags: MLOps, RAG, AgentOps, LLMOps, AI Security, Observability, FinOps | category: MLOps | reading: 34 мин
  - Практический гайд по запуску RAG-агента поддержки с tool-calls: архитектурный контракт, release-gates, policy-контроль, observability и FinOps.
- [MLOps для production ML: 7 релизных гейтов для управляемой выкладки](https://igor-ya.ru/posts/mlops-release-gates-production-ml/) 2025-12-26 | tags: MLOps, Model Registry, CI/CD, Observability, Drift Detection, FinOps, SRE, AI Security | category: MLOps | reading: 13 мин
  - Практический каркас MLOps для релиза модели: какие гейты обязательны до выкладки, как держать качество, SLO и стоимость под контролем.
- [Навайбкодил: igorOS - ПК с агентом](https://igor-ya.ru/posts/igoros-alternative-site/) 2025-12-15 | tags: Web OS, Tool calling, UX, React, TypeScript | category: Agents | reading: 4 мин
  - У моего сайта теперь есть второй режим - OS. Там живет AI-ассистент, который управляет окнами и приложениями. Что это, как попасть и зачем оно вообще нужно.
- [Обучение гибрида LLM и рекомендательной системы на Semantic IDs](https://igor-ya.ru/posts/semantic-ids-llm-recsys/) 2025-01-20 | tags: LLM, Recommendations, Semantic IDs, RQ-VAE, Qwen3, Retrieval, Ranking, SASRec | category: RecSys | reading: 25 мин
  - Как научить языковую модель понимать каталог через семантические идентификаторы и делать управляемые рекомендации с объяснениями

## Latest projects
- [Платформа оценки стоимости ML‑инференса](https://igor-ya.ru/projects/ml-cost/) 2025-12-15 | tags: MLOps, Torch, ONNX, Profiling, Cost Optimization
  - Внутренний инструмент для профилировки latency, throughput и $/req моделей в проде
- [Голосовой AI для колл-центра](https://igor-ya.ru/projects/voice-ai-contact-center/) 2025-09-28 | tags: Voice AI, Realtime GenAI, Agentic Workflow, MLOps, Call Center, RAG
  - On-prem голосовой AI-оператор закрывает 72% звонков без человека за 0.96 с со снижением стоимости на 58%.
- [RAG-ассистент для каталога](https://igor-ya.ru/projects/rag-search/) 2025-07-15 | tags: RAG, Vector Search, LLM Serving, KServe, MLOps
  - MVP чат-поиск с автоматизацией деплоев, экспериментов и мониторинга качества
- [Антифрод-аналитика Telegram для медиапланов](https://igor-ya.ru/projects/telegram-antifraud/) 2025-05-15 | tags: Telegram, Ad Verification, Anomaly Detection, Fraud, MLOps, Python, FastAPI
  - Система детекции накрутки сокращает неэффективные расходы на 24% и автоматизирует проверку 100 каналов за 12 минут
- [Система поиска и рекомендаций](https://igor-ya.ru/projects/search-recommend/) 2025-04-30 | tags: Multimodal, Vector Search, MLOps, Kubernetes, Cost Optimization
  - Мультимодальная платформа поиска и рекомендаций с полным CI/CD-контуром, мониторингом и A/B-экспериментами

## Full posts index
- [Агент или workflow: как выбрать архитектуру без хайпа](https://igor-ya.ru/posts/agent-vs-workflow-architecture-framework/) 2026-02-18 | tags: LLM, Agents, Workflow, System Design, AgentOps, Evals, AI Security, FinOps | category: Agents | reading: 12 мин
  - Подробный инженерный фреймворк выбора между workflow и агентом: критерии, архитектурные паттерны, evals, безопасность, стоимость и план внедрения.
- [MLOps для RAG-агента поддержки в 2026: релизы, безопасность и стоимость](https://igor-ya.ru/posts/mlops-rag-agent-support-release-gates-security-cost-2026/) 2026-02-10 | tags: MLOps, RAG, AgentOps, LLMOps, AI Security, Observability, FinOps | category: MLOps | reading: 34 мин
  - Практический гайд по запуску RAG-агента поддержки с tool-calls: архитектурный контракт, release-gates, policy-контроль, observability и FinOps.
- [MLOps для production ML: 7 релизных гейтов для управляемой выкладки](https://igor-ya.ru/posts/mlops-release-gates-production-ml/) 2025-12-26 | tags: MLOps, Model Registry, CI/CD, Observability, Drift Detection, FinOps, SRE, AI Security | category: MLOps | reading: 13 мин
  - Практический каркас MLOps для релиза модели: какие гейты обязательны до выкладки, как держать качество, SLO и стоимость под контролем.
- [Навайбкодил: igorOS - ПК с агентом](https://igor-ya.ru/posts/igoros-alternative-site/) 2025-12-15 | tags: Web OS, Tool calling, UX, React, TypeScript | category: Agents | reading: 4 мин
  - У моего сайта теперь есть второй режим - OS. Там живет AI-ассистент, который управляет окнами и приложениями. Что это, как попасть и зачем оно вообще нужно.
- [Обучение гибрида LLM и рекомендательной системы на Semantic IDs](https://igor-ya.ru/posts/semantic-ids-llm-recsys/) 2025-01-20 | tags: LLM, Recommendations, Semantic IDs, RQ-VAE, Qwen3, Retrieval, Ranking, SASRec | category: RecSys | reading: 25 мин
  - Как научить языковую модель понимать каталог через семантические идентификаторы и делать управляемые рекомендации с объяснениями

## Full projects index
- [Платформа оценки стоимости ML‑инференса](https://igor-ya.ru/projects/ml-cost/) 2025-12-15 | tags: MLOps, Torch, ONNX, Profiling, Cost Optimization
  - Внутренний инструмент для профилировки latency, throughput и $/req моделей в проде
- [Голосовой AI для колл-центра](https://igor-ya.ru/projects/voice-ai-contact-center/) 2025-09-28 | tags: Voice AI, Realtime GenAI, Agentic Workflow, MLOps, Call Center, RAG
  - On-prem голосовой AI-оператор закрывает 72% звонков без человека за 0.96 с со снижением стоимости на 58%.
- [RAG-ассистент для каталога](https://igor-ya.ru/projects/rag-search/) 2025-07-15 | tags: RAG, Vector Search, LLM Serving, KServe, MLOps
  - MVP чат-поиск с автоматизацией деплоев, экспериментов и мониторинга качества
- [Антифрод-аналитика Telegram для медиапланов](https://igor-ya.ru/projects/telegram-antifraud/) 2025-05-15 | tags: Telegram, Ad Verification, Anomaly Detection, Fraud, MLOps, Python, FastAPI
  - Система детекции накрутки сокращает неэффективные расходы на 24% и автоматизирует проверку 100 каналов за 12 минут
- [Система поиска и рекомендаций](https://igor-ya.ru/projects/search-recommend/) 2025-04-30 | tags: Multimodal, Vector Search, MLOps, Kubernetes, Cost Optimization
  - Мультимодальная платформа поиска и рекомендаций с полным CI/CD-контуром, мониторингом и A/B-экспериментами

## Machine-readable endpoints
- [LLM JSON Index](https://igor-ya.ru/api/llm-index.json)
- [Sitemap](https://igor-ya.ru/sitemap-index.xml)
- [Robots](https://igor-ya.ru/robots.txt)