MLOps‑инфраструктура
Когда ML растет быстрее инфраструктуры
- Python
- Kubernetes
- MLflow
- GitHub Actions
- Docker
- Terraform
CI/CD для ML: auto-deploy моделей с версионированием, деплой без даунтайма, метрики через Prometheus + OTel
–37% latency
+18% к конверсии (inference)
99.9% SLA
на ~1 млн предсказаний в день
–42% cost per request
сохранив качество (BLEU)
Задачи
Решаю инженерные bottleneck'и в ML-проде
Когда ML растет быстрее инфраструктуры
CI/CD для ML: auto-deploy моделей с версионированием, деплой без даунтайма, метрики через Prometheus + OTel
LLM-инференс без просадки по latency и бюджету
–42 % cost / req через async RAG и fallback-роутинг с кешем, latency ~1.2s (Qdrant, FastAPI)
Поведенческая персонализация с real-time откликом
Real-time recsys: embedding + GBDT, кеши (Kafka, Redis), feature pipeline на базе own store
LLM-инференс без слива бюджета на каждый запрос
до –50 % cost / req через scoring-классификатор (prompt length + tokens) и кеш ответов по semantic cache
Проекты
Проекты с задачами, архитектурой и метриками.
−43% $/req · p99 latency стабилен
Внутренний инструмент для профилировки latency, throughput и $/req моделей в проде
9 % zero-result · +1.6 pp CTR · −45 % cost
MVP чат-поиск с автоматизацией деплоев, экспериментов и мониторинга качества
−33% $/QPS при 300 QPS · +54% CTR
Мультимодальная платформа поиска и рекомендаций с полным CI/CD-контуром, мониторингом и A/B-экспериментами
Обо мне
Связываю ML, продукт и здравый смысл.
Я Игорь Якушев. Проектирую ML-решения, которые выдерживают трафик, экономят деньги и не ломаются в субботу ночью.
Начинал с маркетинга и бизнеса, пока не пришел к инженерии. Сейчас отвечаю за поиск и рекомендации на проде с 10+ млн запросов в сутки.
Мой фокус это системы, которые живут под нагрузкой, не ломаются и не требуют героя.
«make AI boring again»
ML-инженер · System design · Продуктовый подход
Связаться
Готов к обсуждению ML‑проектов и внедрений, отвечаю лично.
Решения с упором на продукт и System Design. Меня привлекают задачи с потенциалом системного роста.
Быстрее всего
Написать в Telegram