Обо мне

Здесь собраны мой текущий фокус, последние проекты и путь от бизнеса к машинному обучению.

Search · RecSys · MLOps · LLM Evals · 6+ лет опыта

Игорь Якушев

Senior ML Engineer | Search, Retrieval, Ranking, Recommender Systems

Строю поиск, рекомендации и NLP/GenAI-системы на реальном трафике. Закрываю архитектуру, эксперименты, evals и rollout на стыке product, data и infra.

01 10M+ запросов в день
поиск и рекомендации
02 End-to-end ownership
архитектура, эксперименты, релизы
03 NLP и evals
качество, регрессии
  • Границы и контракты

    Начинаю с границ системы: данные, serving, fallback и точки отказа.

  • Evals перед релизом

    Изменения проходят через eval-наборы, regressions, online-метрики, canary и rollback.

  • Решения через ограничения

    Приоритеты определяю через latency, cost, SLO, throughput и влияние на продуктовые метрики.

Посмотреть все
  • Ranking и recsys

    Качество выдачи под ограничениями по задержке, стоимости и cold start.

  • Эксперименты

    A/B-тесты, online-метрики и решения, проверенные цифрами.

  • Надежность

    SLO, мониторинг, трассировка и работа с инцидентами.

  • Задержка и стоимость

    Бюджеты задержки, throughput и стоимость инференса.

  • NLP и GenAI

    Классификация, генерация, RAG и agent flows с evals.

  • Продукт и экономика

    Технические решения, привязанные к выручке, unit-экономике и метрикам.

От бизнеса к машинному обучению

Ключевые переходы, которые сформировали мой подход к архитектуре, релизам и эксплуатации ML-систем.

2010–2013

Мышление

У меня никогда не было мечты "стать программистом". Меня интересовали системы и почему они работают именно так.

Инженерное образование, которое я закончил в 2012, не дало великого откровения, но научило главному: разбирать сложное на части и искать закономерности.

В 20 лет стал работать внутри крупного государственного механизма и увидел, как решения зависят не от людей, а от регламентов, согласований и кучи бумаг.

  • Эффективность возникает из структуры, а не из старания
2013–2016

Собрал бизнес

Я запустил агентство в сфере digital-маркетинга и довольно быстро оказался в точке, где рост начал поедать эффективность.

На старте все делалось руками через чаты: правки по 10 кругов, дедлайны в Excel. Никакого трекинга, только "кто помнит, тот и прав".

Когда команда выросла с 5 до 30+ человек, я охуел - половина времени уходила на тушение пожаров и пересылку задач между людьми.

Пришлось перепроектировать все. Разбил бизнес-процессы на четкие этапы, внедрил CRM и убрал ручные отчеты, заменив их скриптами. Чтобы быстрее проверять свои гипотезы, сам внедрял API и писал скрипты для сотрудников.

С переходом на системный подход рентабельность выросла на 22%, а количество просроченных задач в проектах упало почти до нуля.

Я понял: структура это сила, она масштабируется, люди - нет.

  • Управлял сложностью через структуру, не людей
  • Кодил, чтобы убрать зависимость от рук
2016–2019

От бизнеса к коду

Рынок digital смещался в сторону рекомендательных систем, Big Data и автоматизации. Я видел, что за этим будущее, и пытался перестроить агентство под разработку: брали стартапы, собирали продуктовые сайты, заходили в аутстафф.

Все чаще стал писать код сам. В IT было то, чего мне не хватало в маркетинге - прозрачная логика. Есть вход, есть код, есть результат.

Понял, что развернуть агентскую модель не получится - начал собирать собственные it-проекты. Делал парсеры и ботов на Python, собирал сервисы, чтобы проверять, как связать данные из SQL, логику и автоматизацию в рабочую систему.

Мои запуски были инженерно-стартаперскими экспериментами: как устроена система, где она ломается, как упростить и масштабировать. Мне было важно только одно: чтобы технически все работало не один раз, а всегда.

  • Ушел к системам, где результат зависит от логики, а не вкуса
  • Сформировал подход: работает - значит не ломается, даже без меня
2019–2021

Прыжок в ML

В 2019 я собрал первую ML-модель из говна, палок и форумных датасетов. Это была нейросеть на Keras, генерирующая музыку. Работала коряво, но главное - генерировала сама.

Гайды тогда уже были, но разрозненные: Jupyter, Colab, статьи по TensorFlow. Попробовал собрать инфраструктуру вокруг и понял, что без системных знаний дальше не продвинуться.

Меня интересовала инженерная сторона ML и Data Science: как устроена инфраструктура, как модели проходят путь от обучения до продакшна.

Чтобы разобраться в этом на практике, гонял мини-сервисы на Heroku, но увидел предел: хотелось понять, как держатся системы с большим трафиком, где сбой стоит денег. Решил идти за знаниями Big Tech. В тот момент технических вакансий не было, но опыт в маркетинге дал возможность зайти через Google, где я отвечал за маркетинговую аналитику и цифровые продукты.

Внутри я прошел ML-программы - сначала теоретически, потом на продовых инструментах. Отсюда и первый опыт с BigQuery, пайплайны на Airflow, тестировал TFX. Разбирался, как устроены реальные системы: деплой, логирование, требования к стабильности. Это дало фундамент для системного подхода к ML-инфраструктуре.

  • ML без инфраструктуры - игрушка
  • Фокус: проектировать решения, которые работают под нагрузкой
2021–2024

ML в проде

Google закрыл офис. Предложили релокацию, но снова в маркетинг, отказался: хочу не обслуживать ML, а отвечать за архитектуру и прод.

С мая 2022 отвечал за ML-цепочку в B2B-платформе. Строил модули для ценообразования, генерации описаний и прогноза спроса на XGBoost и Scikit-learn. Спроектировал end-to-end пайплайн с auto-retrain, fallback и сквозным мониторингом, обеспечил SLA 99.9 % при ~1 млн предсказаний в сутки.

В 2023 присоединился к команде инженеров AI-платформы для e-commerce. Работал над архитектурой мультимодального поиска и рекомендаций: от выращивания эмбеддингов до онлайн-ранжирования.

Под капотом CLIP-модели и LLM превращают текст и изображение запроса в унифицированные векторы, быстрый FAISS-индекс поднимает кандидатов, а сверху их доранжирует гибрид BM25 + нейросеть.

Реализовал онлайн-дообучение на кликах: CTR вырос на 14 %, инфраструктурные затраты упали на 30 %.

2024–сейчас

Архитектура, которой доверяют

Сейчас отвечаю за поиск и рекомендации в e-commerce с трафиком 10 млн запросов в сутки. Инференс на Triton, Faiss + CLIP, rerank BM25, recsys в ONNX. Любая ошибка это минус в выручке.

Фокус на платформенной архитектуре для ML-продуктов: автообновляемые пайплайны, наблюдаемость, отказоустойчивость. Я строю так, чтобы инженер не затыкал баги.

Финальный тест для архитектуры когда она работает, даже если ты в отпуске.

Где применяли мой опыт

ViSenze – AI-платформа для визуального поиска e-commerceHuawei – телеком и инфраструктураOzon – маркетплейс и e-commerceGoogle – глобальный лидер в MLMedia Instinct – маркетинговое агентство

Рекомендованные статьи

Разбор архитектуры ML/LLM-систем: решения, риски, эксплуатация.

Контакты

Готов к обсуждению ML‑проектов и внедрений, отвечаю лично.

Игорь Якушев
ML инженер

Мое текущее время: --:-- Amsterdam
Фото Игоря Якушева, ML инженера обо мне

Search, RecSys, MLOps, evals и ML-системы под нагрузкой.

  • LinkedIn
  • Google Scholar
  • CV
  • GitHub
  • igor.ykshv@gmail.com

Быстрее всего

Написать в Telegram