Инженерная статья о слое отбора контекста вокруг GPT, Claude и Gemini: как искать, ранжировать и упаковывать PDF, таблицы, скриншоты и visual evidence для grounded LLM-ответов.
Игорь Якушев
обо мне ML-инженер | Поиск, retrieval и рекомендательные системы
Строю search, retrieval, ranking и recommender systems. Пишу про архитектуру, evaluation и production ML: статьи и кейсы про release safety, reliability и cost.
Статьи
Здесь я делюсь опытом, мыслями и практиками ML/AI систем. От архитектуры до наблюдаемости.
Практический разбор для поисковых команд: как встроить вызовы инструментов в продакшн-поиск и не потерять качество выдачи, задержки, безопасность и возможность отката.
Практический план миграции с OpenAI Assistants API на Responses API и Conversations API: сроки, новая модель объектов, состояние, retrieval, tool calling, streaming и проверка паритета.
Кейсы
Проекты с задачами, архитектурой и метриками.
Голосовой AI для колл-центра
On-prem голосовой AI-оператор закрывает 72% звонков без человека за 0.96 с со снижением стоимости на 58%.
Проблема: 600 мест в контакт-центре, ожидание 9 минут, штрафы за SLA и новые требования AI Act, регламенты устаревают быстрее, чем успевают учить операторов.
Решение: On-prem стек со стримингом, каскадом моделей, оркестрацией и базой знаний. Правила безопасности и ручная эскалация.
Платформа оценки стоимости ML‑инференса
Внутренний инструмент для профилировки latency, throughput и $/req моделей в проде
RAG-ассистент для каталога
MVP чат-поиск с автоматизацией деплоев, экспериментов и мониторинга качества
Обо мне
Я Игорь Якушев . Проектирую ML-решения, которые выдерживают трафик, экономят деньги и не ломаются в субботу ночью.
Начинал с маркетинга и бизнеса, пока не пришел к инженерии. Сейчас отвечаю за поиск и рекомендации на проде с 10+ млн запросов в сутки.
Мой фокус это системы, которые живут под нагрузкой, не ломаются и не требуют героя.
«make AI boring again»
ML инженер · System design · Продуктовый подход
Контакты
Готов к обсуждению ML‑проектов и внедрений, отвечаю лично.
Игорь Якушев
ML-инженер
обо мне Search, Retrieval, RecSys и ML в проде для систем с 10M+ запросов в день.
Быстрее всего
Написать в Telegram