
72% автоответов · −58% cost per call · CSAT +1.9
Голосовой AI-оператор для колл-центра
On-prem голосовой AI-оператор закрывает 72% звонков без человека за 0.96 с со снижением стоимости на 58%.
- Llama 3.1 70B NF4 (TP=2, no-MIG)
- Llama 3.1 8B INT4
- Whisper v3 streaming
- Llama Guard 2
- Coqui XTTS
- Riva FastPitch + HiFi-GAN
- Temporal
- Qdrant
- Postgres (self-hosted, Supabase stack)
- Redis Streams
- Grafana LGTM
- Проблема: 600 мест в контакт-центре, ожидание 9 минут, штрафы за SLA и новые требования AI Act, регламенты устаревают быстрее, чем успевают учить операторов.
- Решение: On-prem стек со стримингом, каскадом моделей, оркестрацией и базой знаний. Правила безопасности и ручная эскалация.