Сегодня на Yandex Neuro Scale 2025 наша
Агентские платформы уже какое‑то время находятся на пике популярности. Поэтому с одной стороны нашей задачей было учесть уже сформированные лидерами отрасли лучшие практики. А с другой — обобщить собственный опыт разработки и внедрения агентов, использующих большие языковые модели, и избавить разработчиков от проблем при инференсе.
Вместе с коллегами из команды разработки Анастасией Каримовой и Дмитрием Рыбалко покажем, как это устроено под капотом:
— какие особенности эксплуатации нам нужно было учесть, чтобы найти баланс между производительностью и качеством;
— как мы сталкивались с особенностями опенсорс‑инструментов для ML и учились справляться с этим разными способами;
— как мы упростили создание голосовых агентов и заодно уменьшили latency запросов.