News

Retell AI позволяет компаниям создавать «голосовых агентов» для обработки телефонных звонков

Колл-центры внедряют автоматизацию. Идет дискуссия о том, хорошо ли это, но это происходит, и возможно, ускоряется.

По данным исследовательской фирмы TechSci Research, мировой рынок искусственного интеллекта на контактных центрах к 2028 году может вырасти почти до 3 миллиардов долларов по сравнению с 2,4 миллиарда долларов в 2022 году. Тем временем последний опрос показал, что около половины колл-центров планируют в следующем году принять некоторую форму искусственного интеллекта.

Мотивация довольно очевидна: колл-центры стремятся снизить издержки, расширяя свою деятельность.

«Компании с большими операциями в колл-центрах, стремящиеся быстро расти без ограничений, связанных с контактными центрами, очень открыты для принятия эффективных решений на базе искусственного интеллекта», — сообщила TechCrunch предприниматель Эви Ван. «Этот подход не только снижает их общие издержки, но также уменьшает время ожидания».

Ван является одним из соучредителей Retell AI, который предоставляет платформу, которую компании могут использовать для создания агентов на базе искусственного интеллекта, отвечающих на телефонные звонки клиентов и выполняющих основные задачи, такие как назначение встреч. Агенты Retell работают на основе комбинации крупных языковых моделей (LLM), настроенных для использования в области обслуживания клиентов, и речевой модели, которая дает голос сгенерированному тексту LLM.

Клиентами Retell являются как операторы колл-центров, так и малые и средние предприятия, которые регулярно сталкиваются с большим объемом звонков, например компания по телемедицине Ro. Они могут создавать голосовых агентов с использованием инструментов с низкой кодовой надстановкой платформы, или загружать пользовательскую LLM (например, открытую модель, такую как Llama 3 Meta) для дальнейшей настройки опыта.

«Мы много вкладываем в опыт голосового разговора, поскольку видим в этом наиболее критический аспект опыта голосового агента AI», — сказала Ван. «Мы не считаем голосовых агентов искусственного интеллекта просто игрушками, которые можно создать с помощью нескольких строк подсказок, а скорее как инструменты, которые могут предложить существенную ценность предприятиям и заменить сложные рабочие процессы».

Retell работал достаточно хорошо в моем кратком тестировании, по крайней мере, с точки зрения обращения по телефону.

Я договорился о звонке с ботом Retell, используя демо-форму на веб-сайте Retell. Бот провел меня через процесс назначения гипотетического приема у стоматолога, задавая вопросы о моей предпочтительной дате и времени, номере телефона и так далее.

Не могу сказать, что синтетический голос бота был лучшим, что я слышал с точки зрения реализма — определенно не на уровне Eleven Labs или текст-голосового API OpenAI. (Обновление: Ван говорит мне, что Retell использует пользовательский голос ElevenLabs, что может объяснить более низкое качество.) В защиту Retell, Ван сказал, что команда больше сосредоточена на снижении задержек и решении крайних случаев, таких как прерывания, которые могут происходить в разговоре.

Задержка небольшая: в моем тесте, бот почти мгновенно отвечал на мои ответы и дополнительные вопросы. И он придерживался своего сценария. Как бы я ни старался, я не мог запутать его или привести его к поведению, которое было бы не должным. (Когда я спросил бота о моих стоматологических записях, он настаивал на том, что мне нужно поговорить с управляющим офисом).

Так будут ли платформы вроде Retell будущим колл-центров?

Может быть. Для основных задач, таких как назначение приема, автоматизация имеет много смысла, что, возможно, объясняет, почему как стартапы, так и крупные технологические фирмы предлагают решения, конкурирующие напрямую с Retell. (См. Parloa, PolyAI, Google Cloud's Contact Center AI и т. д.)

Это низко висящий — и, казалось бы, доходный — фрукт. Retell утверждает, что у них сотни клиентов, все из которых платят за минуту разговора голосового агента. Retell собрал в общей сложности 4,53 миллиона долларов капитала на сегодняшний день, благодаря инвесторам, включая Y Combinator (где компания прошла инкубацию).

Но суд призван решить более сложные запросы, особенно учитывая склонность LLM к выдумыванию фактов и отклонению от курса даже при наличии защитных мер.

По мере роста амбиций Retell я любопытен, как компания преодолеет множество хорошо установленных технических проблем в этой области. Ван, по крайней мере, выглядит уверенной в подходе Retell.

«С появлением LLM и последних достижений в области синтеза речи, разговорный искусственный интеллект становится достаточно хорошим, чтобы создавать действительно захватывающие сценарии использования», — сказала Ван. «Например, с задержкой менее одной секунды и возможностью перебивать искусственный интеллект, мы видим, что пользователи говорят полноценными предложениями и ведут разговор, как они бы это делали с другим человеком. Мы пытаемся сделать его простым для разработчиков создавать, тестировать, разворачивать и мониторить голосовых агентов AI, в конечном итоге, чтобы помочь им достичь готовности к производству».

Related Articles

Back to top button