ElevenLabs, una startup que desarrolla herramientas impulsadas por inteligencia artificial para crear y editar voces sintéticas, está poniendo su aplicación Reader a disposición en todo el mundo con soporte para 32 idiomas.
La aplicación, lanzada por primera vez en junio en Estados Unidos, Reino Unido y Canadá, permite a los usuarios subir cualquier contenido de texto, como artículos, documentos PDF o libros electrónicos, y escucharlo en diferentes idiomas y voces. Reader ahora admite idiomas como portugués, español, francés, hindi, alemán, japonés, árabe, coreano, italiano, tamil y sueco.
ElevenLabs, que se convirtió en un 'unicornio' a principios de este año tras recaudar $80 millones de inversores como Andreessen Horowitz, proporciona una API que las empresas pueden utilizar para varios casos de uso como doblaje o texto a voz. La compañía alimenta las interacciones de voz en el Rabbit r1, así como las funciones de texto a voz en el motor de búsqueda impulsado por IA Perplexity y las plataformas de audio PocketFM y KukuFM. La aplicación Reader es su primer producto dirigido al consumidor.
La startup dijo que ha añadido cientos de nuevas voces de su biblioteca que se adaptan a diferentes idiomas. El mes pasado, la compañía licenció las voces de actores como Judy Garland, James Dean, Burt Reynolds y Sir Laurence Olivier para la aplicación.
ElevenLabs dijo que el soporte ampliado de idiomas está impulsado por su modelo Turbo v2.5, lanzado el mes pasado, que supuestamente reduce la latencia de la conversión de texto a voz y mejora la calidad.
El rival más cercano de la aplicación Reader es Speechify, que ofrece características adicionales como escanear documentos para texto, integraciones con Gmail y Canvas, además de permitir a los usuarios clonar su propia voz para leer texto. La aplicación de audio de Pocket de propiedad de Mozilla y la aplicación de audio basada en Audm de The New York Times también permiten a los usuarios escuchar contenido.
ElevenLabs dijo que añadirá más características a la aplicación, como soporte sin conexión y la capacidad de compartir fragmentos de audio.