Hoy lanzamos oficialmente nuestro nuevo producto FlowSpeech. FlowSpeech es el primer TTS del mundo que convierte texto escrito en habla. Puede leer páginas web, narrar novelas, presentar PPT y también traducir idiomas extranjeros. Es tu boca AI, lista para hablar por ti en cualquier momento. Esto puede no sonar muy impresionante, pero se trata de un pequeño producto útil basado en las verdaderas necesidades de nuestros usuarios reales. ¿Por qué, mientras la industria se enfoca en conceptos, persigue modelos y compite con agentes, hemos decidido dedicar un poco de tiempo a crear un pequeño producto como este? Como empresa de aplicaciones de IA, por supuesto, esperamos convertirnos en un unicornio en el cielo. Pero la esencia de hacer productos es ayudar a personas reales. La necesidad de FlowSpeech proviene de un anciano estadounidense de 80 años, esta es su historia.👇
¿Por qué hacer un producto así? Primero, quiero compartir con ustedes una historia real. Después de que ListenHub se lanzó en mayo, rápidamente tuvimos diez mil usuarios registrados. Entre todos los usuarios, el de mayor edad es un anciano estadounidense. Un día, vio ListenHub en línea, pero no sabía cómo usar nuestro software, así que me escribió un correo preguntando si había un tutorial de uso. Mi primera reacción fue que nunca había pensado en escribir un tutorial para ListenHub, porque es demasiado simple. En el mundo de la IA, se considera que los productos demasiado simples son complicados para el público en general. Así que respondí a su correo diciendo: actualmente no tenemos un tutorial, pero lo escribiré y se lo enviaré. Inmediatamente abrí Notion, escribí el tutorial más simple y se lo envié a este anciano estadounidense. Después de leer el tutorial, finalmente pudo usar ListenHub. Luego intercambiamos varios correos y poco a poco fui conociendo su historia. Se alistó en 1957 y este año debería tener más de 80 años. Una enfermedad pulmonar fibrosante a largo plazo y varios accidentes cerebrovasculares le han hecho perder la capacidad de hablar. Pero eso no lo ha derrumbado; ha creado una comunidad en línea de miles de pacientes. Utiliza ListenHub como su boca, generando contenido de podcast con IA, y lo comparte en la comunidad para ayudar a otros pacientes. El podcast es genial, pero es solo una de las muchas formas de expresión. Esperamos que nuestros usuarios puedan expresarse libremente con su voz. Así que decidimos crear un sustituto de boca de IA universal, que pueda leer páginas web, narrar novelas, presentar PPT y traducir idiomas extranjeros. Deja que tu sustituto de boca de IA hable por ti en cualquier momento. Así nació FlowSpeech.
En realidad, hoy en día ya hay una gran cantidad de servicios de TTS, ¿por qué deberíamos crear uno nosotros mismos? En esencia, el lenguaje hablado y el escrito son dos formas de expresión lingüística completamente diferentes. Un artículo escrito no siempre es adecuado para ser leído en voz alta, y lo que se dice no siempre es adecuado para ser escrito. Textos como ensayos, reportajes de noticias y respuestas de IA están destinados a ser vistos, no a ser leídos. Y todos los servicios de TTS disponibles en el mercado simplemente leen el texto según su pronunciación literal. Es como dar un discurso; nunca se debe leer un PPT palabra por palabra, sino que se debe presentar de manera fluida con tus propias palabras. Esa es la esencia de FlowSpeech. FlowSpeech es el primer TTS en el mundo que puede convertir el lenguaje escrito en lenguaje hablado. Un TTS que habla con humanidad.
¿Para quién es adecuado FlowSpeech? La capacidad de expresión oral con un toque humano de FlowSpeech lo convierte en una herramienta ideal para los siguientes grupos: Creadores de contenido: convierte artículos de WeChat, tu propia base de conocimientos, en audio natural y conversacional, ahorrando una gran cantidad de tiempo en grabación y edición. Ya sea para hacer un podcast o un video corto, es un aumento de eficiencia por cien. Aficionados a los audiolibros: convierte novelas, ensayos y otras obras literarias en audiolibros expresivos, que se asemejan a la narración de una persona real, ofreciendo una experiencia de escucha sin precedentes. Usuarios empresariales: se utiliza para crear materiales de formación interna, presentaciones de productos, notificaciones a clientes, interpretaciones de informes financieros y otros contenidos de voz, explicando contenido aburrido en un lenguaje comprensible, para que clientes y empleados lo entiendan de inmediato. Desarrolladores de aplicaciones: añaden versiones de audio a su contenido, facilitando el acceso a la información para ancianos y niños, proporcionando un mayor valor a los usuarios. Educadores: convierten presentaciones, libros de texto, artículos académicos y documentos técnicos en explicaciones orales fáciles de entender, haciendo que el aprendizaje sea más eficiente e inmersivo. Especialmente adecuado para crear audios de cursos y podcasts de conocimiento. En pocas palabras, FlowSpeech es tu sustituto de voz AI. En cualquier escenario que requiera convertir texto a voz, FlowSpeech puede ofrecer una mejora revolucionaria en la experiencia.
¿Cómo usar FlowSpeech? Simplemente accede a través del navegador y podrás usarlo directamente en la página web. Descarga para iOS: Busca ListenHub en la App Store para descargar, FlowSpeech estará disponible en la app la próxima semana. Descarga para Android: Actualmente en desarrollo, estará disponible pronto. ¿Y… hay API? Muchos amigos nos preguntan si el sonido en ListenHub se puede convertir en API para integrarlo en sus propios productos. Cuando uso ChatWise y Cherry Studio, a menudo quiero que nuestro presentador de IA lea las respuestas en voz alta, y hoy, finalmente es posible. Sí, estamos a punto de lanzar el servicio TTS API de FlowSpeech, estén atentos.
385,81K