Hôm nay sản phẩm mới của chúng tôi FlowSpeech chính thức ra mắt FlowSpeech là TTS đầu tiên trên thế giới chuyển đổi văn bản thành lời nói. Nó có thể đọc trang web, có thể đọc tiểu thuyết, có thể thuyết trình PPT, và còn có thể dịch ngoại ngữ. Nó là miệng thay thế AI của bạn, luôn sẵn sàng nói thay bạn. Nghe có vẻ không quá ấn tượng, nhưng nó thực sự là một sản phẩm nhỏ hữu ích được xây dựng dựa trên những nỗi đau thực sự của người dùng thực sự. Tại sao trong khi ngành công nghiệp đang thổi phồng khái niệm, theo đuổi mô hình, và cạnh tranh với Agent, chúng tôi lại chọn dành một chút thời gian để làm một sản phẩm nhỏ như vậy? Là một công ty ứng dụng AI, chúng tôi tất nhiên hy vọng mình sẽ trở thành kỳ lân trên bầu trời. Nhưng bản chất của việc làm sản phẩm là giúp đỡ từng người thực sự. Nhu cầu về FlowSpeech đến từ một cụ ông 80 tuổi người Mỹ, đây là câu chuyện của ông ấy. 👇
Tại sao lại làm ra một sản phẩm như vậy? Để tôi chia sẻ với mọi người một câu chuyện có thật. Sau khi ListenHub ra mắt vào tháng 5, chúng tôi nhanh chóng có được một vạn người dùng đăng ký. Trong số tất cả người dùng, người lớn tuổi nhất là một ông lão người Mỹ. Một ngày nọ, ông ấy thấy ListenHub trên mạng, nhưng không biết cách sử dụng phần mềm của chúng tôi, nên đã viết email hỏi tôi có hướng dẫn sử dụng không. Phản ứng đầu tiên của tôi là tôi chưa bao giờ nghĩ đến việc viết hướng dẫn cho ListenHub, vì nó quá đơn giản. Trong giới AI, mọi người đều cho rằng sản phẩm quá đơn giản, nhưng trong mắt công chúng, nó vẫn phức tạp đến mức không biết bắt đầu từ đâu. Vì vậy, tôi đã trả lời email của ông ấy rằng: hiện tại chúng tôi chưa có hướng dẫn, nhưng tôi sẽ viết một cái, và gửi cho ông ấy khi hoàn thành. Tôi ngay lập tức mở Notion, viết một hướng dẫn đơn giản nhất, rồi gửi cho ông lão người Mỹ đó. Ông ấy đã xem xong hướng dẫn và cuối cùng đã sử dụng được ListenHub. Sau đó, chúng tôi đã trao đổi qua email nhiều lần, và tôi cũng dần hiểu được câu chuyện của ông ấy. Ông ấy đã tham gia quân đội vào năm 1957, năm nay chắc đã hơn 80 tuổi. Bệnh xơ phổi mãn tính và nhiều lần đột quỵ đã khiến ông mất khả năng nói. Nhưng điều đó không làm ông gục ngã, ông đã thành lập một cộng đồng bệnh nhân trực tuyến với hàng chục nghìn người. Ông ấy sử dụng ListenHub như một cái miệng thay thế, dùng AI để tạo nội dung podcast, chia sẻ trong cộng đồng, giúp đỡ các bệnh nhân khác. Podcast rất tốt, nhưng chỉ là một trong hàng ngàn cách biểu đạt. Chúng tôi hy vọng người dùng của mình có thể tự do thể hiện bằng giọng nói. Vì vậy, chúng tôi quyết định làm một cái miệng thay thế AI đa năng, có thể đọc trang web, có thể đọc tiểu thuyết, có thể thuyết trình PPT, và còn có thể dịch ngoại ngữ. Hãy để cái miệng thay thế AI của bạn nói thay bạn bất cứ lúc nào. Đó chính là nguồn gốc của FlowSpeech.
Thực ra hôm nay đã có rất nhiều dịch vụ TTS, vậy tại sao chúng ta phải tự làm một cái? Về bản chất, ngôn ngữ nói và ngôn ngữ viết là hai hình thức biểu đạt ngôn ngữ hoàn toàn khác nhau. Bài viết không nhất thiết phải phù hợp để phát thanh, và những gì được nói ra cũng không nhất thiết phải phù hợp để viết thành bài. Như các bài luận, tin tức, câu trả lời của AI, những văn bản này đều nhằm mục đích để người khác xem, chứ không phải để người khác đọc. Và hiện tại, tất cả các dịch vụ chuyển đổi văn bản thành giọng nói TTS trên thị trường chỉ đơn thuần là đọc văn bản theo cách phát âm của nó. Điều này giống như khi diễn thuyết, trong khi diễn thuyết, bạn không thể chỉ đọc theo PPT, mà phải diễn đạt bằng lời nói của chính mình một cách trôi chảy. Đó chính là nguyên lý của FlowSpeech. FlowSpeech là TTS đầu tiên trên thế giới có thể chuyển đổi ngôn ngữ viết thành ngôn ngữ nói. Một TTS có khả năng nói chuyện một cách tự nhiên.
FlowSpeech phù hợp với ai? FlowSpeech có khả năng diễn đạt ngôn ngữ tự nhiên, khiến nó trở thành công cụ lý tưởng cho các nhóm người sau: Người sáng tạo nội dung: Chuyển đổi bài viết trên公众号, kho kiến thức của bản thân thành âm thanh tự nhiên, tiết kiệm rất nhiều thời gian ghi âm và chỉnh sửa. Dù là làm podcast hay video ngắn, đều mang lại hiệu suất gấp trăm lần. Người yêu sách nói: Chuyển đổi tiểu thuyết, văn xuôi và các tác phẩm văn học khác thành sách nói đầy biểu cảm, gần gũi với giọng kể của con người, chưa bao giờ có trải nghiệm nghe sách tốt như vậy. Người dùng doanh nghiệp: Dùng để sản xuất tài liệu đào tạo nội bộ, giới thiệu sản phẩm, thông báo khách hàng, giải thích báo cáo tài chính và các nội dung âm thanh khác, biến những nội dung khô khan thành ngôn ngữ dễ hiểu, giúp khách hàng và nhân viên dễ dàng tiếp nhận. Nhà phát triển ứng dụng: Thêm phiên bản âm thanh cho nội dung của mình, giúp người cao tuổi và trẻ em dễ dàng tiếp cận thông tin, mang lại giá trị cao hơn cho người dùng. Giáo viên: Chuyển đổi tài liệu giảng dạy, sách giáo khoa, luận văn, tài liệu kỹ thuật thành bài giảng dễ hiểu, giúp việc học tập hiệu quả và hấp dẫn hơn. Đặc biệt phù hợp để sản xuất âm thanh cho khóa học, podcast kiến thức. Nói một cách đơn giản, FlowSpeech chính là "miệng" AI của bạn. Bất kỳ tình huống nào cần chuyển đổi văn bản thành giọng nói, FlowSpeech đều có thể mang lại trải nghiệm cách mạng.
FlowSpeech làm thế nào để sử dụng? Chỉ cần truy cập trực tiếp trên trình duyệt là có thể sử dụng ngay trên trang web. iOS Tải về: Tìm kiếm ListenHub trên App Store để tải về, FlowSpeech sẽ có mặt trên ứng dụng vào tuần tới. Tải về Android: Đang trong quá trình phát triển, sắp ra mắt. Còn… có API không? Nhiều bạn hỏi chúng tôi, liệu âm thanh trong ListenHub có thể làm thành API để tích hợp vào sản phẩm của mình không? Khi tôi sử dụng ChatWise và Cherry Studio, tôi thường muốn AI phát thanh viên của chúng tôi đọc câu trả lời, và hôm nay, cuối cùng đã có thể thực hiện điều đó. Đúng vậy, chúng tôi sắp ra mắt dịch vụ TTS API của FlowSpeech, hãy chờ đón.
385,74K