Dziś oficjalnie wprowadzamy nasz nowy produkt FlowSpeech. FlowSpeech to pierwszy na świecie TTS (Text-to-Speech), który przekształca tekst pisany w mowę. Może czytać strony internetowe, recytować powieści, prezentować PPT, a także tłumaczyć obce języki. To twój AI zastępca, który zawsze może za ciebie mówić. To może nie brzmieć zbyt rewolucyjnie, ale jest to przydatny mały produkt oparty na prawdziwych problemach naszych użytkowników. Dlaczego w branży, gdzie wszyscy skupiają się na koncepcjach, modelach i rywalizacji Agentów, wybraliśmy, aby poświęcić trochę czasu na stworzenie takiego małego produktu? Jako firma zajmująca się aplikacjami AI, oczywiście chcemy stać się jednorożcem na niebie. Jednak istotą tworzenia produktów jest pomoc prawdziwym ludziom. Potrzeba FlowSpeech pochodzi od 80-letniego Amerykanina, oto jego historia. 👇
Dlaczego zdecydowaliśmy się na stworzenie takiego produktu? Pozwólcie, że najpierw podzielę się z wami prawdziwą historią. ListenHub wystartował w maju i szybko zdobyliśmy dziesięć tysięcy zarejestrowanych użytkowników. Wśród wszystkich użytkowników, najstarszym był amerykański starszy pan. Pewnego dnia zobaczył ListenHub w internecie, ale nie bardzo wiedział, jak korzystać z naszego oprogramowania, więc napisał do mnie e-mail z pytaniem, czy mamy instrukcję obsługi. Moja pierwsza reakcja była taka, że nigdy nie pomyślałem o napisaniu instrukcji do ListenHub, ponieważ jest to zbyt proste. W kręgach AI uważa się, że produkty zbyt proste są wciąż zbyt skomplikowane dla ogółu społeczeństwa. Odpisałem mu na e-mail, że obecnie nie mamy instrukcji, ale ją napiszę i wyślę mu, gdy będzie gotowa. Natychmiast otworzyłem Notion, napisałem najprostsze instrukcje, a następnie wysłałem je temu amerykańskiemu starszemu panu. Po przeczytaniu instrukcji, w końcu zaczął korzystać z ListenHub. Później wymieniliśmy jeszcze kilka e-maili, a ja stopniowo poznałem jego historię. Służył w wojsku w 1957 roku, więc w tym roku powinien mieć już ponad 80 lat. Długotrwała choroba płuc i kilka udarów mózgu sprawiły, że stracił zdolność mówienia. Ale to go nie załamało, zbudował internetową społeczność pacjentów liczącą dziesiątki tysięcy osób. Używa ListenHub jako swojego „mówiącego” pomocnika, generując treści podcastowe za pomocą AI, które dzieli się w społeczności, pomagając innym pacjentom. Podcasty są świetne, ale to tylko jedna z wielu form wyrazu. Chcemy, aby nasi użytkownicy mogli swobodnie wyrażać się głosem. Dlatego postanowiliśmy stworzyć uniwersalnego „mówiącego” pomocnika AI, który może czytać strony internetowe, recytować powieści, prezentować PPT, a także tłumaczyć obce języki. Niech twój AI pomocnik mówi za ciebie w każdej chwili. To jest początek FlowSpeech.
W rzeczywistości dzisiaj istnieje już mnóstwo usług TTS, dlaczego mielibyśmy tworzyć własną? W istocie, mowa i pismo to dwie zupełnie różne formy wyrażania języka. Napisany artykuł niekoniecznie nadaje się do odczytu, a wypowiedziane słowa niekoniecznie nadają się do zapisania w artykule. Takie teksty jak prace naukowe, relacje prasowe, odpowiedzi AI, są pisane z myślą o tym, aby je oglądać, a nie czytać. A wszystkie dostępne na rynku usługi TTS, które przekształcają tekst na mowę, po prostu odczytują tekst dosłownie. To tak, jakby prowadzić wykład; podczas wykładu nie można po prostu czytać z PPT, trzeba płynnie wyrażać to własnymi słowami. To jest zasada FlowSpeech. FlowSpeech to pierwszy na świecie TTS, który potrafi przekształcić tekst pisany w mowę. TTS, który mówi w sposób ludzki.
Dla kogo jest FlowSpeech? FlowSpeech, dzięki swojej ludzkiej zdolności do wyrażania mowy, staje się idealnym narzędziem dla następujących grup: Twórcy treści: Przekształcają artykuły na publicznych kontach, swoje bazy wiedzy w naturalne, ustne nagrania, oszczędzając mnóstwo czasu na nagrywanie i montaż. Niezależnie od tego, czy chodzi o podcasty, czy krótkie filmy, to setki razy zwiększa efektywność. Miłośnicy audiobooków: Przekształcają powieści, eseje i inne dzieła literackie w ekspresyjne audiobooki, które brzmią jak prawdziwe opowieści, oferując niezrównane doświadczenie słuchania. Użytkownicy biznesowi: Używają do tworzenia materiałów szkoleniowych, prezentacji produktów, powiadomień dla klientów, interpretacji raportów finansowych i innych treści głosowych, przekształcając nudne informacje w zrozumiałe dla klientów i pracowników. Deweloperzy aplikacji: Dodają wersje audio do swoich treści, aby starsi i dzieci mogli łatwo uzyskać informacje, oferując użytkownikom większą wartość. Edukatorzy: Przekształcają materiały dydaktyczne, podręczniki, prace naukowe i dokumenty techniczne w łatwe do zrozumienia wykłady ustne, co sprawia, że nauka staje się bardziej efektywna i immersyjna. Szczególnie nadaje się do tworzenia nagrań kursów i podcastów edukacyjnych. Mówiąc prosto, FlowSpeech to twój AI zastępca głosowy. W każdej sytuacji, w której potrzebne jest przekształcenie tekstu w mowę, FlowSpeech może przynieść rewolucyjne poprawy w doświadczeniu.
Jak używać FlowSpeech? Po prostu odwiedź stronę w przeglądarce, aby korzystać z niej bezpośrednio w internecie. iOS do pobrania: Wyszukaj ListenHub w App Store, aby pobrać, FlowSpeech będzie dostępny w aplikacji w przyszłym tygodniu. Pobieranie na Androida: Intensywnie w trakcie rozwoju, wkrótce dostępne. A co z… API? Wielu przyjaciół pyta nas, czy dźwięki w ListenHub mogą być udostępnione jako API, aby można je było zintegrować z własnym produktem? Kiedy korzystam z ChatWise i Cherry Studio, często myślę, że chciałbym, aby nasz AI prezenter odczytał odpowiedzi, a dzisiaj w końcu to możliwe. Tak, wkrótce uruchomimy usługę TTS API FlowSpeech, czekajcie na to.
385,74K