ElevenLabs acaba de resolver la transcripción del habla. Su nuevo modelo, Scribe v2, es SOTA en tasa de error de palabras. Maneja pausas, risas y palabras complejas con facilidad. Es muy bueno segmentando altavoces y no cometió NINGÚN error en la prueba definitiva: voces gemelas idénticas. Cómo funciona 👇