L'entrée vocale d'aujourd'hui montre vraiment à quel point le fait de bien gérer les cas particuliers dans les produits vaut les rendements apparemment décroissants sur le raffinement de l'UX au-delà de "suffisamment bon". J'avais l'habitude de détester la dictée et d'autres formats d'entrée vocale en texte jusqu'à la dernière génération de produits AI. Je le rationalisais en trouvant ça bizarre de parler à un ordinateur, mais j'ai réalisé maintenant que le problème était la qualité de la transcription (entrée) et la compréhension du contexte (sortie). Maintenant que la transcription est presque parfaite et que les LLM peuvent réellement extraire ce que je veux dire à partir de divagations non structurées, il est clair que c'est supérieur dans la plupart des situations par rapport à la saisie.