Une App pour convertir la voix en texte grâce à l'IA avec Chuchotis
Par June Cantillon - Publié le
La transcription audio est loin d'être une nouveauté, mais les progrès récents de l'intelligence artificielle a permis de proposer des outils de plus en plus performants. Un développeur s'est appuyé sur les algorithmes d'OpenAI afin de proposer sa propre application sur les Mac Apple Silicon.
En sus des intelligences artificielles génératives, les travaux d'OpenAI afin de fournir des algorithmes d'apprentissage automatique les plus performants possibles permettent également de faire progresser des technologies que l'on utilise depuis de nombreuses années, dont la transcription audio. Pour cela, OpenAI propose son moteur de transcription Whisper boosté à l'IA et capable d'offrir des résultats bluffants, y compris sur des requêtes et textes compliqués.
Chuchotis, l'App du développeur et ancien chercheur publiant sous le nom Azertiop, s'appuie donc sur le moteur Whisper d'OpenAI et propose la transcription à partir de fichiers audio et vidéo dans 100 langues (les 99 de Whisper ainsi que le Suisse Allemand) en texte au format DOCX, RTF ou SRT (pour des pistes de sous-titres).
Chuchotis est d'ores et déjà disponible en téléchargement sur le Mac App Store au tarif de 29,99 euros. Le programme nécessite 4,3 Go d'espace de stockage libre sur un Mac doté d'une puce Apple Silicon sous macOS 12.0 minimum.
Chuchotis convertit la voix en texte sur Mac
En sus des intelligences artificielles génératives, les travaux d'OpenAI afin de fournir des algorithmes d'apprentissage automatique les plus performants possibles permettent également de faire progresser des technologies que l'on utilise depuis de nombreuses années, dont la transcription audio. Pour cela, OpenAI propose son moteur de transcription Whisper boosté à l'IA et capable d'offrir des résultats bluffants, y compris sur des requêtes et textes compliqués.
Une App utilisant le moteur Whisper d'OpenAI
Chuchotis, l'App du développeur et ancien chercheur publiant sous le nom Azertiop, s'appuie donc sur le moteur Whisper d'OpenAI et propose la transcription à partir de fichiers audio et vidéo dans 100 langues (les 99 de Whisper ainsi que le Suisse Allemand) en texte au format DOCX, RTF ou SRT (pour des pistes de sous-titres).
Chuchotis combine la puissance de l’intelligence artificielle whisper créée par OpenAI et des outils permettant d’améliorer la qualité des transcriptions.
Il suffit de faire glisser un fichier audio, ou vidéo, et de lancer la transcription. Après quelques minutes, la voix a été transcrite en segments de texte que l’on peut exporter un traitement de textes, un outil de gestion de site web, ou sous forme de sous-titres.
Vous pouvez sélectionner la plage à transcrire dans l’enregistrement, en déplaçant les curseur de début et ou de fin, choisir la qualité de transcription, traduire celle-ci en anglais si nécessaire, et suggérer des mots ou expression pour guider le travail de l’IA.
Une fois que la transcription est achevée, vous pouvez réécouter indépendamment chaque segment de texte, modifier son contenu ou le supprimer.
Les segments qui ont posé des problèmes à l’intelligence artificielle sont identifiés et peuvent être supprimés ou retranscrits.
Les phrases peuvent être reconstituées en fonction de la ponctuation suggérée par l’IA.
Chuchotis est d'ores et déjà disponible en téléchargement sur le Mac App Store au tarif de 29,99 euros. Le programme nécessite 4,3 Go d'espace de stockage libre sur un Mac doté d'une puce Apple Silicon sous macOS 12.0 minimum.