Une App pour convertir la voix en texte en local grâce à l'IA avec ScriptAI
Par June Cantillon - Publié le
Si la transcription audio n'est pas u ne nouveauté, les progrès des algorithmes d'intelligence artificielle permettent de proposer des outils d peuls en plus performants, comme cette App ScriptAI du développeur français de 22 ans Louis-Auguste Bacot.
En plus de développer des IA génératives, les travaux d'OpenAI contribuent également à l'amélioration de technologies utilisées depuis longtemps, comme la transcription audio. Ainsi, OpenAI propose son moteur de transcription Whisper capable de produire des résultats assez impressionnants, y compris avec des requêtes et des textes complexes.
Louis-Auguste s'appuie donc sur ce moteur Whisper afin d'offrir la transcription en local sur des iPhone (à partir de l'iPhone 12) et ajoute des fonctionnalités supplémentaires, comme la possibilité d'obtenir un résumé de la transcription, une notre structurée, ou encore une traduction dans une autre langue via GPT-4o.
ScriptAI - Transcription IA est d'ores et déjà disponible gratuitement au téléchargement sur l'App Store. Le programme nécessite 8,8 Mo d'espace de stockage libre sur un iPhone ou un iPad sous iO /iPadOS 17.0 minimum, ou un VisionPro sous visionOS 1.0. L'App comprend des achats intégrés à 2,99 euros par semaine ou 4,99 euros par mois pour les formules ScriptAI+ permettant de profiter des fonctionnalités avancées (Actions intelligentes, résumés, etc).
ScriptAI - Transcription IA
En plus de développer des IA génératives, les travaux d'OpenAI contribuent également à l'amélioration de technologies utilisées depuis longtemps, comme la transcription audio. Ainsi, OpenAI propose son moteur de transcription Whisper capable de produire des résultats assez impressionnants, y compris avec des requêtes et des textes complexes.
Louis-Auguste s'appuie donc sur ce moteur Whisper afin d'offrir la transcription en local sur des iPhone (à partir de l'iPhone 12) et ajoute des fonctionnalités supplémentaires, comme la possibilité d'obtenir un résumé de la transcription, une notre structurée, ou encore une traduction dans une autre langue via GPT-4o.
Grâce à la puissance des iPhones, aux puces Apple Silicon et aux avancées d’Apple en IA et ML, la transcription locale on-device avec ScriptAI apporte beaucoup d'avantages :
• 100% privée : Les modèles de transcription fonctionnent nativement sur l’iPhone, et ainsi aucune donnée ne quitte l’iPhone. Et pour les notes intelligentes, seul le modèle GPT-4o, le plus récent et le plus sécurisé, est utilisé.
• Une transcription très rapide et d'une précision inégalée : Grâce aux modèles Whisper qui ont été optimisés par Argmax (une boite monté par des anciens en ML d’Apple) en tirant avantage d'Apple Core ML, on peut faire tourner des modèles de transcription Whisper localement, offrant une très bonne qualité le tout très rapidement (cela dépend du modèle d’iPhone), et sans coûts.
On n’a donc pas besoin d’attendre Apple Intelligence, qui sortira plus tard cette année et, d’après ce que j’ai compris pas en France!
Et pas besoin d’un iPhone 15 Pro ! C’est quand même assez incroyable de pouvoir faire tourner le meilleur modèle de transcription, Large V3, sur un simple iPhone 14 !
Attention, il faut tout de même avoir au moins un iPhone 12.
• Une super app : Comparé aux solutions précédentes, fastidieuses et compromettant la confidentialité, où l’on devait utiliser et payer pour plusieurs apps et services (comme Gladia, ChatGPT, etc.), jongler entre les appareils, perdre du temps, ScriptAI est une solution tout-en-un pratique et fiable.
ScriptAI est gratuite à télécharger, avec des transcriptions illimitées.
Les fonctionnalités exclusives, comme les Actions Intelligentes (les résumés, etc) ou les titres intelligents sur les transcriptions, sont disponibles pour seulement 4,99 € par mois. On peut également ajouter sa propre clé OpenAI si on ne souhaite pas s'abonner.
En ce qui concerne la feuille de route, je suis en train de développer la version pour Mac, et je compte ajouter plusieurs petites fonctionnalités/améliorer la version actuelle, avec par exemple la diarisation des speakers, la possibilité pour ceux qui n’ont pas un iPhone assez puissant d’utiliser la version API de Whisper, etc.
• 100% privée : Les modèles de transcription fonctionnent nativement sur l’iPhone, et ainsi aucune donnée ne quitte l’iPhone. Et pour les notes intelligentes, seul le modèle GPT-4o, le plus récent et le plus sécurisé, est utilisé.
• Une transcription très rapide et d'une précision inégalée : Grâce aux modèles Whisper qui ont été optimisés par Argmax (une boite monté par des anciens en ML d’Apple) en tirant avantage d'Apple Core ML, on peut faire tourner des modèles de transcription Whisper localement, offrant une très bonne qualité le tout très rapidement (cela dépend du modèle d’iPhone), et sans coûts.
On n’a donc pas besoin d’attendre Apple Intelligence, qui sortira plus tard cette année et, d’après ce que j’ai compris pas en France!
Et pas besoin d’un iPhone 15 Pro ! C’est quand même assez incroyable de pouvoir faire tourner le meilleur modèle de transcription, Large V3, sur un simple iPhone 14 !
Attention, il faut tout de même avoir au moins un iPhone 12.
• Une super app : Comparé aux solutions précédentes, fastidieuses et compromettant la confidentialité, où l’on devait utiliser et payer pour plusieurs apps et services (comme Gladia, ChatGPT, etc.), jongler entre les appareils, perdre du temps, ScriptAI est une solution tout-en-un pratique et fiable.
ScriptAI est gratuite à télécharger, avec des transcriptions illimitées.
Les fonctionnalités exclusives, comme les Actions Intelligentes (les résumés, etc) ou les titres intelligents sur les transcriptions, sont disponibles pour seulement 4,99 € par mois. On peut également ajouter sa propre clé OpenAI si on ne souhaite pas s'abonner.
En ce qui concerne la feuille de route, je suis en train de développer la version pour Mac, et je compte ajouter plusieurs petites fonctionnalités/améliorer la version actuelle, avec par exemple la diarisation des speakers, la possibilité pour ceux qui n’ont pas un iPhone assez puissant d’utiliser la version API de Whisper, etc.
Une transcription en local
ScriptAI - Transcription IA est d'ores et déjà disponible gratuitement au téléchargement sur l'App Store. Le programme nécessite 8,8 Mo d'espace de stockage libre sur un iPhone ou un iPad sous iO /iPadOS 17.0 minimum, ou un VisionPro sous visionOS 1.0. L'App comprend des achats intégrés à 2,99 euros par semaine ou 4,99 euros par mois pour les formules ScriptAI+ permettant de profiter des fonctionnalités avancées (Actions intelligentes, résumés, etc).