Il y a quelque temps, je vous ai présenté la carte de développement ANAVI Dev Mic de Léon Anavi. Léon a publié une vidéo [en Anglais] pour utiliser sa carte sur un Raspberry Pi 5 en reconnaissance vocale. Il utilise Whisper, un réseau neuronal entraîné par OpenAI qui se rapproche de la robustesse et de la précision humaines pour la reconnaissance de la parole en anglais. Très intéressé par cette solution qui permet de reconnaître la parole EN LOCAL, sans connexion Internet, je me suis demandé si ça fonctionnait aussi pour le français ?

Au sommaire :

1 Conversion parole-Texte sur Raspberry Pi 5 en local avec OpenAI Whisper
- 1.1 Matériel Utilisé
- 1.2 Installation sur le Raspberry Pi 5
2 Sources

Conversion parole-Texte sur Raspberry Pi 5 en local avec OpenAI Whisper

Matériel Utilisé

Raspberry Pi 5 – 4Go RAM
Raspberry Pi OS à jour (08/2024)
Carte SD 64 Go

Installation sur le Raspberry Pi 5

Si vous avez un Raspberry Pi 5 et un ANAVI Dev Mic, suivez les étapes suivantes pour configurer et exécuter le script :

Lancez Raspberry Pi OS et ouvrez un terminal.
Créez un environnement virtuel Python3 :

python -m venv test
cd test
source bin/activate

Installer les dépendances :

sudo apt update
sudo apt install portaudio19-dev

Installer les bibliothèques Python :

pip install SpeechRecognition pyaudio openai-whisper

Téléchargez le code source depuis GitHub :

git clone https://github.com/AnaviTechnology/anavi-examples

Exécutez le script :

cd anavi-examples/speech-to-text
python3 stt.py

Lorsque le programme est prêt à vous écouter, il affiche « Listening« … et c’est parti

Ça fonctionne bien, il y a quand même un délai de plusieurs secondes avant que le texte ne s’affiche.

La charge CPU frôle les 100% (97%) et la température grimpe… mais ça fonctionne

Sortir de l’environnement virtuel Python

Sortez proprement de l’environnement virtuel avec la commande deactivate :

Alors restons calme, il faut que les phrases restent simples. J’ai essayé de réciter « Le corbeau et le Renard », le résultat était assez folklorique. Mais on a un système AUTONOME LOCAL qui traduit (lentement) la parole en texte et en Français.

C’est un premier pas vers la commande vocale sur le Raspberry Pi 5.

Un premier pas aussi vers de la reconnaissance vocale plus rapide que nous promet Hailo, puisque des membres de la communauté travaillent à l’intégration de la reconnaissance vocale sur le module Hailo utilisé sur Raspberry Pi 5. Ceci devrait accélérer grandement la phase de traitement… A suivre…

Sources

https://www.crowdsupply.com/anavi-tec…

https://github.com/AnaviTechnology/an…

https://pypi.org/project/SpeechRecogn…

https://github.com/Uberi/speech_recog…

https://github.com/openai/whisper

https://github.com/AnaviTechnology/anavi-examples/blob/master/speech-to-text/stt.py

Whisper OpenAI : Convertir la parole en texte comme un pro

À propos François MOCQ

Électronicien d'origine, devenu informaticien, et passionné de nouvelles technologies, formateur en maintenance informatique puis en Réseau et Télécommunications. Dès son arrivée sur le marché, le potentiel offert par Raspberry Pi m’a enthousiasmé j'ai rapidement créé un blog dédié à ce nano-ordinateur (www.framboise314.fr) pour partager cette passion. Auteur de plusieurs livres sur le Raspberry Pi publiés aux Editions ENI.

Framboise 314, le Raspberry Pi à la sauce française….

La référence du Raspberry Pi en France – Par l'auteur du livre "Raspberry Pi 4" paru aux Edts. ENI

Conversion parole-Texte sur Raspberry Pi 5 en local avec OpenAI Whisper

Conversion parole-Texte sur Raspberry Pi 5 en local avec OpenAI Whisper

Matériel Utilisé

Installation sur le Raspberry Pi 5

Sources

À propos François MOCQ

Laisser un commentaire Annuler la réponse