Help Assist avec Vosk

Bonjour à tous

Tout d’abord, je tiens à préciser que j’ai basculé sur HA vraiment tout récemment car Jeedom commençait à sérieusement me gonfler. Je tiens à préciser que je suis une grosse quiche complètement inexistant niveau programmation.
Le coté positif, c’est que je m’éclate avec HA. J’ai inclus une quarantaine de modules en Mqtt et lorsque je fais une automatisation, tout fonctionne de suite, c’est carrément le panard…
Je me suis donc attaqué à Assist, et ça fait des jours que je suis dessus.
J’ai tout d’abord essayé l’Atom echo, puis en satellite avec un Rpi4 et un Respeaker 4 micros array que j’avais au fond d’un tiroir datant de Snips avec Jeedom.
Ben, j’ai le même problème avec les 2:
Le mot de réveil est juste excellent avec Snowboy mais Vosk ne comprends rien du tout malgré des alias à tout va. Dans le debug, il répond chaque fois à côté du style « mode nuit » il va comprendre « monde de la nuit ». Pour dire, même si je dis juste 2 mots comme ferme ou éteint « volet cuisine » il répond « j’ai voler la cuisine » Je veux bien avoir un accent prononcé du sud de la France, mais quand même !
J’ai lu un tas de tutos sur les installations d’Assist que j’ai du recommencer 50 fois car je me disais que j’avais certainement merdé quelque part.

J’ai vu passer ici que l’on pouvait rajouter intents/sentences/fr at main · home-assistant/intents · GitHub

Mais comment et où ?
Je le répète encore, je suis encore moins qu’un débutant sur HA.
Si quelqu’un pouvait m’aider…

System Information

version core-2024.10.1
installation_type Home Assistant OS
dev false
hassio true
docker true
user root
virtualenv false
python_version 3.12.4
os_name Linux
os_version 6.6.46-haos
arch x86_64
timezone Europe/Paris
config_dir /config
Home Assistant Community Store
GitHub API ok
GitHub Content ok
GitHub Web ok
HACS Data ok
GitHub API Calls Remaining 4997
Installed Version 2.0.1
Stage running
Available Repositories 1441
Downloaded Repositories 6
Home Assistant Cloud
logged_in false
can_reach_cert_server ok
can_reach_cloud_auth ok
can_reach_cloud ok
Home Assistant Supervisor
host_os Home Assistant OS 13.1
update_channel stable
supervisor_version supervisor-2024.10.2
agent_version 1.6.0
docker_version 26.1.4
disk_total 116.7 GB
disk_used 19.3 GB
healthy true
supported true
host_connectivity true
supervisor_connectivity true
ntp_synchronized true
virtualization
board generic-x86-64
supervisor_api ok
version_api ok
installed_addons Terminal & SSH (9.15.0), Mosquitto broker (6.4.1), Zigbee2MQTT (1.40.2-1), porcupine (1.1.0), snowboy (1.2.1), Samba share (12.3.2), Assist Microphone (2.2.3), openWakeWord (1.10.0), Piper (1.5.2), vosk (1.6.1), File editor (5.8.0)
Dashboards
dashboards 3
resources 2
views 6
mode storage
Recorder
oldest_recorder_run 6 octobre 2024 à 03:00
current_recorder_run 16 octobre 2024 à 17:40
estimated_db_size 34.39 MiB
database_engine sqlite
database_version 3.45.3

Hello

Vu ce que tu as déjà mis en place avec Assist , tu es loin d’être une quiche :wink:

Utilisateur de vosk depuis le premier jour ( merci Mike de Nabu Casa) je n’ai jamais eu ce type de symptômes, même avec mon accent breton, sauf pour des mots souvent très proches ( éteins, étends) , mais pour le contourner suffit d’être un peu plus poli du type " peux-tu éteindre …" « Peux tu fermer les volets »…etc

Comment est configuré ton Addon Vosk ?

1 « J'aime »

Ce qu’il faut savoir c’est :

  • Open-ended - any sentence can be spoken, but recognition is very poor compared to Whisper

Source

En fait VOSK est effectivement très rapide, mais aussi très approximatif. Perso je tourne avec faster-whisper avec le modèle medium. Plus lent, mais plus précis donc pas obligé de perdre du temps à répéter.

Le seul moyen d’avoir une bonne précision avec vosk est d’utiliser un modèle large, mais ça se fait au prix d’utilisation de beaucoup de RAM.

Big models are for the high-accuracy transcription on the server. Big models require up to 16Gb in memory since they apply advanced AI algorithms

Source

Hello @Jackbot

Tu as en partie raison, mais les sources que tu indiques ne sont vraiment valables que pour le modèle English, faster Whisper ayant été conçu et optimisé dans cette langue.
Langue qui n’a pas du tout les mêmes subtilités que la langue de Molière :wink:

Vosk fonctionne beaucoup mieux pour beaucoup d’autres langues et est plus accurate à ressources égales .

Aucun pb pour Vosk avec les sentences natives de HA sauf qu’il faut meubler un peu dans certains cas pour lui éviter des confusions

1 « J'aime »

Salut,
je suis du sud ( 11) et pas de soucis avec VOSK :wink:

3 « J'aime »

Comme quoi même à être sur un RPI et avoir donc 2 handicap ( en y ajoutant l’accent) , vosk arrive à faire des miracles :grin:

Mais bon, @Jackbot va nous prouver le contraire :stuck_out_tongue_winking_eye:

Bonne soirée Maître

2 « J'aime »

Moi non, il faut que tu lise correctement l’énnoncé :

2 « J'aime »

Et toi il faut que tu comprennes mes réponses😉

J’oubliais, le modèle par défaut de Vosk est largement suffisant

1 « J'aime »

@christophe30
ta bien choisie preload language fr dans VOSK ?

Excuse moi, c’est vrai, il n’y a donc aucun problème avec ça :

1 « J'aime »

Non, il faut choisir preload language fort accent du sud :crazy_face:

Et aussi activer allow unknow :wink:

1 « J'aime »

ça change vraiment si je l’active ?
je ne l’ai jamais activé :thinking:
je testerai.

Ça ne fait pas avancer la problématique de @christophe30 , et c’est pas la première fois .

Mais si c’est ton seul passe temps , pas de soucis. Tu as tout à fait le droit d’apporter une pièce à l’édifice, nous ne sommes pas devins.

On va donc attendre quelques infos complémentaires de @christophe30 pour continuer et avancer dans la résolution de sa problématique

Salut et Merci pour ta réponse,

J’ai essayé également le "peux-tu, pouvez-vous, etc… sans résultat
voila:

Salut,
Oui, bien sûr
j’ai même essayé de mettre les 2 versions Fr small dans share et cela ne change rien.

Bon , à moins que tu ais un accent très très marqué ( pire que @WarC0zes ) , je vois pas où ça peut coincer.

On peut essayer de trouver une piste en y allant par élimination.
On va déjà tester sans satellite.
Qu’est ce que ça donne sur un pc ou via l’appli companion ?

Je vais rajouter que j’étais sur RPI 5 et comme ça merdait grave, j’ai tout migré sur un Shuttle I5 que j’avais sur une étagère qui me servait pour Sarah à l’époque. Mais j’ai exactement le même problème sur les 2 machines… :roll_eyes:

Non pas pire comme accent, j’ai entendu une petite vidéo avec justement un Atom echo et il me semble bien que c’était lui.
lorsque j’écris le texte sur mon mac, ça fonctionne très bien, mais niveau micro, je ne peux pas, j’ai ça :

Pour que le micro puisse fonctionner, il faut accéder à HA en https et donner l’autorisation dans le navigateur quand demandé.

Argh, en plus de l’accent, tu as un mac…je ne vais pas pouvoir t’aider :grin:

et avec l’appli companion, je regarde ça demain. Je pars me coucher, demain taf à 5h .
En tous les cas un grand merci pour cette formidable solidarité
Bonne nuit

1 « J'aime »