Help Assist avec Vosk

christophe30 · Octobre 16, 2024, 5:20

Bonjour à tous

Tout d’abord, je tiens à préciser que j’ai basculé sur HA vraiment tout récemment car Jeedom commençait à sérieusement me gonfler. Je tiens à préciser que je suis une grosse quiche complètement inexistant niveau programmation.
Le coté positif, c’est que je m’éclate avec HA. J’ai inclus une quarantaine de modules en Mqtt et lorsque je fais une automatisation, tout fonctionne de suite, c’est carrément le panard…
Je me suis donc attaqué à Assist, et ça fait des jours que je suis dessus.
J’ai tout d’abord essayé l’Atom echo, puis en satellite avec un Rpi4 et un Respeaker 4 micros array que j’avais au fond d’un tiroir datant de Snips avec Jeedom.
Ben, j’ai le même problème avec les 2:
Le mot de réveil est juste excellent avec Snowboy mais Vosk ne comprends rien du tout malgré des alias à tout va. Dans le debug, il répond chaque fois à côté du style « mode nuit » il va comprendre « monde de la nuit ». Pour dire, même si je dis juste 2 mots comme ferme ou éteint « volet cuisine » il répond « j’ai voler la cuisine » Je veux bien avoir un accent prononcé du sud de la France, mais quand même !
J’ai lu un tas de tutos sur les installations d’Assist que j’ai du recommencer 50 fois car je me disais que j’avais certainement merdé quelque part.

J’ai vu passer ici que l’on pouvait rajouter intents/sentences/fr at main · home-assistant/intents · GitHub

Mais comment et où ?
Je le répète encore, je suis encore moins qu’un débutant sur HA.
Si quelqu’un pouvait m’aider…

System Information

version	core-2024.10.1
installation_type	Home Assistant OS
dev	false
hassio	true
docker	true
user	root
virtualenv	false
python_version	3.12.4
os_name	Linux
os_version	6.6.46-haos
arch	x86_64
timezone	Europe/Paris
config_dir	/config

Home Assistant Community Store

GitHub API	ok
GitHub Content	ok
GitHub Web	ok
HACS Data	ok
GitHub API Calls Remaining	4997
Installed Version	2.0.1
Stage	running
Available Repositories	1441
Downloaded Repositories	6

Home Assistant Cloud

logged_in	false
can_reach_cert_server	ok
can_reach_cloud_auth	ok
can_reach_cloud	ok

Home Assistant Supervisor

host_os	Home Assistant OS 13.1
update_channel	stable
supervisor_version	supervisor-2024.10.2
agent_version	1.6.0
docker_version	26.1.4
disk_total	116.7 GB
disk_used	19.3 GB
healthy	true
supported	true
host_connectivity	true
supervisor_connectivity	true
ntp_synchronized	true
virtualization
board	generic-x86-64
supervisor_api	ok
version_api	ok
installed_addons	Terminal & SSH (9.15.0), Mosquitto broker (6.4.1), Zigbee2MQTT (1.40.2-1), porcupine (1.1.0), snowboy (1.2.1), Samba share (12.3.2), Assist Microphone (2.2.3), openWakeWord (1.10.0), Piper (1.5.2), vosk (1.6.1), File editor (5.8.0)

Dashboards

dashboards	3
resources	2
views	6
mode	storage

Recorder

oldest_recorder_run	6 octobre 2024 à 03:00
current_recorder_run	16 octobre 2024 à 17:40
estimated_db_size	34.39 MiB
database_engine	sqlite
database_version	3.45.3

Krull56 · Octobre 16, 2024, 5:29

Hello

Vu ce que tu as déjà mis en place avec Assist , tu es loin d’être une quiche

Utilisateur de vosk depuis le premier jour ( merci Mike de Nabu Casa) je n’ai jamais eu ce type de symptômes, même avec mon accent breton, sauf pour des mots souvent très proches ( éteins, étends) , mais pour le contourner suffit d’être un peu plus poli du type " peux-tu éteindre …" « Peux tu fermer les volets »…etc

Comment est configuré ton Addon Vosk ?

Jackbot · Octobre 16, 2024, 5:33

Ce qu’il faut savoir c’est :

Open-ended - any sentence can be spoken, but recognition is very poor compared to Whisper

Source

En fait VOSK est effectivement très rapide, mais aussi très approximatif. Perso je tourne avec faster-whisper avec le modèle medium. Plus lent, mais plus précis donc pas obligé de perdre du temps à répéter.

Le seul moyen d’avoir une bonne précision avec vosk est d’utiliser un modèle large, mais ça se fait au prix d’utilisation de beaucoup de RAM.

Big models are for the high-accuracy transcription on the server. Big models require up to 16Gb in memory since they apply advanced AI algorithms

Source

Krull56 · Octobre 16, 2024, 5:45

Hello @Jackbot

Tu as en partie raison, mais les sources que tu indiques ne sont vraiment valables que pour le modèle English, faster Whisper ayant été conçu et optimisé dans cette langue.
Langue qui n’a pas du tout les mêmes subtilités que la langue de Molière

Vosk fonctionne beaucoup mieux pour beaucoup d’autres langues et est plus accurate à ressources égales .

Aucun pb pour Vosk avec les sentences natives de HA sauf qu’il faut meubler un peu dans certains cas pour lui éviter des confusions

WarC0zes · Octobre 16, 2024, 5:46

Salut,
je suis du sud ( 11) et pas de soucis avec VOSK

Krull56 · Octobre 16, 2024, 5:56

Comme quoi même à être sur un RPI et avoir donc 2 handicap ( en y ajoutant l’accent) , vosk arrive à faire des miracles

Mais bon, @Jackbot va nous prouver le contraire

Bonne soirée Maître

Jackbot · Octobre 16, 2024, 6:01

Moi non, il faut que tu lise correctement l’énnoncé :

Krull56 · Octobre 16, 2024, 6:04

Et toi il faut que tu comprennes mes réponses😉

J’oubliais, le modèle par défaut de Vosk est largement suffisant

WarC0zes · Octobre 16, 2024, 6:07

@christophe30
ta bien choisie preload language fr dans VOSK ?

Jackbot · Octobre 16, 2024, 6:13

Excuse moi, c’est vrai, il n’y a donc aucun problème avec ça :

Krull56 · Octobre 16, 2024, 6:14

Non, il faut choisir preload language fort accent du sud

Et aussi activer allow unknow

WarC0zes · Octobre 16, 2024, 6:21

ça change vraiment si je l’active ?
je ne l’ai jamais activé
je testerai.

Krull56 · Octobre 16, 2024, 6:34

Ça ne fait pas avancer la problématique de @christophe30 , et c’est pas la première fois .

Mais si c’est ton seul passe temps , pas de soucis. Tu as tout à fait le droit d’apporter une pièce à l’édifice, nous ne sommes pas devins.

On va donc attendre quelques infos complémentaires de @christophe30 pour continuer et avancer dans la résolution de sa problématique

christophe30 · Octobre 16, 2024, 7:10

Salut et Merci pour ta réponse,

J’ai essayé également le "peux-tu, pouvez-vous, etc… sans résultat
voila:

christophe30 · Octobre 16, 2024, 7:15

Salut,
Oui, bien sûr
j’ai même essayé de mettre les 2 versions Fr small dans share et cela ne change rien.

Krull56 · Octobre 16, 2024, 7:20

Bon , à moins que tu ais un accent très très marqué ( pire que @WarC0zes ) , je vois pas où ça peut coincer.

On peut essayer de trouver une piste en y allant par élimination.
On va déjà tester sans satellite.
Qu’est ce que ça donne sur un pc ou via l’appli companion ?

christophe30 · Octobre 16, 2024, 7:33

Je vais rajouter que j’étais sur RPI 5 et comme ça merdait grave, j’ai tout migré sur un Shuttle I5 que j’avais sur une étagère qui me servait pour Sarah à l’époque. Mais j’ai exactement le même problème sur les 2 machines…

christophe30 · Octobre 16, 2024, 8:02

Non pas pire comme accent, j’ai entendu une petite vidéo avec justement un Atom echo et il me semble bien que c’était lui.
lorsque j’écris le texte sur mon mac, ça fonctionne très bien, mais niveau micro, je ne peux pas, j’ai ça :

Krull56 · Octobre 16, 2024, 8:04

Pour que le micro puisse fonctionner, il faut accéder à HA en https et donner l’autorisation dans le navigateur quand demandé.

Argh, en plus de l’accent, tu as un mac…je ne vais pas pouvoir t’aider

christophe30 · Octobre 16, 2024, 8:05

et avec l’appli companion, je regarde ça demain. Je pars me coucher, demain taf à 5h .
En tous les cas un grand merci pour cette formidable solidarité
Bonne nuit