Retour sur 3 semaines d'essais

Mon problème

Je n’ai pas encore pu avoir une config qui tienne plus de 48h…

à la base, j’ai un Raspberry PI 4b avec 4 Go de ram et un disque M.2 de 240 Go en USB + une clef Sonoff

une dizaine d’ampoules Ledvance AC33898,
2 ampoules Aqara ZNLDP12LM,
2 capteurs de mouvement SNZB-03,
2 interrupteurs TS0042 et 2 TS0041,
un capteur de température et hygrométrie ST30,
2 capteurs d’inondation SW30,
un bouton SNZB-01 et deux WXKG11LM
sans oublier un ZLinky_TIC

au bout de 2 jours, mes configs se cassent la gueule, pourtant je ne suis pas trop méchant, je reboote via les commandes prévues, je renomme (un peu trop) les devices avec l’interface prévue pour.
au niveau de l’administration des devices, je suis passé assez rapidement sous MQTT + Zigbee2MQTT.
mieux présenté au niveau des devices et beaucoup plus parlant que ZHA.

mais, impossible toujours d’avoir une config stable, le matin, tout est planté, la base de données est injoignable (pourtant je n’y ai jamais touchée, je ne sais même pas ou elle est) donc réinstall. une fois, deux fois, trois fois…
je me suis fait une machine de tests, mais finalement, elle met la grouille sur la machine de prod… il y a des devices qui passent de l’une à l’autre ??? bon, je range la machine de tests bien au fond du tiroir.

l’avant dernière fois, je refais une config (Raspberry PI Imager avec haos_rpi4-64-7.4.img.xz) on peut pas faire plus clean.
j’en profite pour passer sur le canal 25, je met un pan_id en hexa et une network_key à l’épreuve des espions.

Je commence à appairer mes Ampoules quand tout d’un coup, une carte à contact sec qui commande ma bouilloire vient s’enregistrer malgré les paramètres réseaux particulièrement différents… ainsi que le ZLinky_TIC, alors qu’ils n’y a eu aucune action d’appairage dessus.
bravo au passage pour la mise à niveau des firmwares des ampoules Aqara et du zlinky directement intégré dans z2m.
bref, c’est quoi ce souk ? vu que le zlinky me rempli les logs vu que toutes les secondes il cause dans le tuyau, je le débranche.
je vire aussi les demons Samsoule et Denon
ca va mieux, je galère un moment avec les interrupteurs muraux TS0041, sur les 2 que je reçois, il n’y en a pas un qui marche. en plus, faire un script avec, c’est pas trivial, mais avec des blueprints pour le TS0044, j’en crée pour le 41 et le 42.
j’ai enfin quelque chose qui tourne.
la nuit dernière, la passerelle propriétaire entre mes devices RF433 s’allume en rouge fixe, c’est en principe les données qui passent du lan vers la RF… j’ai débranché le truc, je vais migrer cette solution vers du 100% zigbee.

Vu que ma femme a un WAF tres restreint, que tout ce qui est technique sera balayé tel une remasterisation pendant la nuit, il faut que les interrupteurs soient ressemblant et à la même place…
il y a quoi de fiable de ce coté ? je ne suis qu’à moitié convaincu par les TS0041 et TS0042

Ma configuration


System Health

version core-2022.3.7
installation_type Home Assistant OS
dev false
hassio true
docker true
user root
virtualenv false
python_version 3.9.9
os_name Linux
os_version 5.10.92-v8
arch aarch64
timezone Europe/Paris
Home Assistant Cloud
logged_in false
can_reach_cert_server ok
can_reach_cloud_auth ok
can_reach_cloud ok
Home Assistant Supervisor
host_os Home Assistant OS 7.5
update_channel stable
supervisor_version supervisor-2022.03.5
docker_version 20.10.9
disk_total 237.7 GB
disk_used 6.6 GB
healthy true
supported true
board rpi4-64
supervisor_api ok
version_api ok
installed_addons Mosquitto broker (6.0.1), Samba share (9.5.1), Zigbee2mqtt (1.24.0-1), Home Assistant Google Drive Backup (0.106.2), Terminal & SSH (9.3.0)
Lovelace
dashboards 1
resources 0
views 4
mode storage
___

Je ne suis pas convaincu par les dalles en verre tactiles, c’est souvent trop sensible.

J’allais te répondre sur la stabilité, mais je vois @Pulpy-Luke est en train de le faire :wink:

1 « J'aime »

Salut,

Il y a un peu de tout dans ton message : du 433Mhz (le tag est zigbee), du zigbee (avec z2m et zha même si techniquement les 2 ne cohabitent pas), du système, de la config, de la méthodo (machine des tests et de prod qui mélangent les devices ???) … C’est dommage qu’il manque une élément important : les logs de tes plantages ! C’est là dedans qu’il y a des pistes à chercher pour mettre en place les ajustements.
Quand à HA en lui même, c’est ultra robuste

Pour avoir testé plusieurs solutions zigbee, z2m est probablement le plus fiable autant au niveau de la stabilité que de la prise en compte du matériel.
Je n’ai qu’un conseil à donner : faire ça au fur et à mesure : 1 protocole, une série de tests et quand ça marche on passe à la suite. Quand on débute cumuler les défauts (de config/de stabilités/des protocoles), c’est jamais efficace

EDIT: @AlexHass toujours à l’affut :muscle:

2 « J'aime »

C’est vrai que j’ai un peu tout mélangé, mais à moyen terme, ce sera 100% Z2M

la plupart de mes plantages venaient d’erreurs comme quoi il n’arrivait pas à joindre la base de donnée (en rouge alors que tout le reste est en vert.)
j’ai gardé tout ce qu’il y avait dans /config; mais je ne sais pas où trouver les logs qui sont dans les containers.

@AlexHass mes switch ne sont pas en verre, mais en bon plastique chinois…


la base est gérée par HA … donc c’est pas lié à un protocole. Si souci, c’est plus un truc matériel : carte SD défecteuse est un grand classique.

Pas besoin d’aller directement dans les containers


Et les logs zigbee

Ah ok, en cherchant la ref sur gougle a me montrait des truc qui semblaient être des interrupteurs tactiles en verre.
Donc si c’est du boutons physiques ça va. Maintenant la fiabilitité le souci… c’est sûr c’est embêtant.

Alors là en revanche j’ai un souci avec tes plantages.
Si la base est injoignable HA continue de marcher!
Il n’est absolument pas dépendant de la base de données.
Quand la base est down, tu vois qu’il n’affiche pas les graphes sur lovelace… mais c’est tout.

Donc si tu as tout le système qui plante et qui ne réponds pas ça vient d’autre chose que la base de données.
Réinstaller n’est pas forcément une solution. Je ne l’ai personnellement fait qu’une seule fois en 2 ans pour passer des Rpi à PC.
Il faudrait comprendre ce qui se passe.
Par exemple quels sont les symptômes d’un plantage après 48h?
As tu des traces de l’utilisation de ram et d’autres infos de la machine?

Ca m’était arrivé quand j’étais sur Rpi que le système sont instable et plante en 48h.
Mais je tournais sur carte SD et j’avais trop de choses qui tapaient la carte.
J’ai rétabli ça en gérant la base de données (commit interval et filtre) et en enlevant les add-ons inutiles (influxdb grafana…). Je sais bien que ça ne te servira pas car tu es sur un SSD déjà et que tu as le minimum d’add-ons…
Mais c’est en suivant les valeurs d’espace disque, de ram et taille de db que j’ai détecté et viré les points problèmatiques.

Pour info aussi mon HA gère aujourd’hui pas mal d’entités et d’intégrations. Mais je n’ai pas peur qu’il tombe, je reboot que si je met à jour l’OS (une fois par mois ou tous les 2 mois) et HA lui n’est redémarré que si je modifie quelque choses, plusieurs semaines sont passées déjà sans reboot ni plantages.

Je n’ai pas tout compris, non plus.
L’instabilité concerne les devices ou le système HA ?
Si HA, ton pi est-il en ethernet ou wifi, en ip fixe ? Si wifi qq lignes pour éviter le random mac adresse (cf. Conseils sur le forum pour l’install HA en supervised) et le nodhcp6 ?

Ma machine est branchée en ethernet, le wifi et le bluetooth ne sont pas activés.
je suis bien en IP fixe
j’ai un petit dongle pour le clavier/souris K400 logitek

au niveau disque, je n’ai pas de carte flash, c’est un ssd M.2 en usb
Capture3

pour les outils, je n’ai pas grand chose installé en standard, je crois ?

Bonjour.
Aujourd’hui, pas de messages d’erreur, pas de ralentissement des devices, les devices tuya que je dois accéder par le web répondent bien. Je laisse tel quel, j’ai sauvegardé tous les shares (backup, config etc…) sur mon PC.
je brancherai mon ZLinky plus tard, il faut d’abord que je règle le pb d’affichage HP/HC que mon compteur EDF n’a pas l’air de remonter.

y a il des packages qu’on puisse ajouter au core-ssh pour voir l’état des ressources comme la memoire, cpu, lan, disques et pourquoi pas le port USB du coordinateur ???

Salut,

tu as System Monitor qui est une intégration de base de HA.

Nickel, un proc à 50 degrés, 2.9 Go de ram dispo et du disque en veux tu en voilà… :+1:

Le Zlinky est tres communiquant. A mon avis c’est lui qui te plante tout.
Tu l’as intégré comment ? maintenant il y a une intégration officielle pas mal, mais il faut régler ton mode de compteur ca réduit les msg. Desactive toutes les entités du linky qui ne te servent pas dans HA aussi

Je l’avais intégré tel qu’il a été vu par zigbee2mqtt, soit avec pas mal de lignes et beaucoup qui ne bougaient pas.
c’est en intégrant de nouveaux devices et en regardant dans le journal en mode debug, je voyais presque plus (+) de messages que de lignes d’info…
ce qui m’a saoulé, c’est qu’il s’est « invité » à s’appairer dans le nouveau système sans que je n’aie rien eu à faire.
je l’ai supprimé (ce qui m’a planté la page z2m) ainsi que le ZB-SW01
qui gère ma bouilloire.
j’avais une dizaine d’entités dans HA.
donc pour le moment, il est en attente.