J’ai régulièrement (parfois même quotidiennement, voire 2 fois certains jours) un crash de HA qui se fige et ne répond plus.
C’est très aléatoire, de manière inopinée, et à n’importe quel moment h24.
Dans ces moments, plus rien ne fonctionne sauf l’accès aux menus:
automatisations etc arrêtées/stoppées à l’instant T
l’entrée/accès à une donnée bloqué à la fenêtre de chargement de page
pas d’accès aux commandes, ni aux menus ou au système pour actionner un redémarrage ou éteindre par exemple.
Ma seule possibilité est la coupure électrique puis redémarrer totalement mon RPi 4.
A chaque fois, je n’ai plus accès au journal ou historique pour trouver indication, sauf lors du dernier crash cette nuit où j’ai quelques infos mais que je n’arrive pas à exploiter.
J’ai fait une capture écran, y aurait il quelque chose à creuser dans ces éléments ?
Pour info selon mes graphs et historiques de capteurs, tout a figé vers 03h19 / 03h20…
Je note par exemple en premier lieu une histoire de SQLAlchemyError et suivant, mais cause ou conséquence du crash ?
Ca fait des mois que cette situation de crash perdure, des idées pour m’aider ?
si tu pouvaispartager les détails de ton système, (comme demandé dans le squelette de message).
(paramètres>système>corrections>informations système.) suffit de « copier » puis coller dans un message.
Sans ça difficile de t’en dire plus…
A priori, rien d’anormal.
As-tu une alimentation RPi officielle ?
As-tu un disque SSD ou une carte SD?
Comment sont branchées tes dongles Z-wave et Zigbee ?
Si tu as un disque SSD, il te faut un hub auto-alimenté pour le soutenir avec les dongles.
Oui alimentation officielle, disque dur ssd.
Mes dongles et ssd sur les ports usb.
Par contre le ssd est aussi alimenté depuis le usb… Ça serait lui qui fait planter ?
Après je n’utilise pas le dongle zwave pour le moment. Son retrait pourrait soulager l’ensemble ?
Vu le message d’erreur ça sent des soucis d’écriture sur ton SSD ?
Problème d’alimentation ? Problème d’usb ?
après vous continuez a aimer le rpi pour sa stabilité c’est le combienième user ces derniers jours à avoir des soucis avec leur rpi quand tu vois le prix d’un rpi aujourd’hui faut vraiment bannir cette plateforme </coup de gueule>
Tout dépend l’utilisateur, depuis mes débuts sur HA, j’ai commencer sur un RPI3B et puis un RPI4 4Go et aucun soucis. Le RPI a ces avantages et inconvénients, mais de la a bannir faut pas déconner
Effectivement j’ai eu la même idée au départ au sujet de la corruption du ssd, mais tout fonctionne parfaitement, hormis par moment cette pseudo coupure qui plante tout…
Tes secondes idées rejoignent celles avancées précédemment, je vais déjà essayer simplement le retrait d’un dongle, vérifier mes branchements du zigbee, voir les éventuels changements…
Le retrait du dongle Zwave non utilisé pour le moment n’a pas amélioré, le changement de ports ou déplacement du ssd pour d’éventuelles interférences par exemple non plus…
Information complémentaire : la sollicitation (charge) du rpi n’interfère pas ou ne provoque pas l’erreur. D’ailleurs il est fréquent que ce soit en pleine nuit lorsque il est ‹ au repos › que ça crash…
Une piste pour voir si ça vient du stockage, essayer temporairement de mettre l’os sur une sd et voir sur plusieurs jours. Si ça tiens c’est l’alimentation ou le ssd.
Peu de retour pour le moment, j’ai essuyé plusieurs coupures enedis ces 2 dernières semaines donc pas vraiment de recul sur d’éventuels changements…
Pour info, j’ai essayé de déplacer le ssd et son câble qui étaient en contact avec plusieurs alimentations dans un tableau (fils et transfo multiples).
Je n’ai eu qu’un seul crash depuis 2 semaines, mais je ne sais pas si c’est une coïncidence.
Mon dernier crash cette nuit indiquait en premier lieu le défaut suivant:
je rencontre le même problème depuis plusieurs mois, à savoir crash sans raison, plateforme inaccessible et rien d’intéressant dans les logs. Je suis également avec un RPI3 et clé Zigbee Conbee2.
Lorsque ça arrive (tous les 2 à 3 jours), le système reste inaccessible pendant plusieurs heures (entre 10 et 24h, parfois plus). En enlevant la clé Zigbee (Conbee2) plus de problème, en la rebranchant et lançant l’intégration, ça crash. Selon moi (à confirmer), le watchdog passait son temps à essayer de démarrer l’intégration qui plantait.
Ici avec les dernières mises à jour (Core 2024.7.0, Supervisor 2024.06.2, OS 12.4 et Z2M en 1.39.0), j’ai perdu complètement l’accès à Z2M qui refusait de démarrer et lorsque j’essayais de le lancer surchargeait le système à cause de reboot automatique de l’intégration.
En ajoutant 1 ligne dans le fichier config.txt de la partition boot j’ai réglé le problème de démarrage de Z2M. Je manque un peu de recul sur la stabilité du système mais ça pourrait certainement être une piste à creuser!
Ta remarque m’interpelle car je note à présent des similitudes de mon côté :
ce sont mes éléments zigbee qui figent lorsque HA ‹ crash ›, alors que mes accès au reste et mes entrées booleans sont toujours accessibles (mais forcément non opérantes)
j’ai à chaque fois la sensation que c’est un plantage qui surcharge le système (comme quand on a un logiciel qui plante dans Windows, où tout se fige tant qu’on a pas mis fin à la tâche qui surcharge le système)
j’ai eu plusieurs fois des soucis d’intégrations de nouveaux éléments dans le système, où z2m ne trouvait pas etc, et où je m’étais rendu compte que le retrait/remise de la clés zigbee conbee 2 remettait les choses en fonctionnement normal
j’ai perdu tout mon système lors de la réalisation des dernières mises à jour: toutes mes intégrations modules zigbee étaient inaccessibles (et donc toutes mes automatisations ko). En fouillant, tout était pourtant bien accessible et présent sur z2m, et fonctionnait en allant les chercher directement. Mais tous les noms désignations etc étaient changées et donc plus retrouvées par HA )
en faisant des backup successifs, j’ai fini par résoudre ce problème lorsque je suis remonté au delà de la mise à jour de Z2m…
Par contre, je suis loin d’avoir ton niveau pour creuser plus de mon côté !
En soi, la solution n’est pas trop complexe à tester (trouver l’info par contre )
Tu peux tenter :
Éteindre proprement ton système HA.
Selon ta configuration, connecter ta carte SD ou disque SSD du RPI dans un autre PC.
Tu devrais trouver une petite partition en FAT (je pense qu’elle s’appelle boot), c’est normalement la première sur ta carte. Tu dois pouvoir y accéder depuis Windows (gestionnaire de disques/partition) ou via gParted sous Linux.
A la racine, de la partition, tu as un fichier config.txt, tu peux l’éditer et ajouter à la fin du document la ligne
dtoverlay=dwc2
Sur github, certains conseillent d’utiliser Notepad++ sous Windows pour éditer le fichier.
Une fois fini, tu remets le tout dans le Rpi et si tu as de la chance, le problème est réglé. Pour ma part, c’est stable depuis plus de 24h. Une première depuis plusieurs mois.