Crash régulier de HA

Bonjour,

J’ai régulièrement (parfois même quotidiennement, voire 2 fois certains jours) un crash de HA qui se fige et ne répond plus.
C’est très aléatoire, de manière inopinée, et à n’importe quel moment h24.

Dans ces moments, plus rien ne fonctionne sauf l’accès aux menus:

  • automatisations etc arrêtées/stoppées à l’instant T
  • l’entrée/accès à une donnée bloqué à la fenêtre de chargement de page
  • pas d’accès aux commandes, ni aux menus ou au système pour actionner un redémarrage ou éteindre par exemple.

Ma seule possibilité est la coupure électrique puis redémarrer totalement mon RPi 4.

A chaque fois, je n’ai plus accès au journal ou historique pour trouver indication, sauf lors du dernier crash cette nuit où j’ai quelques infos mais que je n’arrive pas à exploiter.

J’ai fait une capture écran, y aurait il quelque chose à creuser dans ces éléments ?

Pour info selon mes graphs et historiques de capteurs, tout a figé vers 03h19 / 03h20…
Je note par exemple en premier lieu une histoire de SQLAlchemyError et suivant, mais cause ou conséquence du crash ?

Ca fait des mois que cette situation de crash perdure, des idées pour m’aider ?

merci à vous.
Cordialement
Sylvain


Salut,

si tu pouvaispartager les détails de ton système, (comme demandé dans le squelette de message).
(paramètres>système>corrections>informations système.) suffit de « copier » puis coller dans un message.
Sans ça difficile de t’en dire plus…

Au temps pour moi…

System Information

version core-2024.5.5
installation_type Home Assistant OS
dev false
hassio true
docker true
user root
virtualenv false
python_version 3.12.2
os_name Linux
os_version 6.6.28-haos-raspi
arch aarch64
timezone Europe/Paris
config_dir /config
Home Assistant Community Store
GitHub API ok
GitHub Content ok
GitHub Web ok
GitHub API Calls Remaining 5000
Installed Version 1.34.0
Stage running
Available Repositories 1385
Downloaded Repositories 5
Home Assistant Cloud
logged_in false
can_reach_cert_server ok
can_reach_cloud_auth ok
can_reach_cloud ok
Home Assistant Supervisor
host_os Home Assistant OS 12.3
update_channel stable
supervisor_version supervisor-2024.05.1
agent_version 1.6.0
docker_version 25.0.5
disk_total 219.4 GB
disk_used 9.9 GB
healthy true
supported true
board rpi4-64
supervisor_api ok
version_api ok
installed_addons Terminal & SSH (9.14.0), File editor (5.8.0), Mosquitto broker (6.4.1), Duck DNS (1.17.0), Z-Wave JS UI (3.7.1), Z-Wave JS (0.5.0), Zigbee2MQTT (1.38.0-1), Node-RED (17.0.13), Home Assistant Google Drive Backup (0.112.1)
Dashboards
dashboards 2
resources 3
views 1
mode storage
Recorder
oldest_recorder_run 25 mai 2024 à 05:56
current_recorder_run 5 juin 2024 à 07:16
estimated_db_size 286.27 MiB
database_engine sqlite
database_version 3.44.2

Salut

A priori, rien d’anormal.
As-tu une alimentation RPi officielle ?
As-tu un disque SSD ou une carte SD?
Comment sont branchées tes dongles Z-wave et Zigbee ?

Si tu as un disque SSD, il te faut un hub auto-alimenté pour le soutenir avec les dongles.

Alors…

Oui alimentation officielle, disque dur ssd.
Mes dongles et ssd sur les ports usb.
Par contre le ssd est aussi alimenté depuis le usb… Ça serait lui qui fait planter ?

Après je n’utilise pas le dongle zwave pour le moment. Son retrait pourrait soulager l’ensemble ?

Oui, mais je te conseille un hub USB auto-alimenté.

Le dongle zigbee doit être sur de l’usb 2 (noire), et de préférence avec une allonge de 1m.

Écoute je vais suivre ces premiers conseils et voir si amélioration ou disparition des freeze…

Merci. Je ferai un retour sur ce point dès que j’ai du nouveau :blush:

Heuuu si je change de port USB mes dongles et ssd, je dois reconfigurer des choses non ?? :thinking:

Pour le SSD, rien à faire.
Pour le dongle zigbee, ça dépend comment il est configuré dans z2m.
Pour le dongle Z-wave, je ne sais pas… :stuck_out_tongue_winking_eye:

Bon, je vais bien voir ! :sweat_smile:
Merci, je reviens dès que j’ai du résultat :blush:

Vu le message d’erreur ça sent des soucis d’écriture sur ton SSD ?
Problème d’alimentation ? Problème d’usb ?

après vous continuez a aimer le rpi pour sa stabilité c’est le combienième user ces derniers jours à avoir des soucis avec leur rpi quand tu vois le prix d’un rpi aujourd’hui faut vraiment bannir cette plateforme :sweat_smile::laughing:</coup de gueule>

1 « J'aime »

Tout dépend l’utilisateur, depuis mes débuts sur HA, j’ai commencer sur un RPI3B et puis un RPI4 4Go et aucun soucis. Le RPI a ces avantages et inconvénients, mais de la a bannir faut pas déconner :wink:

1 « J'aime »

Effectivement j’ai eu la même idée au départ au sujet de la corruption du ssd, mais tout fonctionne parfaitement, hormis par moment cette pseudo coupure qui plante tout…

Tes secondes idées rejoignent celles avancées précédemment, je vais déjà essayer simplement le retrait d’un dongle, vérifier mes branchements du zigbee, voir les éventuels changements…

Merci :blush:

Bonjour,
tout les câbles USB > SATA ou boitier et les SSD ne sont pas compatible avec le RPI + HAOS.

un site qui référence les cables, boitiers et SSD compatible avec le RPI.

Regarde ce sujet, ca marcher et planter de temps en temps. Changement de cable USB et tout est OK

Comme le dit @Giga77 , PORT USB3 pour le SSD sur un RPI. Tu auras de meilleur performance ( pas enorme ) que sur un port USB2.

Bonjour,

Pour le moment, pas d’amélioration :smiling_face:

Le retrait du dongle Zwave non utilisé pour le moment n’a pas amélioré, le changement de ports ou déplacement du ssd pour d’éventuelles interférences par exemple non plus…

Information complémentaire : la sollicitation (charge) du rpi n’interfère pas ou ne provoque pas l’erreur. D’ailleurs il est fréquent que ce soit en pleine nuit lorsque il est ‹ au repos › que ça crash…

Une piste pour voir si ça vient du stockage, essayer temporairement de mettre l’os sur une sd et voir sur plusieurs jours. Si ça tiens c’est l’alimentation ou le ssd.

C’est soit ton câble USB pour le SSD ou le SSD qui est pas 100% compatible avec HAOS.

Bonjour à tous !

Peu de retour pour le moment, j’ai essuyé plusieurs coupures enedis ces 2 dernières semaines donc pas vraiment de recul sur d’éventuels changements…

Pour info, j’ai essayé de déplacer le ssd et son câble qui étaient en contact avec plusieurs alimentations dans un tableau (fils et transfo multiples).
Je n’ai eu qu’un seul crash depuis 2 semaines, mais je ne sais pas si c’est une coïncidence.

Mon dernier crash cette nuit indiquait en premier lieu le défaut suivant:



A voir…

Bonjour @SYLVAIN_MOI,

je rencontre le même problème depuis plusieurs mois, à savoir crash sans raison, plateforme inaccessible et rien d’intéressant dans les logs. Je suis également avec un RPI3 et clé Zigbee Conbee2.

Lorsque ça arrive (tous les 2 à 3 jours), le système reste inaccessible pendant plusieurs heures (entre 10 et 24h, parfois plus). En enlevant la clé Zigbee (Conbee2) plus de problème, en la rebranchant et lançant l’intégration, ça crash. Selon moi (à confirmer), le watchdog passait son temps à essayer de démarrer l’intégration qui plantait.

Ici avec les dernières mises à jour (Core 2024.7.0, Supervisor 2024.06.2, OS 12.4 et Z2M en 1.39.0), j’ai perdu complètement l’accès à Z2M qui refusait de démarrer et lorsque j’essayais de le lancer surchargeait le système à cause de reboot automatique de l’intégration.

J’ai donc creusé un peu du côté de Z2M et ai trouvé ce post : Raspberry Pi bootloop after 12.3 update (usb related) · Issue #3362 · home-assistant/operating-system · GitHub et notamment cette réponse : Raspberry Pi bootloop after 12.3 update (usb related) · Issue #3362 · home-assistant/operating-system · GitHub

En ajoutant 1 ligne dans le fichier config.txt de la partition boot j’ai réglé le problème de démarrage de Z2M. Je manque un peu de recul sur la stabilité du système mais ça pourrait certainement être une piste à creuser!

Bons tests :wink:

Salut Bumblebee :smiling_face:

Ta remarque m’interpelle car je note à présent des similitudes de mon côté :

  • ce sont mes éléments zigbee qui figent lorsque HA ‹ crash ›, alors que mes accès au reste et mes entrées booleans sont toujours accessibles (mais forcément non opérantes)
  • j’ai à chaque fois la sensation que c’est un plantage qui surcharge le système (comme quand on a un logiciel qui plante dans Windows, où tout se fige tant qu’on a pas mis fin à la tâche qui surcharge le système)
  • j’ai eu plusieurs fois des soucis d’intégrations de nouveaux éléments dans le système, où z2m ne trouvait pas etc, et où je m’étais rendu compte que le retrait/remise de la clés zigbee conbee 2 remettait les choses en fonctionnement normal
  • j’ai perdu tout mon système lors de la réalisation des dernières mises à jour: toutes mes intégrations modules zigbee étaient inaccessibles (et donc toutes mes automatisations ko). En fouillant, tout était pourtant bien accessible et présent sur z2m, et fonctionnait en allant les chercher directement. Mais tous les noms désignations etc étaient changées et donc plus retrouvées par HA )
  • en faisant des backup successifs, j’ai fini par résoudre ce problème lorsque je suis remonté au delà de la mise à jour de Z2m…

Par contre, je suis loin d’avoir ton niveau pour creuser plus de mon côté ! :sweat_smile:

En soi, la solution n’est pas trop complexe à tester (trouver l’info par contre :smiley: )

Tu peux tenter :

  1. Éteindre proprement ton système HA.
  2. Selon ta configuration, connecter ta carte SD ou disque SSD du RPI dans un autre PC.
  3. Tu devrais trouver une petite partition en FAT (je pense qu’elle s’appelle boot), c’est normalement la première sur ta carte. Tu dois pouvoir y accéder depuis Windows (gestionnaire de disques/partition) ou via gParted sous Linux.
  4. A la racine, de la partition, tu as un fichier config.txt, tu peux l’éditer et ajouter à la fin du document la ligne

dtoverlay=dwc2

Sur github, certains conseillent d’utiliser Notepad++ sous Windows pour éditer le fichier.

Une fois fini, tu remets le tout dans le Rpi et si tu as de la chance, le problème est réglé. Pour ma part, c’est stable depuis plus de 24h. Une première depuis plusieurs mois.

Si je peux encore aider, n’hésite pas :wink: