Crash Quotidien

Bonjour à tous
J’ai régulièrement des crash en série, du genre 1 fois par jours ou tous les quelques jours. Puis cela disparait, pour revenir plus tard.

Quand cela plante, plus d’accès à lovelace, le RPI 3 ne répond plus au ping, plus de SSH etc…
Je suis obligé de rebooter le RPI.
Dans les logs je ne vois rien de spécial.

Je suis passé en HDD externe, j’ai eu l’impression que ça avait amélioré, mais là ça recommence depuis qques semaines sans que je puisse relier à un changement quelconque de ma config.
Je monitore la mémoire SWAP ainsi que la charge CPU, mais je ne vois rien de choquant.
Swap entre 30 et 50%. Charge CPU < 10%

Auriez-vous une idée de quels paramètres au niveau du RPI je devrais surveiller outre le swap et la charge CPU ?
J’aimerais me créer des notifications pour surveiller l’évolution du RPI et tacher de détecter l’origine du pb.

merci d’avance et belle journée à tous

bonjour,
qu’as tu comme alimentation? je chercherais par la .
3A?
pour la surveillance du rpi
https://forum.hacf.fr/t/monitoring-rpi/142
stefan

Bonjour,

on est bien d’accord que tu a un disque externe mais plus de SD même pour le boot ?
effectivement, grande chance que cela vienne de l’alim mais on peut aussi imaginer une surchauffe du RPI bien que ce ne soit pas un 4 … ou un RPI défectueux …

Merci pour vos retours.
Côté alim et corruption carte SD, je pense que j’ai déjà bien blindé la chose:

  • alim de 3A
  • pas de carte SD.
  • mais un HDD (pas un SDD) branché sur un port USB du RPI3 et sur un hub USB alimenté.

Je vais rajouter les paramètres suggérés. Merci @steffleur pour la liste !!
J’avais aussi créé une automation qui fait redémarrer l’OS toutes les semaines. Je vais passer la fréquence à tous les jours.

Là je suis en installation « Home Assistant Operating System »
Est-ce que vous savez si un autre type d’installation notamment « Home Assistant Container: » pourrait être plus stable ?

Bon début de WE

ce n’est pas une installation officielle alors ?
c’est quoi ton os de base ?

bonjour,
maintenant que tu as le monitoring, je sais pas si c’est Français. regarde ta température. voir fait une alerte si elle dépasse 60c°.
on continue a chercher.
stefan

Je suis en installation standard dite « Home Assistant Operating System », tel que cela apparait sur le site de Home Assistant, celle qui apparait en premier dans la page pour RPI.
Donc que du standard.

pas mieux pour « monitirisation » alors que je vais dire « monitoring » :wink:

Donc monitoring en place, et sur 24h tous les paramètres sont stables. La température ne dépasse pas 50°C, et les autres paramètres ne me semblent pas anormaux pour le moment. J’attends que cela plante.

image

Bonsoir, qu’as tu comme addons pour utiliser 70% de ram?
Eyenotion ou un autre traitement de vidéo.stefan

Hello,

j’ai exactement le même problème : crash quasi quotidien, sans raison apparente évidente (saturation mémoire ou autre), après être passé de ma SD à un SSD PNY…
J’ai changé mon Pi3B+ pour un Pi4 8Go → Les crash continent
J’ai supprimé toutes mes intégrations pour voir si l’une d’elle pouvait poser problème → Les crash continent
J’ai changé mon alim (alors que c’était l’alim officielle) → Les crash continent

La dernière piste sur laquelle je suis : des erreurs d’accès disque sur mon SSD. J’ai re-basculé sur la SD pour voir si il tient (et ça semble marcher), la prochaine étape sera donc de creuser côté SSD. Peut-être que le disque n’est pas de bonne qualité, ou bien que le hub alimenté n’a pas une alim fiable …

Rien de bien lourd:

  • clef zigbee + 1 dizaine de périphériques
  • clef Zwave + 1 dizaine de périphériques
  • aucun traitement vidéo
  • plusieurs automatisations pour la surveillance d’ouverture de porte etc…
  • pas de reconnaissance vocale (pas encore, je suis en train de regarder Rhasspy, mais il ne tourne pas en prod).
    Je vais voir si je trouve au niveau linux ce qui pourrait consommer la RAM car tu as raison, 70% ça fait bcp.

j’aillais essayer de désactiver les intégrations et les automatisations, mais du coup je vais regarder côté HHD (je ne suis pas en SSD), même si je ne pas trop par où commencer à chercher. Des commandes Linux magiques ?

Peut-être faire un backup pour le relancer depuis une carte SD, et voir s’il arrive à tourner plusieurs jours sans planter ?

Bonsoir.
Regarder aussi les log
Si tu as un fonction SMS ou notif
Fais une automatisation avec pour déclencheur ha démarre
Comme ça tu saura a quel heure regarder dans tes log
Stefan

Comment avez-vous transféré votre support sd vers hdd ?

Je demande ça parce qu’il m’est arrivé sur un modèle de carte SD d’avoir des corruptions de fichiers qui faisait planter l’os lors de la lecture.

D’apparence tout fonctionnait, les commandes ‹ ls › aussi, rien d’anormal, les analyses de disque e2fsck aussi, mais dès que le système voulait ouvrir le fichier bing, plantage. En particulier sur des fichiers logs (mais j’ai vu ça sur des fichiers autre, tel que sur des fichiers utilisés par dpkg).

Pour repérer ça j’avais de mémoire fait des ‹ du › par répertoire, il me semble me souvenir que le ‹ du › plantait sur ces fichiers…

Alors si vous avait le même problème et que vous avez cloné votre sd, il n’est pas impossible que cela vienne de ça.

1 « J'aime »

Hello @tygerlord,
Je fais un backup de la SD dans HA que je sauvegarde sur un NAS.
Sur le SSD j’installe HA (via l’image ISO proposée sur le site) puis je restaure le backup de la SD sur le SSD.

Je reçois le SSD de remplacement dans la journée, je vais voir si c’était bien ça :slight_smile:

1 « J'aime »

Bonjour,

Je rencontre exactement le même problème de crash quotidien, avez vous trouvé l’origine de votre problème @Moema?

Bonsoir @BanBan
J’allais répondre que depuis que j’avais remonté le problème, il ne s’était plus reproduit depuis novembre et puis patatra, RPI en mode freeze depuis ce matin.
J’attends de voir s’il se récupère tout seul lors du reset hebdomadaire programmé et voir si j’ai l’historique des indicateurs que l’on m’avait suggéré plus haut.

Donc pour répondre à la question, problème pas résolu. Et certainement, que le problème va se reproduire les prochains jours avant de disparaitre à nouveau comme il est apparu…C’était ce qui s’était produit la dernière fois

Dans la GUI home assistant nous n’avons que les logs depuis le dernier reboot est’il possible de trouver les logs avant un crash ?

Salut,
Il y a le fichier home-assistant.log (logs actuels) et home-assistant.log.1 (avant le dernier reboot) accessibles par l’editeur par exemple

1 « J'aime »