Plus d'accès à HA depuis orage

Bonjour,

Suite à un orage tout à l’heure, j’ai ma VM sur Proxmox qui a été éteinte puis redémarrée. Problème : j’ai eu un accès chaotique à HA avec des coupures et une grosses latence.
J’ai juste vu le message d’erreur : « Error returned from Supervisor: System is not ready with state: setup ».
J’ai eu tout le mal du monde à lancer la commande « supervisor repair » sur la console vu les déconnexions.
Après plusieurs dizaines de minutes, ne voyant rien, j’ai fait un redémarrage de la VM et depuis je n’ai plus du tout accès à la console de la VM.
Je ne peux donc lancer aucune commande. Je ne sais plus trop comment prendre le problème.
Pouvez vous m’aider ?

Merci d’avance

Tu as une visu sur la console ou rien du tout ? Que disent les logs de la vm ?

Justement je viens de redémarrer carrément le mini PC, j’ai réussi à avoir une console. J’en ai profité pour saisir la commande « banner ».
Mais j’ai un joli « déconnecté » au bout de quelques secondes…puis « en cours de connexion » et ça tourne…

Tu as d’autres vm sur ce proxmox ? Que disent les logs de la vm ?

Yes j’ai Ag Guard.
J’ai ça dans le journal système du noeud :

Jun 01 20:47:48 pve kernel: usb 1-4: reset full-speed USB device number 2 using xhci_hcd
Jun 01 20:47:57 pve postfix/smtp[1053]: connect to gmail-smtp-in.l.google.com[66.102.1.27]:25: Connection timed out
Jun 01 20:47:57 pve postfix/smtp[1053]: connect to alt1.gmail-smtp-in.l.google.com[2a00:1450:4013:c1c::1a]:25: Network is unreachable
Jun 01 20:47:57 pve postfix/smtp[1052]: connect to gmail-smtp-in.l.google.com[66.102.1.27]:25: Connection timed out
Jun 01 20:47:57 pve postfix/smtp[1052]: connect to alt1.gmail-smtp-in.l.google.com[2a00:1450:4013:c1c::1a]:25: Network is unreachable
Jun 01 20:47:57 pve postfix/smtp[1051]: connect to gmail-smtp-in.l.google.com[66.102.1.27]:25: Connection timed out
Jun 01 20:47:57 pve postfix/smtp[1051]: connect to alt1.gmail-smtp-in.l.google.com[2a00:1450:4013:c1c::1a]:25: Network is unreachable
Jun 01 20:48:27 pve postfix/smtp[1053]: connect to alt1.gmail-smtp-in.l.google.com[192.178.156.26]:25: Connection timed out
Jun 01 20:48:27 pve postfix/smtp[1053]: connect to alt2.gmail-smtp-in.l.google.com[2a00:1450:4025:c01::1b]:25: Network is unreachable
Jun 01 20:48:27 pve postfix/smtp[1052]: connect to alt1.gmail-smtp-in.l.google.com[192.178.156.26]:25: Connection timed out
Jun 01 20:48:27 pve postfix/smtp[1052]: connect to alt2.gmail-smtp-in.l.google.com[2a00:1450:4025:c01::1b]:25: Network is unreachable
Jun 01 20:48:27 pve postfix/smtp[1051]: connect to alt1.gmail-smtp-in.l.google.com[192.178.156.26]:25: Connection timed out
Jun 01 20:48:27 pve postfix/smtp[1051]: connect to alt2.gmail-smtp-in.l.google.com[2a00:1450:4025:c01::1b]:25: Network is unreachable
Jun 01 20:48:27 pve postfix/smtp[1053]: 5A40E2132E: to=<test@gmail.com>, relay=none, delay=155822, delays=155762/0.01/60/0, dsn=4.4.1, status=deferred (connect to alt2.gmail-smtp-in.l.google.com[2a00:1450:4025:c01::1b]:25: Network is unreachable)
Jun 01 20:48:27 pve postfix/smtp[1051]: 321172134E: to=<test@gmail.com>, relay=none, delay=239947, delays=239887/0.16/60/0, dsn=4.4.1, status=deferred (connect to alt2.gmail-smtp-in.l.google.com[2a00:1450:4025:c01::1b]:25: Network is unreachable)
Jun 01 20:48:27 pve postfix/smtp[1052]: 1739C2133F: to=<test@gmail.com>, relay=none, delay=414068, delays=414008/0.09/60/0, dsn=4.4.1, status=deferred (connect to alt2.gmail-smtp-in.l.google.com[2a00:1450:4025:c01::1b]:25: Network is unreachable)
Jun 01 20:48:33 pve kernel: EXT4-fs (dm-6): recovery complete
Jun 01 20:48:33 pve kernel: EXT4-fs (dm-6): mounted filesystem 740be695-9175-4599-8573-3b63e2c0cccf r/w with ordered data mode. Quota mode: none.
Jun 01 20:48:35 pve audit[1416]: AVC apparmor="STATUS" operation="profile_load" profile="/usr/bin/lxc-start" name="lxc-101_</var/lib/lxc>" pid=1416 comm="apparmor_parser"
Jun 01 20:48:35 pve kernel: audit: type=1400 audit(1748803715.692:28): apparmor="STATUS" operation="profile_load" profile="/usr/bin/lxc-start" name="lxc-101_</var/lib/lxc>" pid=1416 comm="apparmor_parser"
Jun 01 20:48:36 pve kernel: vmbr0: port 3(veth101i0) entered blocking state
Jun 01 20:48:36 pve kernel: vmbr0: port 3(veth101i0) entered disabled state
Jun 01 20:48:36 pve kernel: veth101i0: entered allmulticast mode
Jun 01 20:48:36 pve kernel: veth101i0: entered promiscuous mode
Jun 01 20:48:36 pve kernel: eth0: renamed from vethNhSsXc
Jun 01 20:48:37 pve pvestatd[1080]: modified cpu set for lxc/101: 0
Jun 01 20:48:37 pve pvestatd[1080]: status update time (44.772 seconds)
Jun 01 20:48:37 pve pve-guests[1120]: <root@pam> end task UPID:pve:00000461:000017F5:683CA049:startall::root@pam: OK
Jun 01 20:48:37 pve systemd[1]: Finished pve-guests.service - PVE guests.
Jun 01 20:48:37 pve systemd[1]: Starting pvescheduler.service - Proxmox VE scheduler...
Jun 01 20:48:37 pve pmxcfs[1055]: [status] notice: RRDC update error /var/lib/rrdcached/db/pve2-storage/pve/backup_proxmox_dd_externe: -1
Jun 01 20:48:37 pve pmxcfs[1055]: [status] notice: RRDC update error /var/lib/rrdcached/db/pve2-storage/pve/local-lvm: -1
Jun 01 20:48:37 pve pmxcfs[1055]: [status] notice: RRDC update error /var/lib/rrdcached/db/pve2-storage/pve/backup_proxmox-usb: -1
Jun 01 20:48:38 pve pmxcfs[1055]: [status] notice: RRDC update error /var/lib/rrdcached/db/pve2-storage/pve/local: -1
Jun 01 20:48:38 pve pvescheduler[1499]: starting server
Jun 01 20:48:38 pve systemd[1]: Started pvescheduler.service - Proxmox VE scheduler.
Jun 01 20:48:38 pve systemd[1]: Reached target multi-user.target - Multi-User System.
Jun 01 20:48:38 pve systemd[1]: Reached target graphical.target - Graphical Interface.
Jun 01 20:48:38 pve systemd[1]: Starting systemd-update-utmp-runlevel.service - Record Runlevel Change in UTMP...
Jun 01 20:48:38 pve systemd[1]: systemd-update-utmp-runlevel.service: Deactivated successfully.
Jun 01 20:48:38 pve systemd[1]: Finished systemd-update-utmp-runlevel.service - Record Runlevel Change in UTMP.
Jun 01 20:48:38 pve systemd[1]: Startup finished in 11.510s (firmware) + 8.150s (loader) + 27.598s (kernel) + 1min 35.000s (userspace) = 2min 22.259s.
Jun 01 20:48:49 pve kernel: vmbr0: port 3(veth101i0) entered blocking state
Jun 01 20:48:49 pve kernel: vmbr0: port 3(veth101i0) entered forwarding state
Jun 01 20:48:50 pve kernel: cfg80211: Loading compiled-in X.509 certificates for regulatory database
Jun 01 20:48:50 pve kernel: Loaded X.509 cert 'benh@debian.org: 577e021cb980e0e820821ba7b54b4961b8b4fadf'
Jun 01 20:48:50 pve kernel: Loaded X.509 cert 'romain.perier@gmail.com: 3abbc6ec146e09d1b6016ab9d6cf71dd233f0328'
Jun 01 20:48:50 pve kernel: Loaded X.509 cert 'sforshee: 00b28ddf47aef9cea7'
Jun 01 20:48:50 pve kernel: Loaded X.509 cert 'wens: 61c038651aabdcf94bd0ac7ff06c7248db18c600'
Jun 01 20:48:50 pve kernel: platform regulatory.0: Direct firmware load for regulatory.db failed with error -2
Jun 01 20:48:50 pve kernel: cfg80211: failed to load regulatory.db
Jun 01 20:51:16 pve pveproxy[1112]: proxy detected vanished client connection
Jun 01 20:51:21 pve pvedaemon[1103]: <root@pam> successful auth for user 'root@pam'
Jun 01 20:51:22 pve pvedaemon[2543]: starting lxc termproxy UPID:pve:000009EF:00006FD0:683CA12A:vncproxy:101:root@pam:
Jun 01 20:51:22 pve pvedaemon[1104]: <root@pam> starting task UPID:pve:000009EF:00006FD0:683CA12A:vncproxy:101:root@pam:
Jun 01 20:51:26 pve pvedaemon[1102]: <root@pam> successful auth for user 'root@pam'
Jun 01 20:51:38 pve pvedaemon[1104]: <root@pam> end task UPID:pve:000009EF:00006FD0:683CA12A:vncproxy:101:root@pam: OK
Jun 01 20:52:43 pve pvedaemon[2884]: starting vnc proxy UPID:pve:00000B44:00008FA8:683CA17B:vncproxy:100:root@pam:
Jun 01 20:52:44 pve pvedaemon[1102]: <root@pam> starting task UPID:pve:00000B44:00008FA8:683CA17B:vncproxy:100:root@pam:
Jun 01 20:53:54 pve pvedaemon[1102]: <root@pam> starting task UPID:pve:00000CBB:0000AB18:683CA1C2:vncproxy:100:root@pam:
Jun 01 20:53:54 pve pvedaemon[3259]: starting vnc proxy UPID:pve:00000CBB:0000AB18:683CA1C2:vncproxy:100:root@pam:
Jun 01 20:54:12 pve chronyd[918]: Source 80.245.24.151 replaced with 51.68.44.27 (2.debian.pool.ntp.org)
Jun 01 20:57:15 pve pvedaemon[1104]: <root@pam> successful auth for user 'homeassistant@pve'
Jun 01 20:57:21 pve pvedaemon[1103]: <root@pam> starting task UPID:pve:00001066:0000FBE4:683CA290:vncproxy:100:root@pam:
Jun 01 20:57:21 pve pvedaemon[4198]: starting vnc proxy UPID:pve:00001066:0000FBE4:683CA290:vncproxy:100:root@pam:
Jun 01 20:57:27 pve postfix/qmgr[1043]: 9A58B21349: from=<root@pve.home>, size=8229, nrcpt=1 (queue active)
Jun 01 20:57:27 pve postfix/qmgr[1043]: 8C31B21356: from=<root@pve.home>, size=15297, nrcpt=1 (queue active)
Jun 01 20:57:27 pve postfix/qmgr[1043]: 6CBD121325: from=<root@pve.home>, size=1148, nrcpt=1 (queue active)
Jun 01 20:57:28 pve postfix/qmgr[1043]: 2F72521350: from=<root@pve.home>, size=8229, nrcpt=1 (queue active)
Jun 01 20:57:38 pve postfix/smtp[4228]: 9A58B21349: to=<stef.peche.fernandes@gmail.com>, relay=none, delay=325817, delays=325807/0.05/10/0, dsn=4.4.3, status=deferred (Host or domain name not found. Name service error for name=gmail.com type=MX: Host not found, try again)
Jun 01 20:57:38 pve postfix/smtp[4229]: 8C31B21356: to=<test@gmail.com>, relay=none, delay=69880, delays=69870/0.08/10/0, dsn=4.4.3, status=deferred (Host or domain name not found. Name service error for name=gmail.com type=MX: Host not found, try again)
Jun 01 20:57:38 pve postfix/smtp[4237]: 6CBD121325: to=<test@gmail.com>, relay=none, delay=421120, delays=421110/0.08/10/0, dsn=4.4.3, status=deferred (Host or domain name not found. Name service error for name=gmail.com type=MX: Host not found, try again)
Jun 01 20:57:38 pve postfix/smtp[4238]: 2F72521350: to=<test@gmail.com>, relay=none, delay=153012, delays=153002/0.04/10/0, dsn=4.4.3, status=deferred (Host or domain name not found. Name service error for name=gmail.com type=MX: Host not found, try again)
Jun 01 20:57:44 pve pvedaemon[1104]: <root@pam> starting task UPID:pve:000010E0:000104F3:683CA2A8:vncproxy:100:root@pam:
Jun 01 20:57:44 pve pvedaemon[4320]: starting vnc proxy UPID:pve:000010E0:000104F3:683CA2A8:vncproxy:100:root@pam:
Jun 01 20:57:47 pve pvedaemon[1103]: <root@pam> starting task UPID:pve:000010EB:00010612:683CA2AB:vncproxy:100:root@pam:
Jun 01 20:57:47 pve pvedaemon[4331]: starting vnc proxy UPID:pve:000010EB:00010612:683CA2AB:vncproxy:100:root@pam:
Jun 01 20:58:28 pve chronyd[918]: Selected source 82.64.247.11 (2.debian.pool.ntp.org)
Jun 01 20:58:28 pve chronyd[918]: System clock TAI offset set to 37 seconds
Jun 01 20:58:42 pve pvedaemon[1103]: <root@pam> end task UPID:pve:000010EB:00010612:683CA2AB:vncproxy:100:root@pam: OK
Jun 01 20:58:56 pve pvedaemon[1104]: <root@pam> end task UPID:pve:000010E0:000104F3:683CA2A8:vncproxy:100:root@pam: OK
Jun 01 21:00:22 pve kernel: sd 6:0:0:0: [sdb] tag#27 timing out command, waited 180s
Jun 01 21:00:22 pve kernel: sd 6:0:0:0: [sdb] tag#27 FAILED Result: hostbyte=DID_ERROR driverbyte=DRIVER_OK cmd_age=186s
Jun 01 21:00:22 pve kernel: sd 6:0:0:0: [sdb] tag#27 Sense Key : Not Ready [current] 
Jun 01 21:00:22 pve kernel: sd 6:0:0:0: [sdb] tag#27 Add. Sense: Logical unit is in process of becoming ready
Jun 01 21:00:22 pve kernel: sd 6:0:0:0: [sdb] tag#27 CDB: Read(10) 28 00 00 00 00 00 00 01 00 00
Jun 01 21:00:22 pve kernel: I/O error, dev sdb, sector 0 op 0x0:(READ) flags 0x0 phys_seg 32 prio class 0

Je dirais que ton disque a pris un coup. Tu as d’autres vm sur ce proxmox ?

1 « J'aime »

J’ai aussi Ad Guard en conteneur LXC. Pas de soucis pour accéder à la console.

En espérant que ce soit juste l’espace alloué a la vm ha.
Je te conseil de crée une nouvelle vm et d’y injecter ta dernière sauvegarde. Puis seulement après de supprimer la vm qui dysfonctionne.

1 « J'aime »

Salut, j’ai aussi le même problème quand je redémarre ma VM haos. Je reste bloqué sur la console avec CLI not ready… je fais aussi des « banner » et « login » et ca finit par redémarrer.

Je n’arrive plus à faire grand chose. Mon serveur Proxmox ne fait que se déconnecter quand je veux y faire quelque chose. Je pense que c’est plus grave que simplement la VM…j’ai des sauvegardes de mes VM Proxmox. Pensez vous qu’il faut restaurer/réinitialiser mon serveur Proxmox ? Si oui comment ?

Clairement c’est ton disk qui est pas en forme. Donc la solution reste de le changer je pense.

Tu le vois dans les logs que le disque est mort ? Ou c’est vu le comportement ?

Merci à toi

Oui le comportement général et les dernière ligne de tes logs notamment.

Je n’ai donc pas le choix que de tout recommencer à 0 sur un autre disque ?

C’est préférable pour la stabilité si tu as toujours le problème. Tu importeras ta sauvegarde après.

Oui, ce qui m’embête c’est tout ce qu’il y a à côté et qu’il va falloir reparamétrer…

salut,
dans tes logs:
1: indiquent des Problèmes de réseau et de connexion. Vérifie les adresses IP, en Utilisant les outils de diagnostic réseau, il se peut qu’il est un conflit d’adresse IP.

Ton pc est connecter en Wifi ou bien par cable?

2: Il y a des erreurs Erreurs de stockage liées à des problèmes de lecture sur le disque. Cela pourrait être dû à un disque défectueux ou à des problèmes de connexion avec le disque.

Vérifie les connexions physiques du disque et assure-toi qu’il est correctement connecté. tu peut également exécuter des tests de diagnostic sur le disque pour vérifier son état de santé avec un autre pc, ou avec un live Usb.

Reparamétrer quoi ? Tu as dit que tu avais des sauvegardes.

Alors j’ai eu également un souci avec mon player qui ne prenait plus l’ethernet…je ne sais pas si cela a un lien.
Mon mini PC est en ethernet.
Pour les diagnostics cela me parait en dehors de mes compétences…et pour le conflit d’IP à part regarder dans ma box les périphériques réseau je ne vois pas trop comment gérer cela.

La clé Coral, les disques pour les sauvegardes (car cela change quand on les déconnecte) etc