Suite à quelques modifications dans mon Proxmox VE, je ne parviens plus à y accéder. J’étais occupé à configurer Proxmox Backup Server et d’un seul coup, je n’ai plus accès à l’administration de mon VE.
Mes VM et LXC restent accessibles sauf une (Open Media Vault sur VM, récemment installé, j’étais d’ailleurs en train de la redémarrer)
IP Proxmox VE toujours accessible (répond au ping dans cmd dos)
Proxmox Backup Serveur sur port 8007 : interface ok
MAIS Proxmox VE sur port 8006 : interface inaccessible, timeout
Ce site est inaccessible
192.168.1.220 a mis trop de temps à répondre.
Voici quelques conseils :
Vérifier la connexion
Vérifier le proxy et le pare-feu
Exécutez les diagnostics réseau de Windows
ERR_TIMED_OUT
Que préconisez-vous ?
Reboot complet de la machine, à l’arrache du coup car plus d’interface visuelle ?
Accès par SSH ? Je n’y connais pas grand chose malheureusement…
HA et ZB2MQTT fonctionnent toujours… Et c’est bien le principal mais si je me vautre en rebootant, tout est HS.
Merci déjà pour votre aide, première grosse flippouille de l’année HELP !
Comme on ne sait pas en quoi consistent les “quelques modifications”, difficile de deviner ce qui aurait pu provoquer le problème et de proposer une correction.
Dans l’immédiat, si tu souhaites redémarrer :
arrêter proprement les VMs et LXC auxquels tu as accès
redémarrer Proxmox en ssh : la commande sous root est “shutdown -r now”, si tu utilises un autre compte, la commande est “sudo shutdown -r now”
Tu peux aussi consulter les logs avant de redémarrer, la commande est “journalctl”, précédé de “sudo” si lancement depuis un compte non root
Et vérifier si le port 8006 est en écoute : “ss -an | grep ^tcp.*8006”
Mais, si ton accès SSH nécessite une authentification par clé, tu risques de ne pas pouvoir te connecter si tu n’as rien préparé à l’avance.
Dans le futur, je te conseille vivement d’étudier le mode CLI de Proxmox; ça peut aider parfois.
J’étais occupé à (tenter de) configurer Proxmox BS.
Je venais de créer un datastorage dans BS.
Ma VM Open Media Vault avait l’air de planter, j’ai simplement cliqué sur rebooter la VM (peut-être 2x par inadvertance).
Voici ce que donne l’écoute du port, plusieurs lignes de ce type :
Rien n’est à l’écoute sur ce port (aucune ligne à l’état LISTEN)
Pour vérifier :
systemctl status pveproxy
Pour relancer
systemctl start pveproxy
Si le service redémarre, tu peux vérifier s’il est à l’écoute
Sinon, tu peux essayer de redémarrer comme indiqué ci-dessus et, si le service pveproxy échoue à démarrer, voir les logs
systemctl –all
EDIT : je n’avais pas vu le journal dans ton message précédent.
La commande journalctl est très verbeuse. Il faut paginer. Si ta machine est à la bonne date, le journal commence en Juillet. Sinon, il te faudrait synchroniser sur un serveur de temps; ça aide quand on recherche dans les journaux.
EDIT 2
Pour filtrer le journal, par exemple pour restreindre aux évènements du jour :
journalctl –since today
La commande journalctl a pas mal de paramètres. Pour avoir la doc de la commande :
Mon HA a complètement laché en plein backup (sauvegardes internes HA).
Il ne me restait plus qu’un container ou deux qui fonctionnaient.
Du coup et vu que je devais aller faire une course (et surtout que cela me passerait le temps sans trop stresser), j’ai redémarrer la machine. La cmd reboot ne fonctionnant pas en SSH, à l’arrache OFF > ON et adevienne que pourra…
Surprise en revenant, tout refonctionne et est ok. Absolument tout d’ailleurs, y compris mon NAS OVM, la VM que j’avais tenté de rebooter. J’ai de nouveau accès à l’interface visuelle de Proxmox.
Reste à savoir d’où celà vient ?
« journalctl –since today » ne fonctionne pas en revanche…
Je déstresse déjà un peu mais l’impression d’avoir une épée de damoclès au-dessus de la tête, je vais vite mettre en place Proxmox BS.
Bizarre que l’affichage du journal du jour ne fonctionne pas. Tu as un message d’erreur ou aucun affichage ?
Si aucun affichage, peut-être un problème de mise à la date du serveur.
Tu as bien mis deux fois le signe - devant since ?
Tu peux aussi taper uniquement journalctl et paginer
Sur mon proxmox, en filtarnt les 5 dernières lignes :
root@pc-gv-37:~# journalctl --since today | tail -5
Jan 02 19:02:37 pc-gv-37 smartd[846]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 30 to 31
Jan 02 19:08:05 pc-gv-37 pvedaemon[2701460]: <root@pam> successful auth for user 'root@pam'
Jan 02 19:17:01 pc-gv-37 CRON[1614981]: pam_unix(cron:session): session opened for user root(uid=0) by root(uid=0)
Jan 02 19:17:01 pc-gv-37 CRON[1614983]: (root) CMD (cd / && run-parts --report /etc/cron.hourly)
Jan 02 19:17:01 pc-gv-37 CRON[1614981]: pam_unix(cron:session): session closed for user root
J’arrête de polluer ce fil puisque le sujet est résolu.
Celà fonctionne, j’avais effectivement mis un trait d’union de trop
Peut-on filtrer par code erreur (lignes rouges) car même trié sur la journée, j’ai près de 1500 lignes…
En voulant faire une sauvegarde container par container, je viens de recréer le problème et j’ai du de nouveau rebooter au mini PC.
J’avais auparavant dans la journée ajouté des stockages en NFS sur PVE.
Celà pourrait-il venir de là ?
Je les avais créé pour pouvoir y envoyer mes backups n’ayant pas 2 disques en local sur le mini PC.
Toujours est-il que je viens de les supprimer ainsi que le stockage créé par PBS.
Je n’ai plus que local et local-lvm.
Pour les journaux :
root@pve:~# journalctl -p 3 --since today
Jan 02 12:48:19 pve pveproxy[1492867]: got inotify poll request in wrong process - disabling inotify
Jan 02 15:22:11 pve kernel: INFO: task mkfs.ext4:1572335 blocked for more than 122 seconds.
Jan 02 15:22:11 pve kernel: Tainted: P O 6.8.12-9-pve #1
Jan 02 15:22:11 pve kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
Jan 02 15:24:14 pve kernel: INFO: task ksmd:72 blocked for more than 122 seconds.
Jan 02 15:24:14 pve kernel: Tainted: P O 6.8.12-9-pve #1
Jan 02 15:24:14 pve kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
Jan 02 15:24:14 pve kernel: INFO: task khugepaged:73 blocked for more than 122 seconds.
Jan 02 15:24:14 pve kernel: Tainted: P O 6.8.12-9-pve #1
Jan 02 15:24:14 pve kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
Jan 02 15:24:14 pve kernel: INFO: task mkfs.ext4:1572335 blocked for more than 245 seconds.
Jan 02 15:24:14 pve kernel: Tainted: P O 6.8.12-9-pve #1
Jan 02 15:24:14 pve kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
Jan 02 15:26:17 pve kernel: INFO: task ksmd:72 blocked for more than 245 seconds.
Jan 02 15:26:17 pve kernel: Tainted: P O 6.8.12-9-pve #1
Jan 02 15:26:17 pve kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
Jan 02 15:26:17 pve kernel: INFO: task khugepaged:73 blocked for more than 245 seconds.
Jan 02 15:26:17 pve kernel: Tainted: P O 6.8.12-9-pve #1
Jan 02 15:26:17 pve kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
Jan 02 15:26:17 pve kernel: INFO: task mkfs.ext4:1572335 blocked for more than 368 seconds.
Jan 02 15:26:17 pve kernel: Tainted: P O 6.8.12-9-pve #1
Jan 02 15:26:17 pve kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
Jan 02 15:28:20 pve kernel: INFO: task ksmd:72 blocked for more than 368 seconds.
Jan 02 15:28:20 pve kernel: Tainted: P O 6.8.12-9-pve #1
Jan 02 15:28:20 pve kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
Jan 02 15:28:20 pve kernel: INFO: task khugepaged:73 blocked for more than 368 seconds.
Jan 02 15:28:20 pve kernel: Tainted: P O 6.8.12-9-pve #1
Jan 02 15:28:20 pve kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
Jan 02 15:28:20 pve kernel: INFO: task mkfs.ext4:1572335 blocked for more than 491 seconds.
Jan 02 15:28:20 pve kernel: Tainted: P O 6.8.12-9-pve #1
Jan 02 15:28:20 pve kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
Jan 02 16:48:10 pve proxmox-backup-api[1484262]: failed to gather smart data for /dev/sdb – command "smartctl" "-H" "-A" "-j" "/dev>
-- Boot 2546951c29f0429d88a5ccf890cbdf77 --
Jan 02 16:55:27 pve kernel: x86/cpu: SGX disabled by BIOS.
Jan 02 17:01:06 pve kernel: Memory cgroup out of memory: Killed process 4912 (frigate.embeddi) total-vm:5517232kB, anon-rss:1487192>
Jan 02 19:49:16 pve pvestatd[1173]: VM 106 qmp command failed - VM 106 qmp command 'query-proxmox-support' failed - got timeout
Jan 02 19:49:44 pve pvestatd[1173]: VM 106 qmp command failed - VM 106 qmp command 'query-proxmox-support' failed - unable to conne>
Jan 02 19:50:09 pve pvestatd[1173]: VM 106 qmp command failed - VM 106 qmp command 'query-proxmox-support' failed - unable to conne>
Jan 02 19:50:30 pve pvestatd[1173]: VM 106 qmp command failed - VM 106 qmp command 'query-proxmox-support' failed - unable to conne>
Jan 02 19:50:49 pve pvestatd[1173]: VM 106 qmp command failed - VM 106 qmp command 'query-proxmox-support' failed - unable to conne>
Jan 02 19:51:09 pve pvestatd[1173]: VM 106 qmp command failed - VM 106 qmp command 'query-proxmox-support' failed - unable to conne>
Jan 02 19:51:30 pve pvestatd[1173]: VM 106 qmp command failed - VM 106 qmp command 'query-proxmox-support' failed - unable to conne>
Jan 02 19:51:51 pve pvestatd[1173]: VM 106 qmp command failed - VM 106 qmp command 'query-proxmox-support' failed - unable to conne>
Jan 02 19:52:00 pve pvedaemon[1189]: authentication failure; rhost=::ffff:192.168.1.53 user=root@pam msg=Authentication failure
Jan 02 19:52:12 pve pvestatd[1173]: VM 106 qmp command failed - VM 106 qmp command 'query-proxmox-support' failed - unable to conne>
Jan 02 19:52:20 pve pvedaemon[1189]: authentication failure; rhost=::ffff:192.168.1.53 user=root@pam msg=Authentication failure
-- Boot a2c3e9e3024f479ca77091bef046dc83 --
Jan 02 19:56:21 pve kernel: x86/cpu: SGX disabled by BIOS.
Jan 02 20:00:47 pve pvedaemon[1186]: authentication failure; rhost=::ffff:192.168.1.53 user=root@pam msg=Authentication failure
Jan 02 20:02:06 pve kernel: Memory cgroup out of memory: Killed process 4284 (.trace) total-vm:2437616kB, anon-rss:1915532kB, file->
Jan 02 20:04:05 pve proxmox-backup-api[833]: authentication failure; rhost=[::ffff:192.168.1.252]:55792 user=root@pam@pbs msg=user >
Jan 02 20:04:16 pve proxmox-backup-api[833]: authentication failure; rhost=[::ffff:192.168.1.252]:57908 user=root@pbs msg=user acco>
Jan 02 20:04:47 pve kernel: Memory cgroup out of memory: Killed process 5008 (frigate.embeddi) total-vm:5518244kB, anon-rss:1177864>
root@pve:~# journalctl -u pveproxy -p 3 --since today
Jan 02 12:48:19 pve pveproxy[1492867]: got inotify poll request in wrong process - disabling inotify
Sans certitude que ce soit la cause du blocage : “Memory cgroup out of memory” … apparemment concerne une VM Frigate.
Si tu peux ne pas démarrer cette VM et vérifier si le problème persiste.
Il y a aussi des ‘authentication failure” concernant le backup, je suppose vers un stockage réseau. Vérifie la configuration.
Je ne vais pas pouvoir t’aider sur ce dernier sujet. Avec les logs, regarde si tu trouves des informations sur le support proxmox, ou sur un forum plus spécialisé, si personne ne prend le relais ici.
Ce que tu peux faire pour vérifier le journal au fur et à mesure des actions, en CLI :
journalctl -f
Les évènements s’affichent en continu au fil de l’eau, donc tu lances une action et tu regardes ce qui bouge dans le journal.