PVE 故障 500,虚拟机无法重启,如何处理?
PVE 今天突然故障了,请教下如何处理?现象如下:
SSH 可以正常连接,但有些命令无法执行,reboot 重启也无效,虚拟机和宿主机都无法关机或重启
PVE 管理页面 local-lvm 报错:no such logical volume pve/data(500),如图
是一台 AMD 小主机,配的一块 M2 固态。用了快一年了,一直没动过。
是不是额外的磁盘没挂上,重新挂一下看看,不然就是磁盘有问题
no such logical volume pve/data(500) 磁盘掉了/坏了 ?
实体机看看 raid 挂了没
开 ssh ,我帮你远程看下
感觉是盘挂了,建议描述下硬件情况
最近没动过硬盘,怎么重新挂载?
别啊,这个 AMD 小主机,刚用了没一年呢
内网机器不方便远程呢
AMD 小主机,配的一块 M2 固态 1T ,常年开着,跑一些 docker ,平时开发用
看下主机在线时间,如果没重启过,就是硬盘坏了
大概率硬盘挂了,重新接下 m2 再开机吧
如果开不了,那只能换硬盘重装系统了
目测 SSH 能连接,fdisk 把 locla-lvm 分区容量扣 10G 下去
如果是硬盘坏了,为啥 SSH 能连接,文件内容也能看到。好奇怪
怎么执行?在 pve 终端执行命令都返回:-bash: /usr/bin/*: Input/output error
minio.hoopan.net/lobe/files/482478/f808658b-832b-470f-a189-b6569301d531.png
df -h
pvs
vgs
lvs -a
fdisk -l
lsblk
blkid
都贴一下吧
dmesg
journalctl -e
看看日志里的 error
pve 宿主机 journalctl 日志
报错日志: minio.hoopan.net/lobe/files/482478/6a07683c-ce64-489b-8df0-3d6ff4e666d4.png
上面是日志,麻烦看下
-bash: /usr/bin/*: Input/output error 这就是硬盘读取失败最明显的信息
硬盘坏了,但是常用文件在内存缓存内,所以直接读内存返回了
别挣扎了,就是硬盘故障。如果有重要的小文件,可以尝试备份下
然后关机重新接下硬盘,看能不能恢复(有时候接口问题或硬盘、控制器过热,重新接下可能会恢复)
你的日志也指向了硬盘故障
不信群里大佬的分析,你就让 AI 分析日志吧
终端上 Input/output error 就是盘坏掉了,而且你这前面的路径是系统盘路径。
vm 上能 ssh 就 ssh 上去把数据备份下。然后准备一个 ISO 的 Linux 启动到内存修复下 pve 的系统盘试试
前段时间刚坏过一块硬盘,也是一样的 Input/output error ,只不过我的是数据盘,不是系统盘,也是一块固态,所以确定是硬盘坏了,不要重启,抓紧时间备份换硬盘吧,重启了可能就起不来了
有一定概率重启自动 fsck 就好了
测试机,倒没什么重要数据,就是要重新安装一遍,烦。这吊固态没有 nas 的机械盘稳
嗯嗯,晚点我试试
大概率是你改了 ip 或者 hostname 导致的
不对,应该就是磁盘掉了,不一定是磁盘问题,也有可能是主板问题。
你应该 fsck 先尝试修复,不行的话,试试换到别的主板上。如果别的主板也不行,那就是磁盘换了
想拿来膜拜一下,V3 和 R1 的。还有量化方案也在里面么? 没有开源源代码 ,只有论文,你去复现吧 好像是模型免费下载, 国产就是善于创造概念,这么算 gimmy 也…
jetbrains 的许可是一年一年续的,教育许可还没到期就要入职了但是教育许可还没到期的时候,用不了 6 折优惠,现在看价格还是$289准备等到期了再用 6 折优惠买,所以想…
Computer World上有人评出了有史以来十大臭名照著的操作系统,我们来看看倒底有那些,顺便也回顾一下操作系统的历史。下面的顺序通过时间顺序由古至今。 目录 OS/3…