aliyun ECS 云服务器,在业务量没有明显变动的情况下,突然 CPU 是平时负荷的两倍了。
流量没变、内存使用没变、各个指标都稳定。就是 CPU 翻倍。虽然整体水平不高,但是担心业务出故障啊。
几个工程师,排查了一上午,没有结果,正在一筹莫展的时候,刚刚突然又降下来了,恢复到正常了。
感觉就像 CPU 降频一样的效果。

我不了解,就我的感觉来说,正常的 100% 基础性能实例,不会这样,是不是用的突发性能型?

利用率检查不下来? windows 系统的话很可能是杀毒软件工作了

你那台机器刚好在业务开通高峰期吧,我有的机器每个月月底的性能和月初的差距 30%

阿里云应该有超卖的

超售基操了

什么规格的?

不是独占机器的话,可能因为同一母机的其他 ecs 影响到了

超售

说规格啊大哥

感谢各位大哥的热心帮助,不知道规格是什么意思啊?是说 CPU/Mem/Disk/Band 么?这个应该没有影响吧。
还是说有共享型和独占型的么?我这个是 e 系列的,估计是共享的吧。不知道在什么地方看。

e 系列出现这种问题不是很正常吗,共享资源啊!你的邻居正在影响你,e 不适用于关键业务,正儿八经的应该去买 c r g

几个工程师,排查了一上午,找个靠谱的运维都不会去买 e

不错了,几个工程师没有甩锅 CPU 的 bug ,都挺靠谱的

感谢,这是一个闲置的服务器,本想用一下,看样子要迁移了。

有排除过睿频影响吗?

《调整 C-state 状态以降低 vCPU 的响应延迟》
help.aliyun.com/zh/ecs/use-cases/change-c-state-status-to-reduce-vcpu-response

阿里云 e 系列和突发性 t 系列都不要买来用来主业务,我的客户最次也推荐购买 u 实例,可以聊聊沟通一下+alyunflc

#14 经济型实例规格族 e ?

一般不会。就算是竞技性实例规格也不会。反应到你的业务负载上。
但突发性的会,因为没积分了。限额。表现就是 cpu 突然炸了

如果有进程使用了 AVX512 指令集的话……

我司还出现过 cpu 突然爆满,磁盘读写爆满,然后机器卡死只能重启的情况。不知道阿里的问题还是操作系统的问题

看不到进程吗?没日志?没 atop ?
我们有过业务 bug 导致 cpu 暴涨的

非计算型主机一律买突发性能实例,只要你自己的 cpu 不超,别人是影响不到你的。

#12 我是运维,我们公司用的性能突发实例。没办法实在是太便宜了

资源是可以动态分配的,在你开机情况下是可以调整你的内存和处理器的。

对不起哥,冒昧了

#23 你们使用经验看:业务机器用突发实例够用稳定?

总体来说还是挺稳定的,一年可能会出现个几次虚拟机卡住或者说是突发的 cpu 性能跟不上的情况