<div dir="ltr">Hello,<div><br></div><div>I&#39;m managing smaller private virtualization infrastructure, currently based on CentOS 7.x. In the past we were running mostly on Debian 7 (kernel 3.2.x) and CentOS 6.x without problems.</div><div><br></div><div>After we have upgraded to CentOS 7.x, I have experienced occasional physical host crashes when I did e.g. suspend or resume more virtual machines OR random virtual machine checkpoint was invalid and VM could not be resumed.</div><div><br></div><div>I did few intesive tests on same hardware with:</div><div>- CentOS 6.6 ... worked fine</div><div>- CentOS 7.1 with</div><div> 1. CentOS distribution kernel ... failed</div><div> 2. Binary RHEL 7.1 distr. kernel ... failed</div><div> 3. vanilla 3.10.80 kernel ... failed</div><div>(plus various firmware releases and BIOS configurations)</div><div><br></div><div>So far I could reliably run only CentOS 7.x with latest 4.0.5 kernel from ElRepo.</div><div><br></div><div>7.x kernel is based on 3.10.x, which failed for me as well. So I think there was some bug in KVM, which led to memory corruption. The result was either kernel oops or broken checkpoint and kernel oops occured later.<br></div><div><br></div><div>I have opened bug on Red Hat</div><div><a href="https://bugzilla.redhat.com/show_bug.cgi?id=1231964">https://bugzilla.redhat.com/show_bug.cgi?id=1231964</a><br></div><div>but since it&#39;s a private bug, I have created duplicate bug on CentOS</div><div><a href="http://bugs.centos.org/view.php?id=8949">http://bugs.centos.org/view.php?id=8949</a><br></div><div><br></div><div>There is described how to reproduce the problem including stress test script.</div><div><br></div><div>I would appreciate if anybody can confirm it happens for him as well.</div><div><br></div><div>Best regards,</div><div>Vlastimil Holer</div></div>