<br><br><div><span class="gmail_quote">On 6/20/08, <b class="gmail_sendername">Alwin Roosen</b> <<a href="mailto:alwin.roosen@webline.be">alwin.roosen@webline.be</a>> wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Hi,<br> <br> <br> CentOS release 5 (Final)<br> Kernel 2.6.18-53.1.21.el5 on an i686<br> <br> ws174 login: CPU 1: Machine Check Exception: 0000000000000005<br> CPU 0: Machine Check Exception: 0000000000000004<br> Bank 3: f62000020002010a at 0000000032c93500<br>
 Bank 5: f20000300c000e0f<br> Kernel panic - not syncing: CPU context corrupt<br> Bank 3: f62000020002010a<br> <br><br></blockquote></div><br>
Alwin --><br>
<br>
I would be very, very "surprised" *IF* this wasn't hardware<br>
related.<br>
<br>
Dave Jones wrote a nice little program to help decode this:<br>
<br>
$ parsemce -b 3 -s f62000020002010a -e 5 -a 0000000032c93500<br>
Status: (5) Machine Check in progress.<br>
Restart IP valid.<br>
parsebank(3): f62000020002010a @ 32c93500<br>
        External tag parity error<br>
        CPU state corrupt. Restart not possible<br>
        Address in addr register valid<br>
        Error enabled in control register<br>
        Error not corrected.<br>
        Error overflow<br>
        Memory hierarchy error<br>
        Request: Generic error<br>
        Transaction type : Generic<br>
        Memory/IO : I/O<br>
<br>
and:<br>
<br>
$ parsemce -b 5 -s f20000300c000e0f -e 4 -a 0<br>
Status: (4) Machine Check in progress.<br>
Restart IP invalid.<br>
parsebank(5): f20000300c000e0f @ 0<br>
        External tag parity error<br>
        CPU state corrupt. Restart not possible<br>
        Error enabled in control register<br>
        Error not corrected.<br>
        Error overflow<br>
        Bus and interconnect error<br>
        Participation: Generic<br>
        Timeout: Request did not timeout<br>
        Request: Generic error<br>
        Transaction type : Invalid<br>
        Memory/IO : Other<br>
<br>
<br>
Dag's Repo has the new memtest86+ 2.01 RPM.  I'd pull it and<br>
let it run overnight.  While memtest86+ is good, I've recently had<br>
cases where is didn't find (obvious) memory errors.<br>
<br>
I've also seen things like SATA disks drive cause MCEs.<br>
<br>
This one looks like you're taking memory parity errors somewhere<br>
in the path to the CPU.  On you BIOS, check you Events log for<br>
any "interesting" entries, too.<br>
<br>
Hope this helps ...<br>
<br>
   -rak-<br>
<br>
<br>