Manchmal (eigentlich immer öfter) geht mir Hardware mächtig auf den Senkel. (Mithin ein Grund, warum ich sämtliche Arten von Server-Virtualisierung sehr begrüße.)
So machte sich eine der beiden CPUs von Server A mit massiven MCEs [Maschine Check Exceptions, Hardware-Fehlermeldungen bei Störungen] auch bei Leerlaufbetrieb unbeliebt:
MCE 0
HARDWARE ERROR. This is NOT a software problem!
Please contact your hardware vendor
CPU 1 0 data cache TSC 78eecbdc9911
ADDR 27ed8b000
Data cache ECC error (syndrome 6b)
bit46 = corrected ecc error
bit62 = error overflow (multiple errors)
bus error 'local node origin, request didn't time out
data read mem transaction
memory access, level generic'
STATUS d435c00000000833 MCGSTATUS 0
[...]
Super.
Server B lief zuerst so, wie ich mir das erwarten würde, dann meckerte der RAID-Kontroller aber herum:
20060821141129 WARNING (0x04:0x0039): Buffer ECC error corrected: address=0x1BD5200
20060821141129 WARNING (0x04:0x0039): Buffer ECC error corrected: address=0x1A76400
20060821141129 WARNING (0x04:0x0039): Buffer ECC error corrected: address=0x1BE6A00
20060821141129 WARNING (0x04:0x0039): Buffer ECC error corrected: address=0x1ACEA00
20060821141129 WARNING (0x04:0x0039): Buffer ECC error corrected: address=0x1ABD200
[...]
Das sich meine Begeisterung dadurch im freien Fall befand, kann man sich sicherlich leicht vorstellen.