Hallo zusammen,
seit dem Update eines DELL-Rechners auf CentOS 5.5 (Installation von 5.4, dann kompletter Update) schleicht der Rechner nur noch. Bereits beim Bootvorgang merkt ziemlich bald, wie es immer langsamer laeuft. Das Starten von HAL braucht fast 2 Minuten statt 10 Sekunden. Gleich nach dem kompletten Booten hat er einen Load von 2 bis 4 und alles laeuft sehr "zaeh". Mit der Zeit erholt sich der Load, aber einfache Aktionen wie z.B. das Starten einer Konsole (X) jagen ihn gleich wieder auf 2 und mehr. So laesst es sich leider nicht arbeiten ;-)
Wenn ich auf Kernel 2.6.18-164.el5 zurueckschalte, ist alles wieder bestens.
Beim Herunterfahren (Kernel 2.6.18-194.x), erhalte ich folgende Fehlermeldung:
--------------- [...] Shutting down hidd: [ OK ] [ OK ] Bluetooth services:[ OK ] Shutting down interface eth0: BUG: soft lockup - CPU#1 stuck for 10s! [ip:3539]
CPU 1: Modules linked in: autofs4 hidp rfcomm l2cap bluetooth lockd sunrpc ip_conntrack _netbios_ns ipt_REJECT xt_state ip_conntrack nfnetlink iptable_filter ip_tables ip6t_REJECT xt_tcpudp ip6table_filter ip6_tables x_tables ipv6 xfrm_nalgo crypto _api cpufreq_ondemand powernow_k8 freq_table dm_multipath scsi_dh video backligh t sbs power_meter i2c_ec dell_wmi wmi button battery asus_acpi acpi_memhotplug a c lp sr_mod cdrom snd_hda_intel sg snd_seq_dummy snd_seq_oss snd_seq_midi_event snd_seq snd_seq_device snd_pcm_oss snd_mixer_oss snd_pcm snd_timer snd_page_allo c snd_hwdep parport_pc tg3 k8_edac snd parport i2c_nforce2 floppy k8temp shpchp i2c_core edac_mc hwmon pcspkr soundcore dm_raid45 dm_message dm_region_hash dm_m em_cache dm_snapshot dm_zero dm_mirror dm_log dm_mod sata_nv libata sd_mod scsi_ mod ext3 jbd uhci_hcd ohci_hcd ehci_hcd Pid: 3539, comm: ip Not tainted 2.6.18-194.8.1.el5 #1 RIP: 0010:[<ffffffff8000c9f6>] [<ffffffff8000c9f6>] __delay+0x8/0x10 RSP: 0018:ffff810125741c60 EFLAGS: 00000297 RAX: 00000000539a8625 RBX: 0000000000001388 RCX: 0000000052518896 RDX: 000000000000012b RSI: ffffc2000006044c RDI: 000000000291ae58 RBP: 00000000393a7993 R08: 0000000000000002 R09: ffff810125741d1c R10: 0000000000000018 R11: 000005e100000300 R12: 0000000000000002 R13: ffff810125741d1c R14: 000000000000004c R15: ffffffff80225929 FS: 00002b3ee841a800(0000) GS:ffff81010438d7c0(0000) knlGS:0000000000000000 CS: 0010 DS: 0000 ES: 0000 CR0: 000000008005003b CR2: 000000365a6cc640 CR3: 0000000122af0000 CR4: 00000000000006e0
Call Trace: [<ffffffff882444e7>] :tg3:tg3_readphy+0x77/0xdf [<ffffffff88246d90>] :tg3:tg3_setup_copper_phy+0x86a/0xb35 [<ffffffff88247d62>] :tg3:tg3_setup_phy+0xd07/0xe39 [<ffffffff80158813>] pci_bus_read_config_word+0x71/0x83 [<ffffffff80158647>] pci_bus_write_config_dword+0x5f/0x6e [<ffffffff88248080>] :tg3:tg3_set_power_state+0x1ec/0x96e [<ffffffff88252c34>] :tg3:tg3_close+0x103/0x113 [<ffffffff8022f4ea>] dev_close+0x53/0x72 [<ffffffff8022e609>] dev_change_flags+0x5a/0x119 [<ffffffff80262fd8>] devinet_ioctl+0x235/0x59c [<ffffffff80225d4f>] sock_ioctl+0x1c1/0x1e5 [<ffffffff8004206a>] do_ioctl+0x21/0x6b [<ffffffff800300ca>] vfs_ioctl+0x457/0x4b9 [<ffffffff800b7605>] audit_syscall_entry+0x180/0x1b3 [<ffffffff8004c549>] sys_ioctl+0x59/0x78 [<ffffffff8005d28d>] tracesys+0xd5/0xe0
[ OK ] Shutting down loopback interface: [ OK ] [...] ---------------
Der gesamte Konsole-Output beim Booten ist auf http://pastebin.de/8808 abgelegt und der Konsole-Output beim Herunterfahren auf http://pastebin.de/8809.
Trotz dieser Fehlermeldung bin ich mir nicht sicher, dass das Problem wirklich beim tg3-Treiber liegt, denn ich kann mir nicht vorstellen, dass der Netzwerktreiber allein das gesamte System verlangsamt. Und beim Booten beginnt der Schleichvorgang bereits vor dem Laden des Netzwerktreibers. Ich wuerde deshalb gerne das Problem etwas eingrenzen, bevor ich einen Bugreport abschicke. Wie kann ich das machen?
Der Rechner ist ein DELL Optiplex 740 mit AMD Athlon 64 X2 Dual Core Processor 5000+ @ 2.60 GHz, 4 GB RAM und 80 GB Festplatte (Hitachi Deskstar 7K80 series). Gebootet wird mit 'noapic'. 'lspci' siehe ganz unten.
Gruss und Danke
frank
--------------- [root@shelley ~]# lspci 00:00.0 RAM memory: nVidia Corporation C51 Host Bridge (rev a2) 00:00.1 RAM memory: nVidia Corporation C51 Memory Controller 0 (rev a2) 00:00.2 RAM memory: nVidia Corporation C51 Memory Controller 1 (rev a2) 00:00.3 RAM memory: nVidia Corporation C51 Memory Controller 5 (rev a2) 00:00.4 RAM memory: nVidia Corporation C51 Memory Controller 4 (rev a2) 00:00.5 RAM memory: nVidia Corporation C51 Host Bridge (rev a2) 00:00.6 RAM memory: nVidia Corporation C51 Memory Controller 3 (rev a2) 00:00.7 RAM memory: nVidia Corporation C51 Memory Controller 2 (rev a2) 00:02.0 PCI bridge: nVidia Corporation C51 PCI Express Bridge (rev a1) 00:03.0 PCI bridge: nVidia Corporation C51 PCI Express Bridge (rev a1) 00:04.0 PCI bridge: nVidia Corporation C51 PCI Express Bridge (rev a1) 00:09.0 RAM memory: nVidia Corporation MCP51 Host Bridge (rev a2) 00:0a.0 ISA bridge: nVidia Corporation MCP51 LPC Bridge (rev a3) 00:0a.1 SMBus: nVidia Corporation MCP51 SMBus (rev a3) 00:0a.2 RAM memory: nVidia Corporation MCP51 Memory Controller 0 (rev a3) 00:0b.0 USB Controller: nVidia Corporation MCP51 USB Controller (rev a3) 00:0b.1 USB Controller: nVidia Corporation MCP51 USB Controller (rev a3) 00:0e.0 IDE interface: nVidia Corporation MCP51 Serial ATA Controller (rev a1) 00:0f.0 IDE interface: nVidia Corporation MCP51 Serial ATA Controller (rev a1) 00:10.0 PCI bridge: nVidia Corporation MCP51 PCI Bridge (rev a2) 00:10.1 Audio device: nVidia Corporation MCP51 High Definition Audio (rev a2) 00:18.0 Host bridge: Advanced Micro Devices [AMD] K8 [Athlon64/Opteron] HyperTransport Technology Configuration 00:18.1 Host bridge: Advanced Micro Devices [AMD] K8 [Athlon64/Opteron] Address Map 00:18.2 Host bridge: Advanced Micro Devices [AMD] K8 [Athlon64/Opteron] DRAM Controller 00:18.3 Host bridge: Advanced Micro Devices [AMD] K8 [Athlon64/Opteron] Miscellaneous Control 02:00.0 Ethernet controller: Broadcom Corporation NetXtreme BCM5754 Gigabit Ethernet PCI Express (rev 02) 03:00.0 VGA compatible controller: nVidia Corporation NV43GL [Quadro FX 550] (rev a2) [root@shelley ~]# ---------------
Zur Illustration habe ich auf http://www.drosera.ch/kernelproblem/ die bootchart-Grafiken fuer Kernel 2.6.18-164 und 2.6.18-194.8.1 abgelegt
frank
Am Mittwoch, den 04.08.2010, 19:14 +0200 schrieb Frank Thommen:
Hallo zusammen,
seit dem Update eines DELL-Rechners auf CentOS 5.5 (Installation von 5.4, dann kompletter Update) schleicht der Rechner nur noch. Bereits beim Bootvorgang merkt ziemlich bald, wie es immer langsamer laeuft. Das Starten von HAL braucht fast 2 Minuten statt 10 Sekunden. Gleich nach dem kompletten Booten hat er einen Load von 2 bis 4 und alles laeuft sehr "zaeh". Mit der Zeit erholt sich der Load, aber einfache Aktionen wie z.B. das Starten einer Konsole (X) jagen ihn gleich wieder auf 2 und mehr. So laesst es sich leider nicht arbeiten ;-)
Wenn ich auf Kernel 2.6.18-164.el5 zurueckschalte, ist alles wieder bestens.
Hallo Frank,
auf der CentOS Mailingliste gibt es jemand mit genau dem Gleichen Problem (http://lists.centos.org/pipermail/centos/2010-August/097507.html ff.) bisher gibt es noch keine Lösung. Ich werde mal die Bugtracker von CentOS und RedHat durchsuchen ob es schon etwas dazu gibt.
Gruß +C
Christoph Maser wrote:
Am Mittwoch, den 04.08.2010, 19:14 +0200 schrieb Frank Thommen:
Hallo zusammen,
seit dem Update eines DELL-Rechners auf CentOS 5.5 (Installation von 5.4, dann kompletter Update) schleicht der Rechner nur noch.[...]
Hallo Frank,
auf der CentOS Mailingliste gibt es jemand mit genau dem Gleichen Problem (http://lists.centos.org/pipermail/centos/2010-August/097507.html ff.) bisher gibt es noch keine Lösung. Ich werde mal die Bugtracker von CentOS und RedHat durchsuchen ob es schon etwas dazu gibt.
Vielen Dank, das habe ich uebersehen. Ich werde mich mal dort in die Diskussion einklinken.
frank
Frank Thommen wrote:
Christoph Maser wrote:
Am Mittwoch, den 04.08.2010, 19:14 +0200 schrieb Frank Thommen:
Hallo zusammen,
seit dem Update eines DELL-Rechners auf CentOS 5.5 (Installation von 5.4, dann kompletter Update) schleicht der Rechner nur noch.[...]
Hallo Frank,
auf der CentOS Mailingliste gibt es jemand mit genau dem Gleichen Problem (http://lists.centos.org/pipermail/centos/2010-August/097507.html ff.) bisher gibt es noch keine Lösung. Ich werde mal die Bugtracker von CentOS und RedHat durchsuchen ob es schon etwas dazu gibt.
Vielen Dank, das habe ich uebersehen. Ich werde mich mal dort in die Diskussion einklinken.
frank
Das Problem ist erst Mal geloest: Der Bug ist bei RedHat als #586532 gelistet (https://bugzilla.redhat.com/show_bug.cgi?id=586532). Es handelt sich um einen Bug in einem Patch fuer den ALSA hda Treiber. Die Loesung ist, entweder den Sound im BIOS abzuschalten - wenn man es ruhig mag - oder in /etc/modprobe.conf dem snd-hda-intel-Treiber die Option "enable_msi=0" mitzugeben:
options snd-hda-intel [sonstige Optionen] enable_msi=0
Danke Christoph fuer den Link auf die CentOS-Mailliste.
Gruss
frank