[linux-kernel ?] gel d'une machine

clarky Messages postés 60 Statut Membre -  
clarky Messages postés 60 Statut Membre -
Bonjour,

je poste ici un message déjà posté sur le forum Ubuntu-fr, peut-etre aurais-je plus de chance ;-)
Je possède 16 configurations identiques, disques clonés, sous Ubuntu 6.06 (noyau 2.6.15-27-686).
J'ai un problème sur l'une d'entre elle, qui, avant de "geler", m'insulte une vingtaine de fois par seconde :
scheduling while atomic: swapper/0x00010000/0
[schedule+2509/3408] schedule+0x9cd/0xd50
[__do_IRQ+204/272] __do_IRQ+0xcc/0x110
[do_IRQ+30/48] do_IRQ+0x1e/0x30
[common_interrupt+26/32] common_interrupt+0x1a/0x20
[default_idle+0/96] default_idle+0x0/0x60
[cpu_idle+133/192] cpu_idle+0x85/0xc0
[start_kernel+415/512] start_kernel+0x19f/0x200
[unknown_bootoption+0/496] unknown_bootoption+0x0/0x1f0
scheduling while atomic: swapper/0x00010000/0

encore et encore, avec un petit bonus de temps en temps :
BUG: soft lockup detected on CPU#0!
Pid: 0, comm:              swapper
EIP: 0060:[default_idle+44/96] CPU: 0
EIP is at default_idle+0x2c/0x60
EFLAGS: 00200246    Tainted: P       (2.6.15-27-686)
EAX: 00000000 EBX: 01088f60 ECX: c0101030 EDX: c03a6000
ESI: 00000000 EDI: c039e800 EBP: 0047d007 DS: 007b ES: 007b
CR0: 8005003b CR2: 08076000 CR3: 0e46d000 CR4: 000006d0

Il me faut préciser que cette machine était en Fedora Core 2 jusqu'en septembre et je n'ai pas eu de problème. De même, j'ai effectué des tests mémoire (memtest) et aucun souci de ce côté-là.
Quelques infos sur la conf matérielle :
CPU : Intel(R) Pentium(R) 4 CPU 2.66GHz

0000:00:00.0 Host bridge: Intel Corporation 82845G/GL[Brookdale-G]/GE/PE DRAM Controller/Host-Hub Interface (rev 03)
0000:00:01.0 PCI bridge: Intel Corporation 82845G/GL[Brookdale-G]/GE/PE Host-to-AGP Bridge (rev 03)
0000:00:1d.0 USB Controller: Intel Corporation 82801DB/DBL/DBM (ICH4/ICH4-L/ICH4-M) USB UHCI Controller #1 (rev 02)
0000:00:1d.1 USB Controller: Intel Corporation 82801DB/DBL/DBM (ICH4/ICH4-L/ICH4-M) USB UHCI Controller #2 (rev 02)
0000:00:1d.2 USB Controller: Intel Corporation 82801DB/DBL/DBM (ICH4/ICH4-L/ICH4-M) USB UHCI Controller #3 (rev 02)
0000:00:1d.7 USB Controller: Intel Corporation 82801DB/DBM (ICH4/ICH4-M) USB2 EHCI Controller (rev 02)
0000:00:1e.0 PCI bridge: Intel Corporation 82801 PCI Bridge (rev 82)
0000:00:1f.0 ISA bridge: Intel Corporation 82801DB/DBL (ICH4/ICH4-L) LPC Interface Bridge (rev 02)
0000:00:1f.1 IDE interface: Intel Corporation 82801DB (ICH4) IDE Controller (rev 02)
0000:00:1f.3 SMBus: Intel Corporation 82801DB/DBL/DBM (ICH4/ICH4-L/ICH4-M) SMBus Controller (rev 02)
0000:00:1f.5 Multimedia audio controller: Intel Corporation 82801DB/DBL/DBM (ICH4/ICH4-L/ICH4-M) AC'97 Audio Controller (rev 02)
0000:01:00.0 VGA compatible controller: nVidia Corporation NV18 [GeForce4 MX 440 AGP 8x] (rev a4)
0000:02:05.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL-8139/8139C/8139C+ (rev 10)

Ca sent le probleme matériel mais je ne sais pas l'identifier précisement. Si quelqu'un avait une idée, je l'en remercie par avance.
Bonne journée.
A voir également:

1 réponse

mamiemando Messages postés 34229 Date d'inscription   Statut Modérateur Dernière intervention   7 897
 
Ca sent le problème de microprocesseur vu le message. Le problème c'est que si tes autres machines ont le même processeur et la même installation, ça doit être un problème matériel.

Tu peux toujours essayer d'installer avec un noyau pour voir si tu auras plus de succès mais à mon avis ça ne changera pas grand chose... Pour celà il faut télécharger un live cd (genre knoppix) et
- soit le paquet .deb du nouveau noyau (sources de noyau compilées à la main)
- soit des sources de noyau (par exemple sur kernel.org), les compiler, les convertir en .deb, et installer le bousin. Si tu débutes je te conseille la première solution.

Installation d'un noyau compilé

Démarre sur le livecd. Par défaut le mot de passe root c'est rien (root c'est le superutilisateur, qui a tout les droit). Ouvre une console et passe en root :
su -

Ensuite identifie ta partition / de ton linux installé. Par exemple supposons que ce soit /dev/hda1 en ext3 :
mkdir -p /mnt/linux
mount -t ext /dev/hda1  /mnt/linux
cp lepaquet.deb /mnt/linux/var/cache/apt/archive
chroot /mnt/linux

Ok, à ce stade tout ce passe comme si / correspondait, et comme si tu avait téléchargé le paquet .deb danbs le cache de ton ubuntu. Il ne reste plus qu'à l'installer, soit avec aptitude :
aptitude install lepaquet

... soit avec dpkg :
cd /var/cache/apt/archive
dpkg -i lepaquet.deb

Prie très fort pour que toutes les dépendances soient toutes satisfaites sinon tu es bon pour toutes les récupérer à la main (et c'est bien relou)
Si ton noyau s'install et que tu as lilo -et non grub, mais a priori tu as grub- tape :
lilo

Ensuite on quitte tout proprement :
exit
cd /
umount /mnt/linux
reboot

Dans ton boot loader tu devrais voir apparaître le nouveau noyau et on verra si tu as plus de succès ...

Bonne chance
0
clarky Messages postés 60 Statut Membre 1
 
Hello Mamie et merci pour ton intervention très détaillée.

Mea culpa, j'ai oublié de dire que j'ai testé plusieurs noyaux (2.6) dans les dernières versions.

Merci de m'avoir conforté sur un problème de CPU, je crois qu'il ne me reste plus qu'à intervertir des µP et tester.

En parlant de ça, si quelqu'un connais un outil de test assez complet pour CPU (je ne pense pas que des tests de charge genre CPUburn soient complets).

Bonne journée
0