Salut à tous,
J'ai un serveur RHEL5 qui, par moment, rame. Par exemple, j'ai une session ssh ouverte sur ce serveur et d'un seul coup, ca freeze. Et au bout de quelques minutes, j'ai à nouveau la main.
J'ai fouillé le sshd.conf, vérifier les fichiers réseaux, le bonding .. bref, rien qui puisse expliquer ces coupures.
Et puis là j'ai un truc bizarre, avec ip link list :
1: lo: mtu 16436 qdisc noqueue
link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
2: eth0: mtu 1500 qdisc pfifo_fast master bond0 qlen 1000
link/ether 00:15:17:48:79:c0 brd ff:ff:ff:ff:ff:ff
3: eth3: mtu 1500 qdisc noop qlen 1000
link/ether 00:15:17:48:79:c1 brd ff:ff:ff:ff:ff:ff
4: eth2: mtu 1500 qdisc pfifo_fast master bond0 qlen 1000
link/ether 00:15:17:48:79:c0 brd ff:ff:ff:ff:ff:ff
5: __tmp204226134: mtu 1500 qdisc noop qlen 1000
link/ether 00:1d:09:0b:3f:9b brd ff:ff:ff:ff:ff:ff
6: bond0: mtu 1500 qdisc noqueue
link/ether 00:15:17:48:79:c0 brd ff:ff:ff:ff:ff:ff
7: sit0: mtu 1480 qdisc noop
link/sit 0.0.0.0 brd 0.0.0.0
La carte en 5, qui est censé être eth1 apparait en tmp.
Question : C'est quoi ce truc ?
Toute aide sera bienvenue car mon serveur est en prod dans quelques jours ...
Merci d'avance
# kudzu
Posté par bubar🦥 (Mastodon) . Évalué à 2.
le renommage sauvage des interfaces est une spécialité kudzu
(autre piste : si server NFS et si reuetes clientes incessantes vers points de montage inexistants (autoumont clients pas à jour par exemple) : alors le kernel redhat n' est pas fichu de fermer les sockets... après qq centaines, le système a du mal (...) alors si 1000 sont demandés, tu vois ce qui peux se passer ?)
[^] # Re: kudzu
Posté par ArLouarn Mog . Évalué à 1.
Je suis toujours sur mon problème de freeze ssh. J'ai supprimé kudzu mais le freeze est toujours là.
J'ai parmi mes modules chargés, ceux qui correspondent à iptables et ip6tables. Je n'arrive pas à les enlever (iptables et ip6tables sont arrêtés). J'ai fouillé sur le net et vérifié dans le fichier de config dans /boot, avec la commande suivante:
grep "CONFIG_MODULE_FORCE_UNLOAD" /boot/config-$(uname -r), ce qui me renvoie:
# CONFIG_MODULE_FORCE_UNLOAD is not set
Question : est ce que je peux changer à chaud cette ligne ? Suis je obligé de redémarré mon serveur ?
Enfin, que faut il mettre précisément dans le sshd_config pour que la connexion cliente ssh ne tombe jamais ?
Merci
[^] # Re: kudzu
Posté par ArLouarn Mog . Évalué à 1.
Je suis toujours sur mon problème de freeze ssh. J'ai supprimé kudzu mais le freeze est toujours là.
J'ai parmi mes modules chargés, ceux qui correspondent à iptables et ip6tables. Je n'arrive pas à les enlever (iptables et ip6tables sont arrêtés). J'ai fouillé sur le net et vérifié dans le fichier de config dans /boot, avec la commande suivante:
grep "CONFIG_MODULE_FORCE_UNLOAD" /boot/config-$(uname -r), ce qui me renvoie:
# CONFIG_MODULE_FORCE_UNLOAD is not set
Question : est ce que je peux changer à chaud cette ligne ? Suis je obligé de redémarré mon serveur ?
Enfin, que faut il mettre précisément dans le sshd_config pour que la connexion cliente ssh ne tombe jamais ?
Merci
[^] # bonding ?
Posté par stillbsd . Évalué à 1.
As-tu essayé de virer le bonding temporairement, afin de savoir si c'est lui qui est la cause du problème de freeze réseeau ?
[^] # Re: bonding ?
Posté par ArLouarn Mog . Évalué à 1.
je continue a fouiller
[^] # Re: kudzu
Posté par stillbsd . Évalué à 1.
Regarde ce thread, pour "stabiliser" ton bonding :
http://forums11.itrc.hp.com/service/forums/questionanswer.do(...)
[^] # Re: kudzu
Posté par ArLouarn Mog . Évalué à 1.
cat /etc/modprobe.conf
alias eth0 bnx2
#alias eth1 bnx2
alias eth2 e1000
#alias eth3 e1000
alias scsi_hostadapter megaraid_sas
alias scsi_hostadapter1 usb-storage
alias bond0 bonding
options bond0 mode=1 miimon=100 primary=eth0
cat /etc/sysconfig/network-scripts/ifcfg-eth0
DEVICE=eth0
BOOTPROTO=none
HWADDR=00:1d:09:0b:3f:99
ONBOOT=yes
SLAVE=yes
MASTER=bond0
cat /etc/sysconfig/network-scripts/ifcfg-eth2
DEVICE=eth2
BOOTPROTO=none
HWADDR=00:15:17:48:79:c0
ONBOOT=yes
SLAVE=yes
MASTER=bond0
cat /etc/sysconfig/network-scripts/ifcfg-bond0
ONBOOT=yes
DEVICE=bond0
BOOTPROTO=none
IPADDR=192.168.22.3
NETWORK=192.168.22.0
NETMASK=255.255.255.0
BROADCAST=192.168.22.255
GATEWAY=192.168.22.1
bref ....
[^] # Re: kudzu
Posté par stillbsd . Évalué à 1.
Essaies peut-être aussi d'enlever la directive HWADDR= de tous les fichiers ifcfg-eth* .
-> Le but étant que ip link list te nomme correctement toutes tes interfaces.
* Si tu as un serveur Dell PowerEdge 2950 server ou un HP ProLiant BL480c G1 server, regarde cette page qui parle de problèmes de nommage de cartes sur ces serveurs :
http://www.cyberciti.biz/tips/howto-fix-rhel-centos-nic-orde(...)
* Regarde aussi si tes interfaces sont au moins en 100 Mbits, avec ethtool <nom_interface> .
* Pour dissocier les problèmes de perfs réseau d'avec un problème de configuration du bonding, désactive le
->
Tu déplaces tous tes fichiers ifcfg-eth* et ifcfg-bond0 dans un répertoire séparé, puis tu arrêtes le réseau : ifdown -a.
Puis tu copies le fichier sauvegardé ifcfg-bond0 dans ifcfg-eth0, renommes le DEVICE en eth0 puis , tu relances : ifup -a
Si tu observes toujours des problèmes de déconnexions réseau, regarde au niveau de la configuration de la carte (vitesse, autonégociation, ...). Essaie de changer de driver ...
Si tu n'as pas de problèmes de déconnexions sans le bonding, le problème vient de lui. Penses à te mettre au dernier niveau du kernel de Red Hat (de plus, ils en sont à la RHEL 5.1 en ce moment).
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.