Bonjour,
J ai deux serveurs avec apache/heartbeat.
Heartbeat porte 3 adresses IP.
je constate que le serveur 1 bascule souvent 2…
[Fri Aug 17 23:24:59 2012] [notice] caught SIGTERM, shutting down
Dans les ha-debug logs du serveur 1 j ai ces messages à cette heure la mais je n y comprend pas grand chose…
ARPING 10.0.7.130 from 10.0.7.130 eth0
Sent 10 probes (10 broadcast(s))
Received 0 response(s)
ARPING 10.0.7.131 from 10.0.7.131 eth0
Sent 10 probes (10 broadcast(s))
Received 0 response(s)
ARPING 10.0.7.133 from 10.0.7.133 eth0
Sent 10 probes (10 broadcast(s))
Received 0 response(s)
/usr/lib/ocf/resource.d//heartbeat/IPaddr(IPaddr_10.0.7.130)[17846]: 2012/08/17_22:33:26 INFO: Running OK
hb_standby(default)[24236]: 2012/08/17_23:24:58 Going standby [all].
Aug 17 23:24:58 reverse-1 heartbeat: [1246]: info: reverse-1 wants to go standby [all]
Aug 17 23:24:58 reverse-1 heartbeat: [1246]: info: standby: reverse-2 can take our all resources
Aug 17 23:24:58 reverse-1 heartbeat: [24252]: info: give up all HA resources (standby).
ResourceManager(default)[24265]: 2012/08/17_23:24:59 info: Releasing resource group: reverse-1 10.0.7.130 10.0.7.131 10.0.7.133 httpd Ma ilTo::my@addr.com::UR_HA_RP1_Event
ResourceManager(default)[24265]: 2012/08/17_23:24:59
/usr/lib/ocf/resource.d//heartbeat/MailTo(MailTo)[24302]: 2012/08/17_23:24:59 INFO: Success
INFO: Success
ResourceManager(default)[24265]: 2012/08/17_23:24:59 info: Running /etc/init.d/httpd stop
Stopping httpd: [ OK ]
ResourceManager(default)[24265]: 2012/08/17_23:25:00 info: Running /etc/ha.d/resource.d/IPaddr 10.0.7.133 stop
IPaddr(IPaddr_10.0.7.133)[24430]: 2012/08/17_23:25:00 INFO: ifconfig eth0:2 down
/usr/lib/ocf/resource.d//heartbeat/IPaddr(IPaddr_10.0.7.133)[24416]: 2012/08/17_23:25:00 INFO: Success
INFO: Success
ResourceManager(default)[24265]: 2012/08/17_23:25:00 info: Running /etc/ha.d/resource.d/IPaddr 10.0.7.131 stop
IPaddr(IPaddr_10.0.7.131)[24490]: 2012/08/17_23:25:00 INFO: ifconfig eth0:1 down
/usr/lib/ocf/resource.d//heartbeat/IPaddr(IPaddr_10.0.7.131)[24476]: 2012/08/17_23:25:00 INFO: Success
INFO: Success
ResourceManager(default)[24265]: 2012/08/17_23:25:00 info: Running /etc/ha.d/resource.d/IPaddr 10.0.7.130 stop
IPaddr(IPaddr_10.0.7.130)[24550]: 2012/08/17_23:25:00 INFO: ifconfig eth0:0 down
/usr/lib/ocf/resource.d//heartbeat/IPaddr(IPaddr_10.0.7.130)[24536]: 2012/08/17_23:25:00 INFO: Success
INFO: Success
Aug 17 23:25:00 reverse-1 heartbeat: [24252]: info: all HA resource release completed (standby).
Aug 17 23:25:00 reverse-1 heartbeat: [1246]: info: Local standby process completed [all].
Aug 17 23:25:02 reverse-1 heartbeat: [1246]: WARN: 1 lost packet(s) for [reverse-2] [575220:575222]
Aug 17 23:25:02 reverse-1 heartbeat: [1246]: info: remote resource transition completed.
Aug 17 23:25:02 reverse-1 heartbeat: [1246]: info: No pkts missing from reverse-2!
Aug 17 23:25:02 reverse-1 ipfail: [1313]: debug: Other side is now stable.
Aug 17 23:25:02 reverse-1 heartbeat: [1246]: info: Other node completed standby takeover of all resources.
Aug 17 23:25:02 reverse-1 ipfail: [1313]: debug: Other side is now stable.
/usr/lib/ocf/resource.d//heartbeat/IPaddr(IPaddr_10.0.7.130)[24580]: 2012/08/17_23:25:28 INFO: Resource is stopped
/usr/lib/ocf/resource.d//heartbeat/IPaddr(IPaddr_10.0.7.130)[24630]: 2012/08/17_23:25:58 INFO: Resource is stopped
J ai un fichier check_apache qui verifie que les sockets sont bien ouvertes sur le serveur en faisant un netstat -tnlp | grep IP…
Quelqu un a t il deja rencontré ce type de soucis ?
Merci pour vos retours
# Pas de réponse ?
Posté par nono14 (site web personnel) . Évalué à 2.
A mon avis, y un soucis, mais dire d'où ça vient…
Système - Réseau - Sécurité Open Source - Ouvert à de nouvelles opportunités
[^] # Re: Pas de réponse ?
Posté par netsurfeur . Évalué à 2.
Un petit :
sur les deux serveurs pour voir si les requêtes ARP sont bien échangées ?
# Je ne pense pas mais qui sait
Posté par ratw3 . Évalué à 0.
Salut,
Je ne pense pas que ca vienne de ca en effet, si le reverse-1 n arivait pas a joindre le reverse-2 il ne chercherait pas a basculer…
Mais celq dit je vais quand meme faire ce que tu conseils… en effet un bon tcpdump ca aide souvent a regler beaucoup de soucis.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.