Forum général.général Problème bascules intempestives heartbeat/apache

Posté par  .
Étiquettes : aucune
0
17
août
2012

Bonjour,
J ai deux serveurs avec apache/heartbeat.
Heartbeat porte 3 adresses IP.
je constate que le serveur 1 bascule souvent 2…

[Fri Aug 17 23:24:59 2012] [notice] caught SIGTERM, shutting down

Dans les ha-debug logs du serveur 1 j ai ces messages à cette heure la mais je n y comprend pas grand chose…

ARPING 10.0.7.130 from 10.0.7.130 eth0
Sent 10 probes (10 broadcast(s))
Received 0 response(s)
ARPING 10.0.7.131 from 10.0.7.131 eth0
Sent 10 probes (10 broadcast(s))
Received 0 response(s)
ARPING 10.0.7.133 from 10.0.7.133 eth0
Sent 10 probes (10 broadcast(s))
Received 0 response(s)
/usr/lib/ocf/resource.d//heartbeat/IPaddr(IPaddr_10.0.7.130)[17846]: 2012/08/17_22:33:26 INFO: Running OK
hb_standby(default)[24236]: 2012/08/17_23:24:58 Going standby [all].
Aug 17 23:24:58 reverse-1 heartbeat: [1246]: info: reverse-1 wants to go standby [all]
Aug 17 23:24:58 reverse-1 heartbeat: [1246]: info: standby: reverse-2 can take our all resources
Aug 17 23:24:58 reverse-1 heartbeat: [24252]: info: give up all HA resources (standby).
ResourceManager(default)[24265]: 2012/08/17_23:24:59 info: Releasing resource group: reverse-1 10.0.7.130 10.0.7.131 10.0.7.133 httpd Ma ilTo::my@addr.com::UR_HA_RP1_Event
ResourceManager(default)[24265]: 2012/08/17_23:24:59
/usr/lib/ocf/resource.d//heartbeat/MailTo(MailTo)[24302]: 2012/08/17_23:24:59 INFO: Success
INFO: Success
ResourceManager(default)[24265]: 2012/08/17_23:24:59 info: Running /etc/init.d/httpd stop
Stopping httpd: [ OK ]
ResourceManager(default)[24265]: 2012/08/17_23:25:00 info: Running /etc/ha.d/resource.d/IPaddr 10.0.7.133 stop
IPaddr(IPaddr_10.0.7.133)[24430]: 2012/08/17_23:25:00 INFO: ifconfig eth0:2 down
/usr/lib/ocf/resource.d//heartbeat/IPaddr(IPaddr_10.0.7.133)[24416]: 2012/08/17_23:25:00 INFO: Success
INFO: Success
ResourceManager(default)[24265]: 2012/08/17_23:25:00 info: Running /etc/ha.d/resource.d/IPaddr 10.0.7.131 stop
IPaddr(IPaddr_10.0.7.131)[24490]: 2012/08/17_23:25:00 INFO: ifconfig eth0:1 down
/usr/lib/ocf/resource.d//heartbeat/IPaddr(IPaddr_10.0.7.131)[24476]: 2012/08/17_23:25:00 INFO: Success
INFO: Success
ResourceManager(default)[24265]: 2012/08/17_23:25:00 info: Running /etc/ha.d/resource.d/IPaddr 10.0.7.130 stop
IPaddr(IPaddr_10.0.7.130)[24550]: 2012/08/17_23:25:00 INFO: ifconfig eth0:0 down
/usr/lib/ocf/resource.d//heartbeat/IPaddr(IPaddr_10.0.7.130)[24536]: 2012/08/17_23:25:00 INFO: Success
INFO: Success
Aug 17 23:25:00 reverse-1 heartbeat: [24252]: info: all HA resource release completed (standby).
Aug 17 23:25:00 reverse-1 heartbeat: [1246]: info: Local standby process completed [all].
Aug 17 23:25:02 reverse-1 heartbeat: [1246]: WARN: 1 lost packet(s) for [reverse-2] [575220:575222]
Aug 17 23:25:02 reverse-1 heartbeat: [1246]: info: remote resource transition completed.
Aug 17 23:25:02 reverse-1 heartbeat: [1246]: info: No pkts missing from reverse-2!
Aug 17 23:25:02 reverse-1 ipfail: [1313]: debug: Other side is now stable.
Aug 17 23:25:02 reverse-1 heartbeat: [1246]: info: Other node completed standby takeover of all resources.
Aug 17 23:25:02 reverse-1 ipfail: [1313]: debug: Other side is now stable.
/usr/lib/ocf/resource.d//heartbeat/IPaddr(IPaddr_10.0.7.130)[24580]: 2012/08/17_23:25:28 INFO: Resource is stopped
/usr/lib/ocf/resource.d//heartbeat/IPaddr(IPaddr_10.0.7.130)[24630]: 2012/08/17_23:25:58 INFO: Resource is stopped

J ai un fichier check_apache qui verifie que les sockets sont bien ouvertes sur le serveur en faisant un netstat -tnlp | grep IP…

Quelqu un a t il deja rencontré ce type de soucis ?

Merci pour vos retours

  • # Pas de réponse ?

    Posté par  (site web personnel) . Évalué à 2.

    ARPING 10.0.7.130 from 10.0.7.130 eth0
    Sent 10 probes (10 broadcast(s))
    Received 0 response(s)
    ARPING 10.0.7.131 from 10.0.7.131 eth0
    Sent 10 probes (10 broadcast(s))
    Received 0 response(s)
    ARPING 10.0.7.133 from 10.0.7.133 eth0
    Sent 10 probes (10 broadcast(s))
    Received 0 response(s)
    
    

    A mon avis, y un soucis, mais dire d'où ça vient…

    Système - Réseau - Sécurité Open Source - Ouvert à de nouvelles opportunités

    • [^] # Re: Pas de réponse ?

      Posté par  . Évalué à 2.

      Un petit :

      tcpdump -n -i eth0 arp
      
      

      sur les deux serveurs pour voir si les requêtes ARP sont bien échangées ?

  • # Je ne pense pas mais qui sait

    Posté par  . Évalué à 0.

    Salut,
    Je ne pense pas que ca vienne de ca en effet, si le reverse-1 n arivait pas a joindre le reverse-2 il ne chercherait pas a basculer…

    Mais celq dit je vais quand meme faire ce que tu conseils… en effet un bon tcpdump ca aide souvent a regler beaucoup de soucis.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.