Bonjour à tous
Je suis en train de mettre en place heartbeat (avec le rpm suivant- j'ai laissé tomber le tar car c'est pire -heartbeat-2.1.3-23.1.x86_64.rpm )sur deux serveurs apache. Et j'ai donc un souci.
voici ma configuration
ha.cf
bcast eth0
debugfile /var/log/ha-debug
logfile /var/log/ha-log
logfacility local0
keepalive 2
deadtime 10
warntime 6
initdead 60
udpport 694
node noeud1
node noeud2
auto_failback off
apiauth mgmtd uid=root
respawn root /usr/lib64/heartbeat/mgmtd -t
haresources
noeud1 IPaddr2::192.168.2.90/24/eth0 apache2
Donc :
- je n'arrive pas à faire monter l'adresse IP virtuelle. Si je lance Ipaddr manuellement, le système me dit que tout est ok mais je ne vois aucune nouvelle interface qui apparait.
- si je mets crm yes dans le ha.cf, mon serveur reboote en boucle (c'est le cas actuellement)
Je précise que j'ai pas de iptables ni de selinux activé. Que j'ai modifié moults fois la ressource IPaddr en IPaddr2, IPaddr::monip etc etc mais rien n'y fait. De plus, si je demande son statut à ha, il me dit qu'il est en cours de fonctionnement (heartbeat OK [pid 8964 et al] is running on noeud2 [noeud2]...)mais je ne vois aucun port 694 ouvert ....
Bref, ca merdoie et je commence à être agacé, donc si quelqu'un pouvait juste me dire ce qui ne va pas, ce serait sympa
# idées simples
Posté par stillbsd . Évalué à 1.
Je n'en ai jamais configuré, mais bon je lance quelques idées :-)
* As tu vérifié ce que dit la log : /var/log/ha-log ?
* Tu utilises bien :
ip addr show
pour vérifier que l'IP virtuelle est créée ?
* Par ailleurs, dans les docs qui trainent sur le Net, ils disent de faire attention à ce que le nom des nodes soient bien le résultat de uname -n .
* Enfin as-tu essayé de commenter ces 2 lignes :
apiauth mgmtd uid=root
respawn root /usr/lib64/heartbeat/mgmtd -t
Bonne chance en tout cas.
[^] # Re: idées simples
Posté par ArLouarn Mog . Évalué à 1.
J'ai vérifié, et j'ai quelques erreurs un peu partout, mais je vois bien dans les logs que l'ip virtuelle est montée mais avec un ip addr show, voici ce que j'obtiens :
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 16436 qdisc noqueue
link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
inet 127.0.0.1/8 scope host lo
inet6 ::1/128 scope host
valid_lft forever preferred_lft forever
2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast qlen 1000
link/ether 00:1e:c9:bb:ca:f0 brd ff:ff:ff:ff:ff:ff
inet 192.168.2.88/24 brd 192.168.2.255 scope global eth0
inet6 fe80::21e:c9ff:febb:caf0/64 scope link
valid_lft forever preferred_lft forever
3: eth1: <BROADCAST,MULTICAST> mtu 1500 qdisc noop qlen 1000
link/ether 00:1e:c9:bb:ca:f1 brd ff:ff:ff:ff:ff:ff
4: sit0: mtu 1480 qdisc noop
link/sit 0.0.0.0 brd 0.0.0.0
j'ai bien ca dans le haresources:
noeud1 IPaddr2 192.168.2.90/24/eth0
Le log avec une hearbeat restart:
heartbeat[14349]: 2008/08/01_12:04:16 info: Heartbeat shutdown in progress. (14349)
heartbeat[15113]: 2008/08/01_12:04:16 info: Giving up all HA resources.
ResourceManager[15126]: 2008/08/01_12:04:16 info: Releasing resource group: noeud1 IPaddr2 192.168.2.90/24/eth0
ResourceManager[15126]: 2008/08/01_12:04:16 info: Running /etc/ha.d/resource.d/IPaddr 192.168.2.90/24/eth0 stop
IPaddr[15166]: 2008/08/01_12:04:16 INFO: Success
ResourceManager[15126]: 2008/08/01_12:04:16 info: Running /etc/ha.d/resource.d/IPaddr2 stop
ResourceManager[15126]: 2008/08/01_12:04:16 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr2
ResourceManager[15126]: 2008/08/01_12:04:17 info: Retrying failed stop operation [IPaddr2]
ResourceManager[15126]: 2008/08/01_12:04:17 info: Running /etc/ha.d/resource.d/IPaddr2 stop
ResourceManager[15126]: 2008/08/01_12:04:17 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr2
ResourceManager[15126]: 2008/08/01_12:04:18 info: Retrying failed stop operation [IPaddr2]
ResourceManager[15126]: 2008/08/01_12:04:18 info: Running /etc/ha.d/resource.d/IPaddr2 stop
ResourceManager[15126]: 2008/08/01_12:04:18 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr2
ResourceManager[15126]: 2008/08/01_12:04:19 info: Retrying failed stop operation [IPaddr2]
ResourceManager[15126]: 2008/08/01_12:04:19 info: Running /etc/ha.d/resource.d/IPaddr2 stop
ResourceManager[15126]: 2008/08/01_12:04:19 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr2
ResourceManager[15126]: 2008/08/01_12:04:20 info: Retrying failed stop operation [IPaddr2]
ResourceManager[15126]: 2008/08/01_12:04:20 info: Running /etc/ha.d/resource.d/IPaddr2 stop
ResourceManager[15126]: 2008/08/01_12:04:20 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr2
ResourceManager[15126]: 2008/08/01_12:04:21 info: Retrying failed stop operation [IPaddr2]
ResourceManager[15126]: 2008/08/01_12:04:21 info: Running /etc/ha.d/resource.d/IPaddr2 stop
ResourceManager[15126]: 2008/08/01_12:04:21 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr2
ResourceManager[15126]: 2008/08/01_12:04:22 info: Retrying failed stop operation [IPaddr2]
ResourceManager[15126]: 2008/08/01_12:04:22 info: Running /etc/ha.d/resource.d/IPaddr2 stop
ResourceManager[15126]: 2008/08/01_12:04:22 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr2
ResourceManager[15126]: 2008/08/01_12:04:23 info: Retrying failed stop operation [IPaddr2]
ResourceManager[15126]: 2008/08/01_12:04:23 info: Running /etc/ha.d/resource.d/IPaddr2 stop
ResourceManager[15126]: 2008/08/01_12:04:23 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr2
ResourceManager[15126]: 2008/08/01_12:04:24 info: Retrying failed stop operation [IPaddr2]
ResourceManager[15126]: 2008/08/01_12:04:24 info: Running /etc/ha.d/resource.d/IPaddr2 stop
ResourceManager[15126]: 2008/08/01_12:04:24 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr2
ResourceManager[15126]: 2008/08/01_12:04:25 info: Retrying failed stop operation [IPaddr2]
ResourceManager[15126]: 2008/08/01_12:04:25 info: Running /etc/ha.d/resource.d/IPaddr2 stop
ResourceManager[15126]: 2008/08/01_12:04:25 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr2
ResourceManager[15126]: 2008/08/01_12:04:26 info: Retrying failed stop operation [IPaddr2]
ResourceManager[15126]: 2008/08/01_12:04:26 info: Running /etc/ha.d/resource.d/IPaddr2 stop
ResourceManager[15126]: 2008/08/01_12:04:26 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr2
ResourceManager[15126]: 2008/08/01_12:04:26 ERROR: Resource script for IPaddr2 probably not LSB-compliant.
ResourceManager[15126]: 2008/08/01_12:04:26 WARN: it (IPaddr2) MUST succeed on a stop when already stopped
ResourceManager[15126]: 2008/08/01_12:04:26 WARN: Machine reboot narrowly avoided!
heartbeat[15113]: 2008/08/01_12:04:26 info: All HA resources relinquished.
heartbeat[14349]: 2008/08/01_12:04:28 info: killing HBFIFO process 14351 with signal 15
heartbeat[14349]: 2008/08/01_12:04:28 info: killing HBWRITE process 14352 with signal 15
heartbeat[14349]: 2008/08/01_12:04:28 info: killing HBREAD process 14353 with signal 15
heartbeat[14349]: 2008/08/01_12:04:28 info: Core process 14353 exited. 3 remaining
heartbeat[14349]: 2008/08/01_12:04:28 info: Core process 14352 exited. 2 remaining
heartbeat[14349]: 2008/08/01_12:04:28 info: Core process 14351 exited. 1 remaining
heartbeat[14349]: 2008/08/01_12:04:28 info: noeud1 Heartbeat shutdown complete.
heartbeat[15690]: 2008/08/01_12:04:49 info: Version 2 support: false
heartbeat[15690]: 2008/08/01_12:04:49 WARN: Logging daemon is disabled --enabling logging daemon is recommended
heartbeat[15690]: 2008/08/01_12:04:49 info: **************************
heartbeat[15690]: 2008/08/01_12:04:49 info: Configuration validated. Starting heartbeat 2.1.3
heartbeat[15691]: 2008/08/01_12:04:49 info: heartbeat: version 2.1.3
heartbeat[15691]: 2008/08/01_12:04:49 info: Heartbeat generation: 1217402077
heartbeat[15691]: 2008/08/01_12:04:49 info: glib: ucast: write socket priority set to IPTOS_LOWDELAY on eth0
heartbeat[15691]: 2008/08/01_12:04:49 info: glib: ucast: bound send socket to device: eth0
heartbeat[15691]: 2008/08/01_12:04:49 info: glib: ucast: bound receive socket to device: eth0
heartbeat[15691]: 2008/08/01_12:04:49 info: glib: ucast: started on port 694 interface eth0 to 192.168.2.89
heartbeat[15691]: 2008/08/01_12:04:49 info: G_main_add_TriggerHandler: Added signal manual handler
heartbeat[15691]: 2008/08/01_12:04:49 info: G_main_add_TriggerHandler: Added signal manual handler
heartbeat[15691]: 2008/08/01_12:04:49 info: G_main_add_SignalHandler: Added signal handler for signal 17
heartbeat[15691]: 2008/08/01_12:04:49 info: Local status now set to: 'up'
je cherche de mon côté pour l'erreur code 1 ...
sinon .. je ne sais plus quoi faire
[^] # Re: idées simples
Posté par stillbsd . Évalué à 1.
/etc/ha.d/resource.d/IPaddr2
Tu peux le tracer à la main avec :
sh -x /etc/ha.d/resource.d/IPaddr2 stop
Ca parait étrange que IPaddr stop puis IPddr2 stop soient exécutés. Le 1er enlève l'IP, et le 2nd ne le peut plus, ça parait compréhensible.
Bon sinon, essaie de copier la conf du Mr :
http://blog.info16.fr/index.php?post/2007/08/21/18-haute-dis(...) .
Il met :
node1 IPaddr::
dans le fichier /etc/ha.d/haresources .
Et utilise un fichier authkeys.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.