Salut à tous,
Voilà j'ai un problème un peu particulier mais ce n'est pas vraiment lui qui me pousse à poster sur ce forum. Mon problème est le suivant : j'ai un cluster sous MC Service Guard et mon 2eme noeud reboote au moins une fois par jour. J'ai bien vérifé si les "time out" et autres "TOC" étaient correctes, j'ai bombardé les deux serveurs entre eux avec des ping de 65507 bytes et je n'ai pas de pertes. Puis en regardant mes logs, "messages" , "boot.log" et "dmesg" en l'occurence, je me suis aperçu d'un truc un peu étrange en essayant de suivre le cheminement du rc.sysinit dans les logs, que je revenais en arrière de 10s environ à chaque redémarrage du serveur, puis je reviens à nouveau dans mon fichier de log, a l'heure "normale".
Je ne comprends donc pas la chose suivante: lorsque le serveur est éteint , il y a dans le halt, un hwclock systohc, et au démarrage un hctosys. Pourquoi ? Et puis, est ce que cela peut expliquer que pendant que je parcours mon logs, je passe en gros 21:14:55 à 21:14:45 puis à nouveau à 21:14:55. En plus, cela se passe juste avant le Remounting root file system du rc.sysinit, j'ai tout un tas de caractères .. heu .. cabalistiques ...
Alors je me suis demandé, comme plusieurs choses sont lancés au init en background, les heures que j'ai devant moi, sont "marquées" dans le temps mais arrivent un peu après .. Ce n'est pas très logique mais bon ...
Quelqu'un pourrait m'expliquer ?
Et aussi une idée pour mon redémarrage intempestif de cluster :)
# beaucoup d'infos à voir.
Posté par NeoX . Évalué à 1.
sys to hc et hc to sys
permettent de synchroniser les horloges systeme et hardware.
sys to hc : le systeme envoie son heure au hardware
hc to sys : le hardware envoie son heure au systeme
2°)
dans le cas d'un cluster, tu peux avoir un poste décalé, il devrait se synchroniser avec le reste du cluster au demarrage ou à intervalles reguliers.
[^] # Re: beaucoup d'infos à voir.
Posté par ArLouarn Mog . Évalué à 1.
Ceci dit, je ne comprends pas pourquoi dans mon log message, je reviens un moment en arrière de 10s . C'est comme si j'avais un retard d'affichage du buffer .. ou alors la synchro a lieu à ce meoment... Pourtant d'apres le rc.sysinit, elle a lieu plus tôt ...
Voilà ce que cela donne
Sep 14 12:07:34 TESTOR kernel: bond0: making interface eth2 the new active on
e.
Sep 14 12:07:35 TESTOR audit: Démarrage de auditd succeeded
Sep 14 12:07:35 TESTOR audit: auditd startup succeeded
Sep 14 12:07:35 TESTOR random: Initialisation du générateur de nombres alé
atoires : succeeded
Sep 14 12:07:24 TESTOR ^A: ÀÄP
Sep 14 12:07:24 TESTOR ^A:
Sep 14 12:07:24 TESTOR ^A: ^F
Sep 14 12:07:24 TESTOR ^A: p0R
Sep 14 12:07:24 TESTOR ^A:
Sep 14 12:07:24 TESTOR ^A: ^E
Sep 14 12:07:24 TESTOR ^A: # lines preceded by a '#' are comments
Sep 14 12:07:24 TESTOR ^A: À%T
Sep 14 12:07:24 TESTOR ^A:
Sep 14 12:07:24 TESTOR ^A: ^E
Sep 14 12:07:24 TESTOR last message repeated 4 times
Sep 14 12:07:24 TESTOR ^A:
Sep 14 12:07:24 TESTOR ^A: ^E
Sep 14 12:07:24 TESTOR rc.sysinit: Remounting root filesystem in read-write mode: succeeded
Et puis, j'ai tous ces caractères un peu bizarres ....
Concernant la ligne "# lines preceded by a '#' are comments", j'ai commenté des paramètres systèmes dans le rc.sysctl.
Voilà ... pourquoi ce noeud reboote tout seul (hormis le TOC qu'il pourrait recevoir , mais bon, mon timeout est de 2s ...) ?
Thanks
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.