Je suis à la recherche d'une solution pour monter un cluster de calcul avec 12 serveurs (bi-pro).
J'ai regardé du côté de beowulf, openmosix, et d'autres, mais je n'arrive pas à trouver mon bonheur.
Mes applications de calcul ont le fonctionnement suivant:
1/ pas de programmation parallèle - un programme n'utilise qu'un seul CPU
2/ un processus de calcul fait de la lecture / écriture via NFS
3/ un processus de calcul se connecte à une base de données
Le point le plus bloquant semble être le point 3, des projets comme openMosix gérant principalement la répartition et la migration de processus entre machines... impossible ici pour cause de connexion TCP.
Pour résumer, il me faudrait un soft :
- qui ne fasse pas de migration de processus après lancement - quand un programme est lancé sur un noeud X par le scheduler, il reste dessus;
- qui sache gérer un load balancing "basique" (nb de process par exemple) au moment du lancement de l'exécution d'un nouveau programme;
- qui centralise la gestion des exécutions - les utilisateurs n'ont besoin de se connecter que sur une seule et même machine pour la gestion - lancement d'une exécution, arrêt d'une exécution, visualisation des ressources consommées par une exécution.
Si quelqu'un à des pistes...
# kerrighed
Posté par Nicolas Regnault . Évalué à 2.
http://www.kerrighed.org(...)
je n'ai pas eu l'occasion de déployer cette solution mais j'ai discuté avec un de ceux qui travaillent sur ce logiciel. En particulier je sais que meme si kerrighed a son propre système de fichiers distribué, tu peux utiliser NFS (kerrighed est modulaire). Pour un utilisateur lambda, ton cluster ressemble à une machine SMP.
[^] # Re: kerrighed
Posté par Yann Hirou . Évalué à 1.
merci !
[^] # Re: kerrighed
Posté par Yann Hirou . Évalué à 1.
- pas de support multi-processeur des noeuds
- pas d'ajout à chaud de noeud - il faut tout arrêter pour ajouter une machine
- pas de suppression à chaud de noeud - si une machine meurt ou plante, tout le cluster tombe
normalement la roadmap planifie tout ça pour juin et août 2005... A suivre.
# batch system
Posté par Vincent P (site web personnel) . Évalué à 1.
Il y a par exemple OpenPBS :
http://www.openpbs.org/(...)
Sinon tu peux jeter un coup d'oeil a cette page, mais ca date un peu :
http://www.cmpharm.ucsf.edu/~srp/batch/systems.html(...)
Hope this helps,
Vincent
[^] # Re: batch system
Posté par Yann Hirou . Évalué à 1.
[^] # Re: batch system
Posté par Bruno Muller . Évalué à 0.
[^] # Re: batch system
Posté par botio2 . Évalué à 1.
http://gridengine.sunsource.net/(...)
# Condor
Posté par Lionel Fournigault . Évalué à 1.
(voir http://www.cs.wisc.edu/condor).(...)
# OSCAR
Posté par pini . Évalué à 2.
http://oscar.openclustergroup.org/(...)
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.