Commit Graph

  • 1cff78822e Bug 1458 - la page clusterstatus ne répond plus Guillaume Raffy 2016-09-06 09:15:55 +0000
  • c0fa682d20 Bug 1322 - l'état des machines affichée par la page clusterstatus n'est pas fiable Guillaume Raffy 2016-05-03 12:19:24 +0000
  • 1e6a5247d8 j'ai oublié de publier ceci pour la résolution du bug 649 Guillaume Raffy 2014-06-19 16:15:11 +0000
  • d23c25ba06 Bug 521 - le cluster ne prend plus de jobs et qstat ne marche pas : correction qui fait que le code est beaucoup plus performant quand il y a des gros job array (alexandra a des job array de 1400 éléments) Guillaume Raffy 2014-01-17 14:49:37 +0000
  • 5d10b89ee8 Bug 521 - le cluster ne prend plus de jobs et qstat ne marche pas : ajout d'un hack pour désactiver la collecte d'infos sur l'utilisation mémoire quand il y a trop de jobs (ou de taches) car ce code est excessivement lent et paralyse sge_qmaster. En attendant de trouver un vrai correctif Guillaume Raffy 2014-01-15 13:43:52 +0000
  • 600db53653 Bug 289 - ajouter un mécanisme qui empêche la saturation de la mémoire sur un noeud : ajout de l'affichage de l'utilisation mémoire des jobs. Ce n'est pas encore peaufiné mais l'essentiel est là Guillaume Raffy 2013-12-06 10:41:50 +0000
  • 9da884ce7f correction d'un problème qui faisait que clustercontroller ainsi que la page web clusterstatus plantait losque'une machine était réaffectée à une autre queue (et donc qu'une queuemachine était marquée comme obsolète) Guillaume Raffy 2013-04-19 09:00:29 +0000
  • bf472a82f4 correction d'un problème qui faisait que clustercontroller ainsi que la page web clusterstatus plantait losque'une machine était réaffectée à une autre queue (et donc qu'une queuemachine était marquée comme obsolète) Guillaume Raffy 2013-04-19 09:00:01 +0000
  • 862f45ec7a contournement du bug 269 Guillaume Raffy 2012-09-17 08:37:04 +0000
  • ef09dd6fec Bug 266 - clustercontroller s'est planté à cause d'un appel à qstat échoué : ajout d'informations qui permettront de cerner le problème exact si ça se reproduit Guillaume Raffy 2012-09-05 15:05:39 +0000
  • 4a74aa93a9 ajout d'un commentaire lié au bug 251 Guillaume Raffy 2012-08-24 09:04:42 +0000
  • 36949c6c94 correction du bug 251 (je me demande pourquoi ce problème n'est pas apparu avant) Guillaume Raffy 2012-08-22 12:34:22 +0000
  • 47b86312a6 correction du bug 240 : maintenant que les machines peuvent être ajoutées à la volée, les machines ne sont pas nécéssairement prêtes tout de suite Guillaume Raffy 2012-07-03 14:38:29 +0000
  • 08f168809e import du ticket 10 dans bugzilla -> bug 239 Guillaume Raffy 2012-07-03 14:25:44 +0000
  • 224afd6591 correction de fautes de typo et ajout d'une variable en prévision d'un mécanisme d'arrêt du daemon Guillaume Raffy 2012-07-03 14:24:41 +0000
  • a1ace896b9 tentative de résolution du bug 234 (je pense que ça le corrige mais je n'i pas vérifié) Guillaume Raffy 2012-07-02 09:01:06 +0000
  • d67c4d6a21 dans l'optique de remettre ClusterController en production, les administateurs peuvent désormais ajouter ou supprimer une machine du contrôle du cluster controller Guillaume Raffy 2012-06-28 12:22:07 +0000
  • 2c807fefe2 correction d'une erreur mineure dans les commentaires Guillaume Raffy 2012-06-28 12:12:56 +0000
  • 265aac6064 correction d'un bug introduit dans le commit 2034 (je crois) : les slots sont désormais par queuemachine, et non pas machine Guillaume Raffy 2012-06-28 12:11:21 +0000
  • 319c78dd86 ai ajouté un mécanisme (peu blindé mais qui fonctionne) qui permet d'ajouter ou d'enlever des machines du controle de ClusterController via un serveur http (pour la première fois, on peut interagir avec le daemon ClusterController) Guillaume Raffy 2012-06-26 16:08:36 +0000
  • 006d8752c9 la page cluster status affiche désormais les états disabled et error des queues Guillaume Raffy 2012-05-29 16:31:01 +0000
  • fa2dc0cd67 ajout de l'affichage des queues (on peut désormais voir sur quelle queue les jobs tournent). Cela a nécéssité des modifs dans les librairies cluster controller mais certaines modifications que je commite sont plus anciennes (je ne sais plus quand ça a été fait, ni dans quel but) Guillaume Raffy 2012-05-29 14:05:18 +0000
  • 39616dc73c l'installeur déclare automatiquement la ressource sge has_matlab_2011b lorsque matlab 2011b est installé Guillaume Raffy 2012-03-07 08:59:19 +0000
  • 0a8b21dda3 correction du bug 186 : Intégrer la configuration SGE des noeuds dans l'installeur Guillaume Raffy 2012-02-07 14:14:48 +0000
  • d97fca4143 Ai remis le cluster controller en route. Il n'est pas si simple que ça à démarrer, alors j'en ai profité pour écrire l'installeur, qui tient également lieu de documentation. (partie 5) Guillaume Raffy 2011-10-07 15:51:20 +0000
  • e326ab1976 Ai remis le cluster controller en route. Il n'est pas si simple que ça à démarrer, alors j'en ai profité pour écrire l'installeur, qui tient également lieu de documentation. (partie 4) Guillaume Raffy 2011-10-07 15:48:15 +0000
  • 372ef28b17 Ai remis le cluster controller en route. Il n'est pas si simple que ça à démarrer, alors j'en ai profité pour écrire l'installeur, qui tient également lieu de documentation. (partie 3) Guillaume Raffy 2011-10-07 15:46:50 +0000
  • 23b9665434 Ai remis le cluster controller en route. Il n'est pas si simple que ça à démarrer, alors j'en ai profité pour écrire l'installeur, qui tient également lieu de documentation. (partie 1) Guillaume Raffy 2011-10-07 15:43:45 +0000
  • b195bb98d1 managed to get the cluster web application to use the cluster controller to retreive the machines state Guillaume Raffy 2011-09-22 08:59:23 +0000
  • 1ae5ffd762 déplacement des scripts python pour les rendre partagés par tous les admins (j'en ai besoin pour d'autres applis que clustercontroller) Guillaume Raffy 2011-04-18 09:32:19 +0000