c0fa682d20Bug 1322 - l'état des machines affichée par la page clusterstatus n'est pas fiableGuillaume Raffy2016-05-03 12:19:24 +0000
1e6a5247d8j'ai oublié de publier ceci pour la résolution du bug 649Guillaume Raffy2014-06-19 16:15:11 +0000
d23c25ba06Bug 521 - le cluster ne prend plus de jobs et qstat ne marche pas : correction qui fait que le code est beaucoup plus performant quand il y a des gros job array (alexandra a des job array de 1400 éléments)Guillaume Raffy2014-01-17 14:49:37 +0000
5d10b89ee8Bug 521 - le cluster ne prend plus de jobs et qstat ne marche pas : ajout d'un hack pour désactiver la collecte d'infos sur l'utilisation mémoire quand il y a trop de jobs (ou de taches) car ce code est excessivement lent et paralyse sge_qmaster. En attendant de trouver un vrai correctifGuillaume Raffy2014-01-15 13:43:52 +0000
600db53653Bug 289 - ajouter un mécanisme qui empêche la saturation de la mémoire sur un noeud : ajout de l'affichage de l'utilisation mémoire des jobs. Ce n'est pas encore peaufiné mais l'essentiel est làGuillaume Raffy2013-12-06 10:41:50 +0000
9da884ce7fcorrection d'un problème qui faisait que clustercontroller ainsi que la page web clusterstatus plantait losque'une machine était réaffectée à une autre queue (et donc qu'une queuemachine était marquée comme obsolète)Guillaume Raffy2013-04-19 09:00:29 +0000
bf472a82f4correction d'un problème qui faisait que clustercontroller ainsi que la page web clusterstatus plantait losque'une machine était réaffectée à une autre queue (et donc qu'une queuemachine était marquée comme obsolète)Guillaume Raffy2013-04-19 09:00:01 +0000
ef09dd6fecBug 266 - clustercontroller s'est planté à cause d'un appel à qstat échoué : ajout d'informations qui permettront de cerner le problème exact si ça se reproduitGuillaume Raffy2012-09-05 15:05:39 +0000
36949c6c94correction du bug 251 (je me demande pourquoi ce problème n'est pas apparu avant)Guillaume Raffy2012-08-22 12:34:22 +0000
47b86312a6correction du bug 240 : maintenant que les machines peuvent être ajoutées à la volée, les machines ne sont pas nécéssairement prêtes tout de suiteGuillaume Raffy2012-07-03 14:38:29 +0000
224afd6591correction de fautes de typo et ajout d'une variable en prévision d'un mécanisme d'arrêt du daemonGuillaume Raffy2012-07-03 14:24:41 +0000
a1ace896b9tentative de résolution du bug 234 (je pense que ça le corrige mais je n'i pas vérifié)Guillaume Raffy2012-07-02 09:01:06 +0000
d67c4d6a21dans l'optique de remettre ClusterController en production, les administateurs peuvent désormais ajouter ou supprimer une machine du contrôle du cluster controllerGuillaume Raffy2012-06-28 12:22:07 +0000
2c807fefe2correction d'une erreur mineure dans les commentairesGuillaume Raffy2012-06-28 12:12:56 +0000
265aac6064correction d'un bug introduit dans le commit 2034 (je crois) : les slots sont désormais par queuemachine, et non pas machineGuillaume Raffy2012-06-28 12:11:21 +0000
319c78dd86ai ajouté un mécanisme (peu blindé mais qui fonctionne) qui permet d'ajouter ou d'enlever des machines du controle de ClusterController via un serveur http (pour la première fois, on peut interagir avec le daemon ClusterController)Guillaume Raffy2012-06-26 16:08:36 +0000
006d8752c9la page cluster status affiche désormais les états disabled et error des queuesGuillaume Raffy2012-05-29 16:31:01 +0000
fa2dc0cd67ajout de l'affichage des queues (on peut désormais voir sur quelle queue les jobs tournent). Cela a nécéssité des modifs dans les librairies cluster controller mais certaines modifications que je commite sont plus anciennes (je ne sais plus quand ça a été fait, ni dans quel but)Guillaume Raffy2012-05-29 14:05:18 +0000
39616dc73cl'installeur déclare automatiquement la ressource sge has_matlab_2011b lorsque matlab 2011b est installéGuillaume Raffy2012-03-07 08:59:19 +0000
0a8b21dda3correction du bug 186 : Intégrer la configuration SGE des noeuds dans l'installeurGuillaume Raffy2012-02-07 14:14:48 +0000
d97fca4143Ai remis le cluster controller en route. Il n'est pas si simple que ça à démarrer, alors j'en ai profité pour écrire l'installeur, qui tient également lieu de documentation. (partie 5)Guillaume Raffy2011-10-07 15:51:20 +0000
e326ab1976Ai remis le cluster controller en route. Il n'est pas si simple que ça à démarrer, alors j'en ai profité pour écrire l'installeur, qui tient également lieu de documentation. (partie 4)Guillaume Raffy2011-10-07 15:48:15 +0000
372ef28b17Ai remis le cluster controller en route. Il n'est pas si simple que ça à démarrer, alors j'en ai profité pour écrire l'installeur, qui tient également lieu de documentation. (partie 3)Guillaume Raffy2011-10-07 15:46:50 +0000
23b9665434Ai remis le cluster controller en route. Il n'est pas si simple que ça à démarrer, alors j'en ai profité pour écrire l'installeur, qui tient également lieu de documentation. (partie 1)Guillaume Raffy2011-10-07 15:43:45 +0000
b195bb98d1managed to get the cluster web application to use the cluster controller to retreive the machines stateGuillaume Raffy2011-09-22 08:59:23 +0000
1ae5ffd762déplacement des scripts python pour les rendre partagés par tous les admins (j'en ai besoin pour d'autres applis que clustercontroller)Guillaume Raffy2011-04-18 09:32:19 +0000