Guillaume Raffy
788798c74c
fixes made a few weeks ago to make maco's release machanism work from a linux machine (graffy-ws2)
...
- Bug 2664 - mettre graffy-ws2 en production
2019-11-14 12:08:01 +00:00
Guillaume Raffy
64813cb35a
Bug 2339 - fournir une documentation utilisateur de physix
...
- désormais, la page clusteruserguide est générique : elle genere le user guide de simpatix et physix
- désormais, la page clusteruserguide est mise à jour automatiquement : elle génère la liste les noeuds et les gflops dynamiquement en regardant la sortie de qstat et en utilisant la base de données SimpaDb.sql (on a réutilisé les classes qui avaent été écrites pour clusterstatusview)
2018-06-27 13:23:51 +00:00
Guillaume Raffy
3ad6206363
Bug 1458 - la page clusterstatus ne répond plus
...
- drastically improved the performance of JobsState.AddJob call (used for example in clusterstatus page) in case of big job arrays. As an example : clusterstatus page took 30 seconds when there was a job array of 500 elements ; this now takes 3 seconds. The culprit was a conflicting hash (I don't remember why I didn't make a non conflicting hash in the first place), that was the same for each job array element.
2016-09-06 09:47:56 +00:00
Guillaume Raffy
1cff78822e
Bug 1458 - la page clusterstatus ne répond plus
...
- slightly improved speed by preventing unnecessary requests of job array element details
However, the big hit in performance is still in the dictionary of jobs in JobsState
2016-09-06 09:15:55 +00:00
Guillaume Raffy
c0fa682d20
Bug 1322 - l'état des machines affichée par la page clusterstatus n'est pas fiable
...
désormais, pour éviter toute confusion, pour toutes le machines qui ne répondent pas :
- le load n'est plus affiché
- le bouton power affiche unknown
2016-05-03 12:19:24 +00:00
Guillaume Raffy
d23c25ba06
Bug 521 - le cluster ne prend plus de jobs et qstat ne marche pas : correction qui fait que le code est beaucoup plus performant quand il y a des gros job array (alexandra a des job array de 1400 éléments)
2014-01-17 14:49:37 +00:00
Guillaume Raffy
5d10b89ee8
Bug 521 - le cluster ne prend plus de jobs et qstat ne marche pas : ajout d'un hack pour désactiver la collecte d'infos sur l'utilisation mémoire quand il y a trop de jobs (ou de taches) car ce code est excessivement lent et paralyse sge_qmaster. En attendant de trouver un vrai correctif
2014-01-15 13:43:52 +00:00
Guillaume Raffy
600db53653
Bug 289 - ajouter un mécanisme qui empêche la saturation de la mémoire sur un noeud : ajout de l'affichage de l'utilisation mémoire des jobs. Ce n'est pas encore peaufiné mais l'essentiel est là
2013-12-06 10:41:50 +00:00
Guillaume Raffy
9da884ce7f
correction d'un problème qui faisait que clustercontroller ainsi que la page web clusterstatus plantait losque'une machine était réaffectée à une autre queue (et donc qu'une queuemachine était marquée comme obsolète)
2013-04-19 09:00:29 +00:00
Guillaume Raffy
bf472a82f4
correction d'un problème qui faisait que clustercontroller ainsi que la page web clusterstatus plantait losque'une machine était réaffectée à une autre queue (et donc qu'une queuemachine était marquée comme obsolète)
2013-04-19 09:00:01 +00:00
Guillaume Raffy
862f45ec7a
contournement du bug 269
2012-09-17 08:37:04 +00:00
Guillaume Raffy
ef09dd6fec
Bug 266 - clustercontroller s'est planté à cause d'un appel à qstat échoué : ajout d'informations qui permettront de cerner le problème exact si ça se reproduit
2012-09-05 15:05:39 +00:00
Guillaume Raffy
4a74aa93a9
ajout d'un commentaire lié au bug 251
2012-08-24 09:04:42 +00:00
Guillaume Raffy
36949c6c94
correction du bug 251 (je me demande pourquoi ce problème n'est pas apparu avant)
2012-08-22 12:34:22 +00:00
Guillaume Raffy
47b86312a6
correction du bug 240 : maintenant que les machines peuvent être ajoutées à la volée, les machines ne sont pas nécéssairement prêtes tout de suite
2012-07-03 14:38:29 +00:00
Guillaume Raffy
08f168809e
import du ticket 10 dans bugzilla -> bug 239
2012-07-03 14:25:44 +00:00
Guillaume Raffy
224afd6591
correction de fautes de typo et ajout d'une variable en prévision d'un mécanisme d'arrêt du daemon
2012-07-03 14:24:41 +00:00
Guillaume Raffy
a1ace896b9
tentative de résolution du bug 234 (je pense que ça le corrige mais je n'i pas vérifié)
2012-07-02 09:01:06 +00:00
Guillaume Raffy
d67c4d6a21
dans l'optique de remettre ClusterController en production, les administateurs peuvent désormais ajouter ou supprimer une machine du contrôle du cluster controller
2012-06-28 12:22:07 +00:00
Guillaume Raffy
2c807fefe2
correction d'une erreur mineure dans les commentaires
2012-06-28 12:12:56 +00:00
Guillaume Raffy
265aac6064
correction d'un bug introduit dans le commit 2034 (je crois) : les slots sont désormais par queuemachine, et non pas machine
2012-06-28 12:11:21 +00:00
Guillaume Raffy
319c78dd86
ai ajouté un mécanisme (peu blindé mais qui fonctionne) qui permet d'ajouter ou d'enlever des machines du controle de ClusterController via un serveur http (pour la première fois, on peut interagir avec le daemon ClusterController)
2012-06-26 16:08:36 +00:00
Guillaume Raffy
006d8752c9
la page cluster status affiche désormais les états disabled et error des queues
2012-05-29 16:31:01 +00:00
Guillaume Raffy
fa2dc0cd67
ajout de l'affichage des queues (on peut désormais voir sur quelle queue les jobs tournent). Cela a nécéssité des modifs dans les librairies cluster controller mais certaines modifications que je commite sont plus anciennes (je ne sais plus quand ça a été fait, ni dans quel but)
2012-05-29 14:05:18 +00:00
Guillaume Raffy
39616dc73c
l'installeur déclare automatiquement la ressource sge has_matlab_2011b lorsque matlab 2011b est installé
2012-03-07 08:59:19 +00:00
Guillaume Raffy
d97fca4143
Ai remis le cluster controller en route. Il n'est pas si simple que ça à démarrer, alors j'en ai profité pour écrire l'installeur, qui tient également lieu de documentation. (partie 5)
2011-10-07 15:51:20 +00:00
Guillaume Raffy
e326ab1976
Ai remis le cluster controller en route. Il n'est pas si simple que ça à démarrer, alors j'en ai profité pour écrire l'installeur, qui tient également lieu de documentation. (partie 4)
2011-10-07 15:48:15 +00:00
Guillaume Raffy
372ef28b17
Ai remis le cluster controller en route. Il n'est pas si simple que ça à démarrer, alors j'en ai profité pour écrire l'installeur, qui tient également lieu de documentation. (partie 3)
2011-10-07 15:46:50 +00:00
Guillaume Raffy
23b9665434
Ai remis le cluster controller en route. Il n'est pas si simple que ça à démarrer, alors j'en ai profité pour écrire l'installeur, qui tient également lieu de documentation. (partie 1)
2011-10-07 15:43:45 +00:00