Commit Graph

  • 101fb6d8b2 cocluto v1.04 master Guillaume Raffy 2024-11-05 15:15:48 +0100
  • e86197c083 cocluto v1.03: - added Inventory methods related to gpus - added a missing dependency (mysqlclient); nb this change dates back from a few months. Guillaume Raffy 2024-09-17 18:49:33 +0200
  • 9f4a80b11e fixed styling errors and added more type hinting to increase maintainability of cocluto Guillaume Raffy 2024-06-14 15:52:32 +0200
  • 6bf69f909b refactored cluster related code (renamed Job as Task and Job2 as Job to avoid confusion) Guillaume Raffy 2024-06-13 13:59:49 +0200
  • f36b2d9d9c cocluto v1.02 : adapted code to the recent addition of the guaranteed_util field in the machines table Guillaume Raffy 2024-03-13 15:50:47 +0100
  • 1ddf7270d4 fixed bug that caused the dependency pygraphviz to not be installed while being needed Guillaume Raffy 2024-03-13 14:26:41 +0100
  • 5e402a2e45 added type hinting to PowerDiagram Guillaume Raffy 2024-03-12 18:15:04 +0100
  • e58f06e14a added missing requirement (pygraphviz is used by cocluto.PowerDiagram) Guillaume Raffy 2024-03-12 18:14:07 +0100
  • 4853446fa0 fixed code incompatible with python3 in powerdiagram Guillaume Raffy 2024-03-12 18:12:36 +0100
  • 891182587d fixed bug: made parseQstatOutput handle domains other than ipr.univ-rennes1.fr properly Guillaume Raffy 2023-11-17 18:28:20 +0100
  • 5bf1cbe664 now alambix is also considered as a cluster Guillaume Raffy 2023-11-14 18:39:05 +0100
  • 88fba0fdb0 fixed regression from commit 270304f58e Guillaume Raffy 2023-06-08 11:18:07 +0200
  • 14a58dcd0a fixed a missing import error (time) that was detected by one of the applications that used cocluto Guillaume Raffy 2023-06-07 18:23:46 +0200
  • 270304f58e fixed pylint errors and cleaned up Guillaume Raffy 2023-05-23 17:27:12 +0200
  • 7a5d32dec0 fixed bug that caused TypeError: '<=' not supported between instances of 'NoneType' and 'int' Guillaume Raffy 2023-05-23 12:10:29 +0200
  • 654e449007 added logging mechanism to ease debugging Guillaume Raffy 2023-05-23 11:43:29 +0200
  • c387b9dce2 fixed warning 'RuntimeWarning: line buffering (buffering=1) isn't supported in binary mode, the default buffer size will be used' Guillaume Raffy 2023-05-23 11:35:15 +0200
  • b5c2c886f1 migrated code using dict that was no longer compatible with python3 Guillaume Raffy 2023-05-23 11:29:59 +0200
  • 66fb58148d made SqlFile cope with older versions of python that don't like Path type as arguments to open Guillaume Raffy 2022-02-16 18:57:39 +0100
  • 57fa689015 fixed bug of non closed database file Guillaume Raffy 2022-02-16 17:47:01 +0100
  • 45f0a397a3 removed stdout pollution Guillaume Raffy 2022-02-16 17:45:46 +0100
  • 428651fa8a fix bug that cause SvgFigureHandler to fail if the target diractory doesn't already exist Guillaume Raffy 2022-02-16 16:26:09 +0100
  • 7ba561eb98 fixed bug that caused programs using cluster_stats to fail if the directory /tmp/cluster_stats is missing Guillaume Raffy 2022-02-16 16:13:36 +0100
  • 41ef0f3616 minor improvements made while making cluster status page work with dummy cluster data Guillaume Raffy 2022-01-31 21:59:47 +0100
  • a65c2fbc3f made cocluto work with simpaweb running on flask Guillaume Raffy 2022-01-28 23:39:39 +0100
  • c7fa99064f made cocluto an installable package Guillaume Raffy 2022-01-28 20:29:29 +0100
  • a0a7ebe2d8 changed directory layour to comply with https://python-packaging.readthedocs.io/en/latest/minimal.html Guillaume Raffy 2022-01-28 18:14:09 +0100
  • ad8f6f383b Bug 3165 - la page ClusterEvolution ne fonctionne plus (failed to find in table orderings a value for ordering_date where ordering_id is ietr.order20210101) Guillaume Raffy 2021-06-07 11:42:03 +0000
  • 939ecda69d Bug 3098 - mettre à jour les graphiques montrant l'évolution du cluster Guillaume Raffy 2021-02-24 09:13:12 +0000
  • 08ac2506ae Bug 3098 - mettre à jour les graphiques montrant l'évolution du cluster Guillaume Raffy 2021-02-23 15:57:54 +0000
  • faf6cd5d2a Bug 3098 - mettre à jour les graphiques montrant l'évolution du cluster Guillaume Raffy 2021-02-23 15:40:01 +0000
  • 14e3e12571 fixed pep8 styling problems Guillaume Raffy 2021-02-23 13:01:52 +0000
  • 78d7e02285 Bug 3072 - la consommation n'est pas assez précise dans le diagramme de câblage des serveurs : now the database contains the measured power consumption of machines and the power diagram uses it instead of the power consumption of a chassis, which is still used for an estimate in case the measured one is not available Guillaume Raffy 2021-01-22 15:21:29 +0000
  • 82816e5193 just fixed pylint warnings and errors Guillaume Raffy 2021-01-21 16:14:29 +0000
  • 160bc22c3d installed physix92 (bug 2997) and physix93-94 (bug 3000) Guillaume Raffy 2020-10-30 18:15:20 +0000
  • 79741a248d Bug 2911 - répondre au questionnaire ur1 sur les besoins en informatique Guillaume Raffy 2020-06-18 15:30:30 +0000
  • 6e35053852 fixed bug that caused the price of gflop to actually be the price of flop Guillaume Raffy 2020-06-08 17:15:26 +0000
  • bc29b1186e fixes to ClusterStats while attempting to add a new graph show the age of machines - made ClusterStats work on graffy-ws2 : made code compatible with python3 (still compatible with python2 though) - added support for physix in addition to simpatix) - fixed bug Guillaume Raffy 2020-06-08 17:01:02 +0000
  • 23fa150cbe fixed bug that caused the value of the reporting_params attribute to become corrupt. Guillaume Raffy 2020-03-05 10:50:50 +0000
  • 347a0c034b ls-dyna is now installed on physix cluster Guillaume Raffy 2020-01-24 11:20:24 +0000
  • 98c2b62f78 Now the case where the priority of a job is negative is handled Guillaume Raffy 2020-01-17 14:54:02 +0000
  • 5fda1388a4 fixed bug that was introduced a few months ago that made Util.py incompatible with python2. However, intranet.ipr.univ-rennes1.fr still uses python2 and as a result the web site was no longer functional once the we site was updated in Bug 2789 - Faire en sorte que la mise à jour jour du site web du cluster puisse se faire de graffy-ws2 Guillaume Raffy 2019-11-21 09:00:57 +0000
  • 788798c74c fixes made a few weeks ago to make maco's release machanism work from a linux machine (graffy-ws2) Guillaume Raffy 2019-11-14 12:08:01 +0000
  • e39a65c288 Made clusterconfigurator code comply (mostly) to pylint and mypy best practices while working on bug 2701. Guillaume Raffy 2019-07-10 08:34:42 +0000
  • 13d52fd4d4 cleanup Guillaume Raffy 2019-06-27 09:26:25 +0000
  • ac76f82b67 Bug 2680 - Améliorer le support des alimentation redondantes dans PowerDiagram Guillaume Raffy 2019-06-25 14:23:15 +0000
  • 3e0a8ff373 Bug 2514 - mettre à jour le plan de câblage alimentation des serveurs communs Guillaume Raffy 2019-06-25 07:13:08 +0000
  • 7c7d519eaf Bug 2680 - Améliorer le support des alimentation redondantes dans PowerDiagram Guillaume Raffy 2019-06-24 17:20:49 +0000
  • 9aaefd495f Bug 2514 - mettre à jour le plan de câblage alimentation des serveurs communs Guillaume Raffy 2019-06-24 12:54:27 +0000
  • 889712b356 Bug 2677 - améliorer la lisibilité du powerdiagram en regroupant les noeuds par rack Guillaume Raffy 2019-06-21 15:17:13 +0000
  • e102d33a9d Bug 2672 - le power diagram contient des erreurs (certains serveurs affichent une consommation de 0 W) Guillaume Raffy 2019-06-19 07:31:41 +0000
  • 4b1bb04565 Bug 2453 - simpatix50 n'arrive pas à récuperer son adresse ip ipmi via dhcp Guillaume Raffy 2018-10-03 10:32:53 +0000
  • 991744baf1 Bug 2447 - les pages "cluster status" et "cluster user guide" affichent des quantités de mémoire erronées Guillaume Raffy 2018-09-25 13:48:47 +0000
  • a2be664bbe Bug 2412 - la page cluster/UserGuide ne fonctionne plus Guillaume Raffy 2018-08-28 13:27:29 +0000
  • 796ec2d6a5 reformatted code to pep8 convention Guillaume Raffy 2018-08-27 15:17:09 +0000
  • e9f3c5a784 reformatted code to pep8 convention Guillaume Raffy 2018-08-27 14:54:55 +0000
  • 197e94d320 reformatted code to pep8 convention Guillaume Raffy 2018-08-27 13:32:41 +0000
  • c750804914 Bug 2339 - fournir une documentation utilisateur de physix Guillaume Raffy 2018-06-28 12:43:30 +0000
  • 64813cb35a Bug 2339 - fournir une documentation utilisateur de physix Guillaume Raffy 2018-06-27 13:23:51 +0000
  • 2dbf8ceea0 Bug 2332 - mettre en service une page clusterstatus pour physix Guillaume Raffy 2018-06-20 08:04:29 +0000
  • 879b559db6 Bug 2322 - qlogin ne fonctionne pas sur physix Guillaume Raffy 2018-06-11 16:48:41 +0000
  • c4cf33ac38 Bug 2226 - ClusterConfigurator échoue sur physix88 (can't resolve hostname) Guillaume Raffy 2018-04-16 09:53:40 +0000
  • 05d21bc427 Bug 2218 - la mise à jour de simpatix51 a échoué (ClusterConfigurator) Guillaume Raffy 2018-04-12 14:27:41 +0000
  • 7e8edeab20 Bug 2209 - installer gridengine qmaster sur physix-master Guillaume Raffy 2018-04-09 10:36:55 +0000
  • 6601521ff2 Bug 2209 - installer gridengine qmaster sur physix-master Guillaume Raffy 2018-04-09 10:34:01 +0000
  • 5e959c5c23 Bug 2044 - mettre simpatix88 en production Guillaume Raffy 2018-03-26 14:10:33 +0000
  • cb84052d73 Bug 1803 - Créer un outil de suivi des achats et d'inventaire IPR-ISCR : ajout de la prise en compte des maintenances Guillaume Raffy 2018-02-14 15:18:22 +0000
  • 8e32bd1bc8 Bug 1803 - Créer un outil de suivi des achats et d'inventaire IPR-ISCR Guillaume Raffy 2018-02-13 16:49:21 +0000
  • c309da0ef4 Bug 2120 - ajouter des stats sur l'évolution du cluster Guillaume Raffy 2018-02-08 10:49:39 +0000
  • 7ca596a609 Bug 2120 - ajouter des stats sur l'évolution du cluster Guillaume Raffy 2018-02-07 10:07:56 +0000
  • 3ba55f8758 Bug 1978 - trouver un moyen de rationaliser l'achat du r930 cper 2017 Guillaume Raffy 2018-02-07 08:43:05 +0000
  • 7c6656dc69 Bug 1978 - trouver un moyen de rationaliser l'achat du r930 cper 2017 Guillaume Raffy 2018-02-06 17:42:18 +0000
  • b8c09eea89 Bug 1978 - trouver un moyen de rationaliser l'achat du r930 cper 2017 Guillaume Raffy 2018-02-06 17:37:15 +0000
  • defc6936b5 Bug 1978 - trouver un moyen de rationaliser l'achat du r930 cper 2017 Guillaume Raffy 2018-02-02 10:32:54 +0000
  • b7c60939a7 Bug 2044 - mettre simpatix88 en production - added debug informations that helped debugging power diagram database issue while working on bug 2044 Guillaume Raffy 2018-02-01 10:55:08 +0000
  • 95e3f4a3ed Bug 1474 - clarifier la configuration électrique du rack3 Guillaume Raffy 2016-09-21 13:24:19 +0000
  • 8770bd488a Bug 1474 - clarifier la configuration électrique du rack3 : réorganisation du code pour que la génération du diagramme puisse s'effectuer par le site web intranet Guillaume Raffy 2016-09-20 16:05:41 +0000
  • 3ad6206363 Bug 1458 - la page clusterstatus ne répond plus Guillaume Raffy 2016-09-06 09:47:56 +0000
  • 1cff78822e Bug 1458 - la page clusterstatus ne répond plus Guillaume Raffy 2016-09-06 09:15:55 +0000
  • c0fa682d20 Bug 1322 - l'état des machines affichée par la page clusterstatus n'est pas fiable Guillaume Raffy 2016-05-03 12:19:24 +0000
  • 1e6a5247d8 j'ai oublié de publier ceci pour la résolution du bug 649 Guillaume Raffy 2014-06-19 16:15:11 +0000
  • d23c25ba06 Bug 521 - le cluster ne prend plus de jobs et qstat ne marche pas : correction qui fait que le code est beaucoup plus performant quand il y a des gros job array (alexandra a des job array de 1400 éléments) Guillaume Raffy 2014-01-17 14:49:37 +0000
  • 5d10b89ee8 Bug 521 - le cluster ne prend plus de jobs et qstat ne marche pas : ajout d'un hack pour désactiver la collecte d'infos sur l'utilisation mémoire quand il y a trop de jobs (ou de taches) car ce code est excessivement lent et paralyse sge_qmaster. En attendant de trouver un vrai correctif Guillaume Raffy 2014-01-15 13:43:52 +0000
  • 600db53653 Bug 289 - ajouter un mécanisme qui empêche la saturation de la mémoire sur un noeud : ajout de l'affichage de l'utilisation mémoire des jobs. Ce n'est pas encore peaufiné mais l'essentiel est là Guillaume Raffy 2013-12-06 10:41:50 +0000
  • 9da884ce7f correction d'un problème qui faisait que clustercontroller ainsi que la page web clusterstatus plantait losque'une machine était réaffectée à une autre queue (et donc qu'une queuemachine était marquée comme obsolète) Guillaume Raffy 2013-04-19 09:00:29 +0000
  • bf472a82f4 correction d'un problème qui faisait que clustercontroller ainsi que la page web clusterstatus plantait losque'une machine était réaffectée à une autre queue (et donc qu'une queuemachine était marquée comme obsolète) Guillaume Raffy 2013-04-19 09:00:01 +0000
  • 862f45ec7a contournement du bug 269 Guillaume Raffy 2012-09-17 08:37:04 +0000
  • ef09dd6fec Bug 266 - clustercontroller s'est planté à cause d'un appel à qstat échoué : ajout d'informations qui permettront de cerner le problème exact si ça se reproduit Guillaume Raffy 2012-09-05 15:05:39 +0000
  • 4a74aa93a9 ajout d'un commentaire lié au bug 251 Guillaume Raffy 2012-08-24 09:04:42 +0000
  • 36949c6c94 correction du bug 251 (je me demande pourquoi ce problème n'est pas apparu avant) Guillaume Raffy 2012-08-22 12:34:22 +0000
  • 47b86312a6 correction du bug 240 : maintenant que les machines peuvent être ajoutées à la volée, les machines ne sont pas nécéssairement prêtes tout de suite Guillaume Raffy 2012-07-03 14:38:29 +0000
  • 08f168809e import du ticket 10 dans bugzilla -> bug 239 Guillaume Raffy 2012-07-03 14:25:44 +0000
  • 224afd6591 correction de fautes de typo et ajout d'une variable en prévision d'un mécanisme d'arrêt du daemon Guillaume Raffy 2012-07-03 14:24:41 +0000
  • a1ace896b9 tentative de résolution du bug 234 (je pense que ça le corrige mais je n'i pas vérifié) Guillaume Raffy 2012-07-02 09:01:06 +0000
  • d67c4d6a21 dans l'optique de remettre ClusterController en production, les administateurs peuvent désormais ajouter ou supprimer une machine du contrôle du cluster controller Guillaume Raffy 2012-06-28 12:22:07 +0000
  • 2c807fefe2 correction d'une erreur mineure dans les commentaires Guillaume Raffy 2012-06-28 12:12:56 +0000
  • 265aac6064 correction d'un bug introduit dans le commit 2034 (je crois) : les slots sont désormais par queuemachine, et non pas machine Guillaume Raffy 2012-06-28 12:11:21 +0000
  • 319c78dd86 ai ajouté un mécanisme (peu blindé mais qui fonctionne) qui permet d'ajouter ou d'enlever des machines du controle de ClusterController via un serveur http (pour la première fois, on peut interagir avec le daemon ClusterController) Guillaume Raffy 2012-06-26 16:08:36 +0000
  • 006d8752c9 la page cluster status affiche désormais les états disabled et error des queues Guillaume Raffy 2012-05-29 16:31:01 +0000
  • fa2dc0cd67 ajout de l'affichage des queues (on peut désormais voir sur quelle queue les jobs tournent). Cela a nécéssité des modifs dans les librairies cluster controller mais certaines modifications que je commite sont plus anciennes (je ne sais plus quand ça a été fait, ni dans quel but) Guillaume Raffy 2012-05-29 14:05:18 +0000