ljf
1
Description du projet
Dernièrement notre instance zabbix qui sert à monitorer l’infrastructure est tombée en panne. Elle nécessitait de toute façon des ajustements (alertes trop verbeuses).
Il est proposé qu’ARN se concentre sur des actions de maintenances préventives en vue de réduire le nombre d’incidents. Notamment:
- prévenir les remplissage de disque sur sans-nuage
- créer des tableaux de suivis et des alertes pertinentes
Le pad de travail
Volontaires
Tu peux t’ajouter en éditant ce message wiki via le bouton
en bas du message
@ced117 @ljf
Todo
- Editer le pad pour proposer des solutions possibles
- Discuter ce sujet lors d’une réunion Slash pour faire les choix techniques
Changelog
sepp
2
Moi je suis chaud et j’ai du temps
1 « J'aime »
Quand le monitoring des services sera mis au propre ça pourrait être l’occasion de lancer une campagne “adopte un service”. Trouver des techos bénévoles prêts à donner du temps pour maintenir et améliorer un de nos services. Je me dis qu’en présentant ça purement technique sans trop d’engagement dans la vie de l’asso, on pourrait toucher un public.
Genre délivrabilité mail, moteur de recherche, etc.
sepp
4
J’ai fait un rôle ansible pour déployer un monitoring avec Grafana + Prometheus ( récupère un fichier json venant de proxmox).
Tu as la possibilitée d’adapter des choses sur zabbix ? 
J’ai pas encore totallement terminé la migration, mais quand ce sera opérationnel tu pourras aller regarder 
Il faut d’ailleurs que je migre certains points pour pouvoir utiliser l’API proxmox qui semble pas mal du tout.
sepp
6
Je suis pas sectaire. Zabix ou Grafana je ne possède pas de préférence.