Suivi des incidents et maintenances majeures

Mardi 15 Février 2022 à 21h30 - Serveur matrix non joignable

Le serveur matrix n’est plus joignable. On cherche pourquoi.

EDIT 16/02/2022 à 00:30: C’est réparé (les bases de données postgresql et mongod étaient éteintes).

Mercredi 16 février - Nextcloud, Lufi et Framaforms down

L’incident vient d’être découvert, recherche en cours.
EDIT 15:33: Problème résolu via une mise à jour d’une librairie PHP et relancement des services. Merci @Tom et @Irina pour le signalement

1 « J'aime »

Dimanche 20 février à 18:40 - Maintenance COIN

On met à jour COIN vers la nouvelle version

PS: Au fait on a réparé le bridge Matrix/whatsapp https://wiki.arn-fai.net/documentation:sans-nuage:whatsapp

EDIT 20:30: La maintenance est finie (mais on recommencera peut être tout à l’heure

Samedi 26 février à 4H - Panne etherpad, Matrix,…

Pour une mystérieuse raison le SSD de sans-nuage était full ce qui a fait tomber plein de services.
On est entrain de redémarrer et d’identifier la cause du remplissage.

EDIT: etherpad et matrix sont repartis: Faites signe si vous avez un pb

2 « J'aime »

Lundi 28 février : Mise à jour Discourse

La mise à jour à pris un peu de temps. Du coup petite interruption de service au niveau du forum mais tout devraient être de nouveau disponible.

1 « J'aime »

Vendredi 5 mars - bis repetita pour sans-nuage

Le disque était de nouveau plein. Après un examen approfondis c’est lié en réalité à un point de montage qui a sauté lors d’une mise à jour remplissant notre SSD au lieu de la partie HDD.
Une maintenance est à prévoir ce week end (avec 5/10min de downtime)

Mardi 8 mars - Mise à jour sans-nuage.fr

Plusieurs services du serveur sans-nuage.fr ont été mis à jour. Nous avons aussi ajouté des hooks pour appliquer plus proprement des modifications sur des configurations internes.

Jeudi 10 mars - Suppression du bandeau ARN sur sans-nuage.fr

Le bandeau étant à refaire et présentant des incompatibilités évidentes avec certaines applications il a été désactivé le temps de trouver une solution.
Les pads étaient impactés de façon importantes depuis la mise à jour de mardi (et nextcloud dans une moindre mesure).

1 « J'aime »

Dimanche 13 mars - A propos de Wekan

Suite à une mise à jour Mardi qui n’a pas bien fonctionnée, le service wekan est toujours en panne. Au vu de la complexité pour réparer, nous avons choisis d’attendre des plaintes à ce sujet car nous n’étions pas sûr de la réelle utilisation du service. A ce jour, seulement 2 personnes ont signalé l’utiliser.

Nous souhaiterions migrer vers Nextcloud Desk qui comporte des fonctionnalités en moins mais également d’autres en plus. Nous allons évaluer avec les 2 personnes concernées la difficulté pour elles de migrer le contenu de leur tableau wekan et décider si ça vaut le coup de passer une dizaine d’heures bénévoles pour réparer wekan.

https://sans-nuage.fr/task/

EDIT 17/03/2022: Ce soir, nous allons réessayer de déployer notre wekan avec les données pour les 3 personnes qui en ont fait la demande. J’ai produis un comparatif rapide Wekan / Nextcloud Deck.
EDIT 22/03/2022: J’ai finalement trouvé un peu de temps pour réparer ça. C’est de nouveau UP, mais l’avenir du service est remis en question.

Lundi 14 Mars - Panne du bridge Whatsapp

Pour une raison inconnue le bridge était down (service debian) et le bridge était logout avec un message d’erreur apparaissant dans l’application whatsapp du type « pour une raison inconnue votre session a été déconnectée ».
Après redémarrage du bridge et login ça semble etre à nouveau fonctionnel. La panne a pu durer plusieurs jours, elle est résolue. Malheureusement les messages passés entre-temps ne sont pas récupérés. Il faudrait voir si on peut améliorer ça via les paramètres du bridge #backfill .

1 « J'aime »

Mercredi 23 Mars - Résolution d’un bug entre OnlyOffice et Nextcloud

Il y avait un soucis de synchronisation entre les 2 applications. Les fichiers potentiellement impactés ont été copié à côté avec un suffixe _backup ou _conflict en plus. Il est probable qu’il n’y ait pas de différence entre les fichiers, mais nous avons préféré cette solution plutôt que de prendre le risque que vous ne remarquiez pas les différences entre vos fichiers. Les fichiers originaux sont à consulter dans OnlyOffice.

Le détail du dépannage est ici: https://forum.yunohost.org/t/how-to-fix-differencies-between-onlyoffice-files-and-nextcloud-files/19195

EDIT 27/03/2022: les fichiers « _backup » ne pouvaient pas être supprimé, ils le sont désormais.

1 « J'aime »

Dimanche 1 mai à 23h45 - Mise à jour de sécurité Nextcloud vers 22.2.7

RAS tout s’est bien passé et était up en 15min.

2 « J'aime »

Jeudi 12 mai de 9h à 14h30 - Maintenance chez Cogent

Cogent va faire une vérification sur un groupe électrogène. A priori, aucune coupure à prévoir, mais vu que notre switch n’a qu’une seule arrivée électrique (au contraire du reste de l’infra) on se tiendra prêt à y faire un saut au cas où c’est nécessaire.

1 « J'aime »

Vendredi 3 juin - Pannes intermittentes sur le résolveur DNS

Nous soupçonnons des pannes intermittentes sur notre résolveur DNS ouvert 89.234.141.66 .
Symptôme: impossible d’ouvrir des pages web (sauf en redémarrant l’ordi ou en vidant le cache DNS du navigateur).

Jeudi 16 juin - Lenteur sur le service wekan

Des lenteurs ont été détecté sur le service wekan. Un redémarrage du service semble avoir réglé le soucis.

Mercredi 22 juin - Mise-à-jour de matrix et du bridge whatsapp

Ce soir à 20H aura lieu une session d’upgrade du bridge WhatsApp. En prévision le serveur synapse va etre mis à jour entre 16H et 17H. Quelques minutes de coupure des tchats Matrix sont à prévoir.

Edit: la màj a bien fonctionné. N’hésitez pas à dire s’il y a des soucis.

Mardi 28 juin - Panne du forum

Le forum est tombé en panne depuis mardi soir. Il est désormais fonctionnel depuis 17h ce mercredi.

1 « J'aime »

Dimanche 3 juin - Arrêt temporaire du service lufi

En raison, d’un abus sur notre service drop.sans-nuage.fr ayant impacté la réputation de la délivrabilité des mails sans-nuage, le service lufi a été stoppé le temps de régler le problème.

Merci @oertz pour le signalement

EDIT: un correctif a été écrit pour le package et le lufi a été réinstallé avec le correctif (la mise à jour ayant échouée à cause de notre personnalisation). Si vous avez transféré récemment des fichiers il faudra les recharger désolé (on ne sauvegarde pas ces données volatiles)

Jeudi 18 aout - Correctifs sur les pads

Les pads sans-nuage contenant de nombreux titres souffraient de ralentissements, nous étions nombreux et nombreuses à désactiver la table des matières pour éviter ça.

Celle-ci est désormais désactivée par défaut. (j’ai patché le code en m’inspirant de https://github.com/ether/ep_table_of_contents/issues/58#issuecomment-1210414909 ).

Mercredi 28 septembre - Réorganisation du forum et des mail listes

Suite à la réunion de mardi soir, il a été décidé de réorganiser notre outils de communication. Si vous faites parties des 25 personnes accédant à tout ou partie des groupes privés vous aurez peut être un peu de spam dû à la réorganisation. Désolé.