En fait, il y a un serveur DNS secondaire ns1.karchnu.fr sur une autre IP sur un autre réseau et donc ça fonctionne pour toutes les personnes qui n’ont pas d’ip tournantes.
Pour préciser: netlib.re est un projet de karchnu, il détient le nom de domaine et l’héberge sur ses serveurs. Ce point a été clarifié il y a des années (car il y a eu effectivement un doute là dessus il fut un temps, car une partie était hébergé sur des serveurs internes, et finissait par être maintenu par des bénévoles ARN).
Il se trouve que l’un des serveurs (celui de l’interface web) est en housing chez nous, et est en panne à cause d’un soucis matériel.
Officiellement, d’après la page de présentation du housing d’ARN, un abonné housing est censé intervenir lui même sur sa machine qui lui appartient (genre on ouvre la porte). Y compris pour changer les disques. Bref, à la base, c’est pas une offre de location de dédié ou ARN se soucie d’avoir des disques en rab et de les changer, etc.
Le hic c’est que la machine est là depuis 15 ans et que karchnu n’est plus dans le coin (on pensait qu’il était dans les vosges mais il est plus loin). Du coup, effectivement ça déporte du travail sur nous.
Dans les faits, on a essayé et remis en route une première fois, et j’y suis retourné une nuit une seconde fois, mais la panne de disque s’est aggravée. Après quoi, de notre côté, il y a eu un essoufflement au niveau énergie et/ou un manque de dispo pour se rendre au datacenter (5 fois en 2 semaines sur l’ensemble des problèmes).
A ce stade il s’agit de configurer une console IPMI/BMC(pour prise de contrôle à distance) OU de brancher le disque 3.5" cassé sur un autre serveur pour lui donner accès aux système ce qui peut probablement lui permettre d’accélérer la restauration.
Bref pour des raisons familiales (liés au besoin de mon fils et aux agendas scolaire), j’étais plus trop en mesure d’y aller (ou alors entre 22h et 7h…). Et par ailleurs, j’ai de nombreux développements important à faire aussi. Sauf qu’utiliser 4h pour aller et faire ça au DC, le tout seul et en pleine nuit, sans trop savoir vraiment combien de temps ça va prendre et en ayant ma journée du lendemain dead (parce que ça fatigue), ben j’ai opté pour avancer sur les dev en espérant que d’autres bénévoles iraient un soir et que je pourrais faire la config réseau de l’IPMI à distance si besoin (même si totor ou ced117 me semble en mesure de la faire).
Plus personnellement, je dirais que le soucis aussi c’est que quand je dev, j’ai besoin de charger beaucoup de code dans mon cerveau et du coup j’ai du mal à ajouter de la charge mentale supplémentaire (je veux dire en plus des trucs du quotidien et du reste du taf qu’il faut bien gérer). Ça joue pas mal aussi. Des fois je rentre dans des tunnels sans m’en rendre compte (et je sais que je suis pas le seul).
Faut voir aussi que nos problèmes électriques récent font craindre une coupure si on rallume ce serveur en plus (bien qu’on aurais coupé le switch de l’IX temporairement si la machine de karchnu était pas dead)… Mais l’un dans l’autre cette situation fait que y aller c’est prendre le risque d’y rester ou d’y revenir pour un temps non négligeable et non désiré (si ça tourne au vinaigre) et c’est sans parler de la gestion de l’après panne (qui seraient alors la 5ème si on compte les 4 qui ont eu lieu en 5 jours) qui implique retouche de config réseaux, tests de tous les services et support auprès des membres. Bref, ça encourage pas à tripatouiller sans une bonne plage horaire devant nous ^^
Entre temps karchnu a annoncé travailler pour remonter le service, moi de mon côté je peux éventuellement me trouver un créneau dimanche si ça l’aide. Mais à ce stade je pense que ça implique une décision collégiale ce soir, car faut quand même qu’on limite les risques de coupures pour l’ensemble des autres services.
Après un scénario aurait pu être un⋅e bénévole va au DC et branche le disque avec un connecteur sata 3.5 sur un de nos autres serveurs (par exemple si ce ou cette bénévole n’est pas en mesure de faire la config IPMI).