Pour nous contacter : soyez au rendez-vous sur IRC ! ⋅ Parcourir l'archive musicale Dogmazic ⋅ Notre Blog
Notre Documentation

[Annonce/Appel] Crash des disques sur le serveur

2456

Réponses

  • ption 1 car :
    - à ce que j'ai cru entendre, l'asso ne roule pas sur l'or
    - il n'y avait aucune garantie de garder nos morceaux jusqu’à la fin des temps3
    - ça fait une leçon à ceux qui avaient une foi inébranlable envers la technologie : Hé oui, la machine, c'est faillible
    - c'est comme ça qu'on crée des inédits !
    la bise à tous.
  • Bonsoir à toutes et à tous,


    Option 1, sans hésitation !

    Un RAID logiciel, même si cela n'est pas la panacée universelle au niveau performances, peut être une solution viable qui élimine purement et simplement le risque de défaillance d'un contrôleur RAID matériel... C'est tout de même beaucoup moins coûteux que d'opter pour un système avec contrôleur RAID redondant...

    Bon courage à toute l'équipe Dogmazic pour la suite des opérations !


    A très bientôt,
  • ORL_AMMD écrit:
    Pour préciser : les disques ne sont pas foireux, c'est le contrôleur qui a déraillé. Donc, le résultat c'est que :
    - la matrice RAID est devenue incohérente,
    - [mode Daniel Prevost]les systèmes de fichiers sont pétés[/mode].

    Du coup, pour dd, on a déjà tenté, lorsque le contrôleur a bien voulu remarché, la première fois, le premier réflexe de Jérôme (après un fsck) a été de lancer une sauvegarde de sécu. C'est pendant cette sauvegarde (à 0h50 pour être précis) que le contrôleur est reparti dans le mur...

    hello,

    Et donc ? on change de machine ou le contrôleur disque a été changé ? Parce qu'il ne faut pas repartir avec le même matos qui ne tiendrait d'ailleurs probablement pas jusqu'à la fin de la réinstallation.
  • Perso je n'héberge rien donc je ne vote pas directement mais je pense comme tout le monde que la solution 1 est de loin la meilleurs parce que de 1 fallait partager tes morceaux sur les bornes pragmazic et de 2 lacher du pez pour envoyer les disques en salle blanche et récupérer peau de zob parce qu'on sait tous que de toute façon l'équipe de dogmazic a déjà tout testé et qu'au final on ne risque de perdre que 20% de l'archive qui en plus peut surement être réuploadé a 90%, ça n'a pas d'intéret, autant garder des tunes pour réinvestir dans une solution plus sur, le dit controleur ayant peut étre été acheté au rabais faute de moyens...

    C'est bizarre ça quand même, je pensais qu'un des intérets du mirroring était qu'un disque ou que le controleur lui même pouvait planter, 'fin bref, si ça ce trouve c'était pas un raid 1 et puis je présume que tout a été fait au mieux avec les moyens qu'on a donc, pas de bol.

    Bon courage a ceux qui gérent tout ça.
  • Diamond_d écrit:
    C'est bizarre ça quand même, je pensais qu'un des intérets du mirroring était qu'un disque ou que le controleur lui même pouvait planter, 'fin bref, si ça ce trouve c'était pas un raid 1 et puis je présume que tout a été fait au mieux avec les moyens qu'on a donc, pas de bol.

    Bon courage a ceux qui gérent tout ça.
    Merci de vos messages de soutien, les sysadmins en ont besoin. :)

    En fait, c'était bien du RAID 1 matériel, quand on utilise ce genre de système (qui se fait à tour de bras sur une grosse majorité de serveurs) cela permet de répliquer un disque sur un autre, autrement dit cela donne deux disques identiques pour prévenir quand l'un est défectueux que l'autre puisse toujours être fonctionnel (il est rare que deux disques lâchent en même temps). Donc vu de cet angle c'est bien, sauf qu'avec un RAID matériel on ajoute un composant entre la carte mère du serveur et les disques durs, et celui-ci a lâché en écrivant sur les disques comme il n'aurait pas dû, voilà pour le problème qu'encourt Dogmazic actuellement.

    Donc toujours penser qu'un RAID 1 (ou autre) ne protège rien du tout sauf à garantir le fonctionnement de l'infrastructure dans le cas d'une défaillance de disque, ça ne remplacera jamais les sauvegardes !

    L'idée du RAID logicielle n'est pas si mauvaise que ça, mais ce serait bien d'avoir des benchmarks du serveur pour voir si il tiendrait la charge, avec ceci on supprime le contrôleur RAID matériel. Faut-il ensuite voir si l'hébergeur accepte.

    Je penche aussi pour l'option 1 mais rien de défini.
  • Je serai pour l'avis 1 egalement.

    J'ai cependant quelques questions:
    1) Impossible de faire un dd sur le disque ? (Quelle taille fait il?)
    2) Avons nous quelques part une liste des morceaux disparu ? (J'avais copie il y a 1 an une grosse partie de Jamendo pour etre exact (Peut etre qu'il y a des morceaux perdu qui ont quitte Jamendo et se retrouve ici dont j'ai une copie)

    Je dirai qu'on repart dessus, on informe tout le monde (Comme cela vient d'etre fait) et en esperant qu'une partie des pertes sera reuploade.
    Pour le reste, on tente nous meme de recuperer les infos sur le disque.
  • Idéalement ça aurait été sympa, de pouvoir récupérer tout les morceaux, mais étant donné qu'il n'y a aucune garantie de réussite et que c'est payant, je me range finalement à l'option 1.

    Il y aura surement quelques chef-d'oeuvres perdus, mais tant pis il vaut mieux que vous investissiez dans du bon matos ou un bon système logiciel de sauvegarde, plutôt que dans une tentative de récupération Syscard à la mord-moi-le-noeud qui a 91,3% de chances de foirer.

    Par ailleurs d'après ce qui a été dit, je pense que la plupart des artistes ont les copies de leurs morceaux sur leurs machines et pourront les remettre sans problème. Surtout que vous avez quand même une sauvegarde de 2010 donc je pense que seul 3,26% des morceaux sont vraiment perdus pour toujours, enfin peut-être pas pour tout le monde mais il est très peu probable que quelqu'un ait des embrouilles pour prouver la paternité de ses oeuvres.
  • Option 1, car on peut toujours ré-uploader nous-même (penser à faire un mail aux gens qui ont perdu des morceaux, car pas forcément moyen d'y penser soi-même).

    Sur le fond :
    - y'a pas de backup régulier ?! WTF ?
    - j'ai toujours eu que des emmerdes avec le RAID matériel. Le RAID soft n'impacte les performances que de manière marginale, en tout cas en RAID0/RAID1. Certains disent même le contraire, les CPU de nos jours étant bien plus puissants que les chips dédiés des cartes RAID (mais bon j'ai rien vu de technique le prouvant). Et ça apporte un sacré avantage : en RAID hard si la carte crève (classique hélas), vous pouvez oublier vos données (à moins de retrouver la même carte), en RAID soft, vous pouvez insérer un des disques dans n'importe quelle machine et les données sont là.

    Quand vous aurez perdu une fois, deux fois, trois fois (vécu inside) vos données (mais bon on a toujours des backups récents hein ;) ) parce que les cartes RAID ça meure plus souvent que les disques qu'elles sont sensées protéger/seconder, vous serez heureux de passer au RAID soft :)
  • Oui sans hésiter le choix 1.
    Moi même ayant eu 5 crashs sur 5 ans ... Cramage de plus d'un millier d'euros de matos de stockage et raid... j'ai perdu des données, mais j'ai mes zics sur des sauvegardes... Donc s'il faut...
  • Yep !

    O.P.A a bien sûr sa notre musique sauvegardée ailleurs que sur le site.
    S'il le faut, nous pourrons de nouveau la réinstaller sur l'archive.

    Donc va pour la solution 1 si c'est la plus simple et ma moins coûteuse !

    m. pour O.P.A
  • No problem !

    Choix n°1 !
  • Clairement le choix 1 et un mail groupé à tous les artistes pour qu'ils vérifient que leur(s) morceau(x) est en ligne et "propre" ?

    Merci pour cette consultation, merci à tous ceux qui proposent des musiques en licence Art Libre, je suis réalisatrice, et je trouve des merveilles pour illustrer mes courts.
  • ça aura au moins permis de faire péter les stats de fréquentation du forum ce "p'tit" problème :D
  • D'accord avec la majorité. Les artistes peuvent bien un peu se bouger les fesses pour remettre leurs morceaux et leurs infos en ligne, non?
  • que chacun se remonte les manches, en ce qui me concerne.
    1ere solution big up dogmazic
    et longue vie!!!
  • Histoire de finir avec les questions techniques :

    @ Equilibre et Dj_Quality : c'était du RAID 5, c'est le contrôleur SATA qui est tombé. Le contrôleur SATA qui contrôlait deux disques apairés (et le problème est en fait là, sinon, ça ne serait pas tombé, mais évidemment, on ne maîtrise pas tout dans ces affaires là).

    @ xulops : il est évident que le contrôleur doit être changé. Si j'ai tout bien compris (rien n'est moins sûr), c'est le cas.
  • Je pense que si on est sûr du matos, il faut restaurer la sauvegarde qu'on a effectivement, publier la liste des "différentiels" pour identifier ce qui doit être re-upload par les gens, les prévenir en s'excusant pour ce foutu controlleur SATA.
    Ca va faire des mécontents, mais moins que tout les messages que je vois fleurir partout comme quoi l'archive est morte et que c'est 404 sur 404.

    J'allais dire : le service d'abord.

    D'autant que la récupération de données si j'ai bonne mémoire c'est un truc à faire des cratères dans un budget, autant pas couler l'asso pour ça. (ni pour quoi que ce soit d'autre)

    my 2 cents.

    dF
  • bohwaz écrit:
    Sur le fond :
    - y'a pas de backup régulier ?! WTF ?
    J'ai posé la question avant toi : http://www.dogmazic.net/modules.php?ModPath=phpBB2&ModStart=viewtopic&t=6230&t=6230&sid=4c965e8584916c356e55f4129e50689d&npds=0

    Maintenant voilà. :roll:

    On utilise quelle(s) offre(s) de l'hébergeur ? Histoire de voir les caractéristiques techniques.
  • Y en a, mais je vous rappelle que Dogmazic a tournée quasi-sans admin système (en tout cas, sans admin dédié) pendant presque 2 ans, donc forcément, tout ne roule pas nickel, même si Jérôme, Olivier, Sylvain et Franck font en sorte que tout ça reprenne forme.
  • restaurer la sauvegarde !!!
    c'est pas grave tout le monde prendra de son temps pour re-uploader les "pertes"!!
    la vie continue !!

Ajouter un commentaire