Aller au contenu principal

La gestion des données de recherche

La gestion des copies de sauvegarde

Il est recommandé d’élaborer un plan de gestion de données qui précisera, dès le début d’un projet de recherche, les données et les documents afférents qui seront à conserver et à protéger, à l’aide de copie de sauvegarde.

Une bonne règle est celle du 3-2-1 : 3 copies des fichiers, sur 2 supports différents, dont 1 copie hors site.

Idéalement, il faudrait conserver toutes les données de recherche jugées de qualité avec les documents afférents, c’est-à-dire : les métadonnées, les documents décrivant la méthodologie de collecte de données et de conception de la base de données, ainsi que les documents décrivant les façons d’utiliser ou de transformer la base de données.

  • Il n’y a pas de règle générale sur la fréquence des mises à jour des copies de sauvegarde des bases de données. Lorsque le projet de recherche progresse et que de nouvelles données sont disponibles, les fichiers conservés doivent être régulièrement mis à jour.
  • Par la suite, il est recommandé d’utiliser un plan de mise à jour qui peut faire un rappel automatique pour effectuer une révision et déterminer si des modifications à la base de données ou à un des documents afférents seraient nécessaires à faire.
  • De manière générale, considérez quel serait l’impact sur la poursuite de vos travaux si les fichiers créés ou modifiés depuis la dernière sauvegarde disparaissaient.

Aucun type de technologie n’est parfait, c’est pourquoi il est recommandé d’utiliser différentes technologies dans votre stratégie de sauvegarde.pour copier une même base de données. Parmi les technologies les plus courantes :

  • Répertoires réseau : placés sur des serveurs institutionnels qui sont protégés et qui font l'objet de copies de sauvegardes automatiques régulières.
  • Disque dur d’ordinateur : flexible tandis que la base de données est en élaboration, mais doit être utilisé en complément avec une autre technologie pour diminuer le risque de bris ou de perte.
  • Supports portatifs (clés USB, disque dur externe, CD, DVD) : abordables et utiles lors de déplacements, mais risque élevé de perte ou de corruption de données.
  • Répertoires en nuage : services commerciaux généralement peu coûteux. Protection et capacité de récupération des données de niveaux variables, selon le type de contrat de service.

Consulter la section Recommandation de stockage pour voir ce qui est recommandé pour la communauté HEC.

Il est important d’utiliser un format de fichier qui permettra une utilisation à long terme des données. Il est recommandé d’utiliser des formats dits ouverts (txt, csv, tab, flac, xml), qui facilitent l'accès, et d'utiliser l'encodage Unicode (ex. UTF-8).

Si vous utilisez un logiciel propriétaire, il est important de consigner le nom et la version du logiciel, de même que tout autre détail (système d'opération, dépendances logicielles, etc.) qui pourraient avoir un impact sur l'accès aux données.