Le plan de gestion des données (PGD) : Interview de Dorian McIlroy - Ouest Valorisation

Success stories

30.Jan.2024

Le plan de gestion des données (PGD) : Interview de Dorian McIlroy

Quand et dans quelles circonstances, avez-vous été confronté à la question des Plan de Gestion des Données (PGD) pour la première fois ? 

J’ai été confronté à la rédaction d’un PGD (Plan de Gestion des Données) cette année en tant que coordinateur du projet ANR ‘Rep2Eps’. Même si c’était la première fois formellement que je devais rédiger un tel document, en pratique, j’ai été confronté à ces problématiques depuis longtemps, 10-15 ans, c’est-à-dire depuis que je gère un peu plus que mes propres données. Les questions posées dans le document de l’ANR sont celles que chaque personne devrait se poser dans l’organisation d’un travail de recherche : comment stocker, sécuriser, partager ses données etc. Ce sont des questions de fond pour bien structurer un travail de recherche et s’assurer que des données de recherche ne soient pas perdues (par exemple si un doctorant part) ? Cela permet de s’assurer de la poursuite et de la pérennité des recherches, cela s’applique aussi dans le cas des publications.

Maître de conférences à l’UFR Sciences et Techniques, Dorian Mcilroy mène mes recherches en biologie au CR2TI depuis 6-7 ans. Issu d’Oxford University (R-U), il a réalisé son DEA et sa thèse à Paris.

Les documents ressources existants (ANR ou autre) vous ont-ils été utiles ? Ces documents étaient-ils bien adaptés aux spécificités de votre projet ?

J’ai commencé par le template de l’ANR, qui se veut utilisable par n’importe quel type de projet ou de données. Je l’ai trouvé utile mais générique et pas très adapté aux caractéristiques de mon projet en biologie/santé. Le template de Nantes Université est très semblable.

Pour m’aider, j’ai sollicité des collègues de l’unité pour avoir un exemple adapté à mes problématiques. Cela m’a permis aussi de savoir décrypter les différentes lignes, en consultant des exemples concrets adaptés à mon domaine, et d’être éclairé sur ce que je devais aller chercher comme information pour mon projet.

Une chose m’a semblé curieuse dans le document type de l’ANR : expliquer la méthodologie utilisée pour collecter de nouvelles données. Or c’est ce qui a été déjà précisément décrit dans le projet déposé à l’ANR ! Par cette première ligne, j’ai eu l’impression que la personne qui a rédigé le document était déconnectée du monde de la recherche scientifique… ça m’a vraiment surpris. J’ai donc commencé ce travail autour du PGD avec un mauvais a priori, toutefois le reste est plus technique, plus précis sur le sujet des données.

 

Quelles ont été les principales difficultés ?

Je pense que la principale difficulté était d’obtenir des informations exactes auprès des partenaires du consortium. J’ai fait de mon mieux en interne au laboratoire, mais les réponses de certains partenaires extérieurs pouvaient parfois être approximatives et/ou il fallait relancer pour obtenir les informations.

 

Quels enseignements en avez-vous tiré et quels seraient vos conseils à destination de chercheurs novices en la matière ?

Si je fais la comparaison avec le précédent projet ANR auquel j’étais associé en 2017 où le PGD n’était pas imposé, le porteur étant une collègue à moi, on s’est retrouvé confronté à la question du dépôt des données dans un entrepôt public (repository) et on n’avait pas vraiment prévu de solution de back-up de données au fur et à mesure du projet, pour pallier ces questions-là.

Si collectivement on avait plus réfléchi au début, on aurait gagné du temps au final. Donc c’est très bien que cela soit imposé dès le démarrage du projet. Je ne dis pas que j’étais content de faire le PGD, mais j’ai trouvé la démarche vraiment utile et je ne retomberai plus dans les mêmes pièges que pour le projet précédent. Ce sont les enseignements que j’ai tirés de ces deux projets. Le fait de se poser les bonnes questions de façon imposée au début du projet est le bon moment et cela apporte un bénéfice.

Exemple concret : le cahier de manip électronique LabGuru mandaté pour les unités INSERM comprend une certaine structure d’arborescences de projets. Hors LabGuru n’est pas un document de stockage de données. La question était de savoir comment faire coïncider LabGuru et mon projet, il fallait que les deux soient compatibles et cela m’a amené à imposer une arborescence adaptée à LabGuru, auprès des différents intervenants de la recherche, ainsi que sur un même format, sur un même serveur (tandis qu’avant, cela pouvait être en local, sur chaque poste) et c’est la contrainte du PGD qui m’a obligé à mettre en place cette organisation pour moi et tout le monde sur le projet !

En synthèse, le conseil à donner aux novices des PGD, serait de rappeler que les questions posées dans le PGD sont les mêmes que celles auxquelles on sera confronté ultérieurement. Donc il faudrait le faire, même si ce n’est pas obligatoire, car cela sera au final un gain de temps.

Aussi, au niveau de l’unité puisque nous étions plusieurs à lancer ces démarches, cela a amené des réflexions sur un cadre commun ou du moins un partage de bonnes pratiques à adopter et des retours d’expérience, pour faciliter d’une part la rédaction des PGD et d’autre part pour faciliter la collaboration inter-équipes, dans la mesure du possible.

Par ailleurs, la nature générique du PGD de l’ANR, m’a obligé à réfléchir à « qu’est-ce qu’exactement une donnée ? ». J’ai essayé de faire des distinctions sur les types de données. Par exemple j’ai réfléchi aux données brutes d’observations, mais je pense que ce n’est pas vraiment ce type de données que les questions du PGD ciblent. Ces données sont importantes pour la documentation interne, en cas d’audit par exemple, mais il n’y a pas vraiment de valeur à déposer ce type de données dans un entrepôt public. J’ai donc dû m’interroger sur ce que l’on devait garder pour nous et ce qu’il serait utile de partager avec la communauté scientifique, selon les principes FAIR. On ne devrait pas restreindre un PGD à la réutilisation en externe, mais aussi à la réutilisation de toutes les données en interne.

 

Avec le recul, quel a été l’intérêt du PGD pour vous et votre projet ? Notamment en termes de valorisation ?

Personnellement, ce que je vois c’est que nous avons une meilleure traçabilité des données préalables au dépôt d’un brevet. Si c’est bien fait dès le départ, cela facilitera ensuite la réponse à de nouvelles questions pouvant surgir en cours de projet, sur la brevetabilité par exemple des inventions.

C’est le cas avec le cahier de manip électronique qui facilite l’enregistrement des expériences passées, mais il faut encore être capable d’aller trouver ces données !

Réfléchir au PGD cela permet de sécuriser l’historique des expériences ayant mené à une invention, en vue de déterminer notamment les quoteparts d’inventivité.

Contactez-nous

Vous avez un projet innovant ? Laissez-nous vous aider à le concrétiser

Parlez-nous de votre projet