Retour d'expérience sur la mise en place du système d’information du pôle de recherche Ampiric
par Elie Perrichon, Chef de projet Système d’information ampiric.fr, le vendredi 12 décembre 2025
L'expérience d'Ampiric illustre un point que les porteurs de pôles interdisciplinaires connaissent souvent intuitivement, sans toujours disposer des outils pour y répondre : dans un collectif distribué, la cohérence organisationnelle dépend en partie de la cohérence de son infrastructure numérique. Non pas que l'outil détermine l'organisation, mais qu'en l'absence de cadre structurant, la fragmentation des pratiques numériques reproduit et amplifie la fragmentation institutionnelle.
Une fragmentation initiale structurelle
Comme souvent dans les phases d’émergence d'un pôle ou d’un projet de recherche, l'organisation initiale d'Ampiric repose sur une accumulation d'outils hétérogènes qui coexistent sans se coordonner. L'annuaire des membres existe sous forme de tableur partagé, sans capacité à représenter des affiliations multiples ni à suivre les évolutions de composition. Les publications des chercheurs sont disséminées dans les collections HAL de leurs laboratoires et projets respectifs. Si une collection dédiée au pôle existe, elle ne capture qu'une partie de la production : les travaux menés en dehors du périmètre Ampiric, les publications antérieures, les contributions individuelles restent invisibles depuis le portail du pôle, sans lien avec les profils, les projets ou les structures qui les portent. Les documents de travail transitent par messagerie ou s'accumulent dans différents espaces personnels et collectifs dont les droits d'accès correspondent rarement à l'organisation réelle et doivent être ajustés au cas par cas. Les projets collaboratifs, enfin, n'ont pas d'espace structuré, et les événements sont annoncés de façon ponctuelle, déconnectés des projets qui les génèrent et des personnes qui les portent.
Cette fragmentation produit des effets immédiats et cumulatifs. Elle rend difficile toute consolidation d'information à des fins de pilotage ou de reporting, quand un financement de l'envergure du PIA3 implique des obligations d'évaluation régulières qui requièrent une vue fiable de l'activité. Elle nuit à la lisibilité externe du pôle, dont la légitimité repose précisément sur sa capacité à faire apparaître la cohérence d'un collectif malgré la diversité de ses origines. Elle freine, enfin, l'émergence d'une culture de travail partagée entre des acteurs, chercheurs, formateurs, membres de l'Éducation nationale, dont les pratiques numériques ne sont pas homogènes.
Construire un pôle, construire son infrastructure
La constitution d'un pôle de recherche interdisciplinaire, pour ce qu’elle relève essentiellement d'un assemblage scientifique ou institutionnel, est alors susceptible de bénéficier de la mise en place d'une infrastructure capable de représenter, organiser et stabiliser un collectif par nature distribué. Dans le cas du pôle Ampiric, qui s’engage alors pour dix ans dans la recherche sur l'apprentissage des savoirs fondamentaux, cette exigence se pose ainsi avec une acuité particulière. Le dispositif fédère des chercheurs issus d'une vingtaine de laboratoires relevant d'établissements distincts : Aix-Marseille Université, Avignon Université, l'Université Côte d'Azur, le CNRS, la région académique Provence-Alpes-Côte d'Azur. Il associe également des partenaires non académiques : l'Académie d'Aix-Marseille, le Réseau Canopé, l’ANRT, des acteurs privés des technologies de l’éducation, dont les pratiques de travail, les outils numériques et les référentiels institutionnels diffèrent profondément de ceux du monde universitaire.
Dans une telle configuration, la mise en place d'un site web ne peut être réduite à une problématique de communication, tout au moins dans son acceptation courante. Elle implique de définir un cadre qui permette de représenter les relations entre des membres aux affiliations multiples, des activités transversales aux structures d'origine, et des productions scientifiques dispersées sur des dépôts institutionnels distincts. Le système d'information ne contribue pas seulement à une organisation existante : il participe à sa construction, en s’appuyant sur une approche de la communication dans son acceptation opératoire et structurée, celle de la mise en commun.
La structuration des données comme fondement du système
C'est dans cette perspective qu'a été déployée Luscie, une distribution modulaire construite sur Drupal. Son introduction ne s'est pas effectuée comme l'implémentation d'un système complet, mais comme la mise en place progressive d'un socle structurant, déployé et ajusté en fonction des besoins et évolutions du pôle. Le principe directeur est aussi simple dans sa formulation que déterminant dans ses conséquences, il consiste à partir des données, structurées autour des acteurs, institutions, projets, productions, et de leurs relations, pour constituer un site web cohérent, un intranet fonctionnel, et une base exploitable pour la valorisation scientifique. La modélisation précède l'interface. L’organisation, la cohérence et l’accessibilité interne priment sur la visibilité à court terme, en ce qu’elles la fondent pour toute la durée de vie du pôle.
Architecture et choix techniques
Un socle Drupal exploité dans ses standards
Luscie repose sur Drupal, dans ses versions 9 puis 10, sans modification du cœur applicatif. Ce choix impose une discipline stricte : utilisation de l'Entity API, respect des mécanismes de champs, compatibilité avec l'écosystème contribué, dont les bénéfices se mesurent, ici encore, dans la durée. Dans un contexte institutionnel où les équipes évoluent et où l'horizon du projet excède largement celui des contributeurs individuels, cette contrainte devient un avantage : elle favorise la maintenabilité, l'applicabilité des mises à jour de sécurité, et la possibilité de faire évoluer le système sans rupture. Pour Ampiric, engagé jusqu'en 2030, ce critère de pérennité est aussi déterminant que l'éventail des services.
Le développement s'appuie ainsi sur les normes contemporaines de PHP (typage strict, promotion des constructeurs, analyse statique PHPStan) qui rendent explicites les interactions et permettent de maîtriser les impacts liés aux évolutions. Des standards qui facilitent la transmission et soutiennent la reprise et l’appropriation du système par d’autres équipes, leur permettant de le maintenir et de le faire évoluer en autonomie une fois le développement initial clôturé.
Une architecture modulaire à dépendances contrôlées
L'écosystème Luscie s'organise autour d'un noyau — le module luscie_net — et de satellites reliés par des dépendances strictement unidirectionnelles. Le noyau définit les entités fondamentales sur lesquelles s’appuient tous les modules complémentaires. Ces modules utilisent les entités du noyau sans en modifier le schéma, ce qui garantit qu'activer ou désactiver une brique fonctionnelle ne remet pas en cause l'intégrité du modèle global.
dépendances unidirectionnelles entre le noyau et les modules satellites
Ce découplage n'est pas seulement technique : il conditionne la capacité à déployer la plateforme de façon progressive. Dans le cas d'Ampiric, l'annuaire a été mis en place en premier, les modules de gestion des projets, des documents et des publications ayant été activés ultérieurement, à mesure que les usages se précisaient. Cette stratégie évite un écueil fréquent : imposer un système complet à une organisation encore en construction, au risque de figer prématurément des pratiques qui n'ont pas encore trouvé leur forme.
Intégration dans l'écosystème scientifique
HAL comme source de référence pour les publications
Luscie s'inscrit dans un environnement logiciel préexistant qu'il ne cherche pas à remplacer. La gestion des publications en constitue l'exemple le plus significatif. Plutôt que de proposer un système de saisie interne — qui imposerait une charge éditoriale continue et serait inévitablement source de désynchronisation —, Luscie s'appuie sur HAL comme référence unique. Les données sont récupérées via l'API de l'archive ouverte, normalisées et présentées dans le portail sans duplication fonctionnelle des données, hors mécanismes de cache.
Pour Ampiric, dont les membres déposent leurs travaux dans les collections HAL de leurs laboratoires d'origine respectifs, en complément ou non d’une collection commune, cette architecture est particulièrement cohérente : le sous-module luscie_open_hal construit des requêtes Solr optimisées, avec sélection stricte des champs demandés pour réduire la taille des réponses, tri côté serveur, pagination intelligente, et met en cache les résultats avec des durées de vie différenciées selon la nature des données.
Chaque chercheur renseigne son identifiant HAL (idHal) dans son profil (à défaut le système tâche de le reconstituer puis se base sur les nom et prénom) et ses publications apparaissent automatiquement sur sa fiche et, le cas échéant, sur les pages des projets auxquels il contribue. Pour un pôle qui fédère des dizaines de chercheurs issus d'autant de laboratoires, ce mécanisme assure une valorisation continue de la production scientifique sans mobiliser de ressources éditoriales.
Un périmètre volontairement délimité
Ce positionnement vis-à-vis de HAL illustre une philosophie d'ensemble : Luscie manipule exclusivement des métadonnées, fiches de membres, descriptions de projets, références bibliographiques, documents de travail collaboratifs,… sans se substituer aux systèmes d'information RH des établissements d'origine, aux entrepôts de données de recherche, ni aux outils de gestion financière. Ces infrastructures restent dans leur environnement propre ; Luscie peut y faire référence, mais n'en duplique pas le contenu.
Ce choix de périmètre est structurant à double titre. Il réduit, d’une part, la complexité du système et facilite son intégration dans des environnements institutionnels hétérogènes, sans remettre en cause les outils existants de chaque partenaire. D’autre part, Il permet en parallèle de disposer de données structurées, exploitables selon des modalités variées : suivi d’activité, organisation interne, évaluation, sans imposer un format unique de restitution. Luscie fournit ainsi une base cohérente pour produire ces analyses, sans en contraindre les formes.
Modélisation des données
Représenter la complexité institutionnelle d'Ampiric
La conception du modèle de données constitue le point central de l'architecture, et c'est là que se joue l'essentiel de la valeur du système. Le noyau luscie_net définit trois entités fondamentales dont les relations structurent l'ensemble de la plateforme.
L'entité Person dissocie explicitement l'identité d’un membre du compte utilisateur Drupal. Une personne peut exister dans l'annuaire, avec une fiche complète, des affiliations documentées, des publications agrégées, sans disposer d'aucun accès à l'interface d'administration. Pour Ampiric, cette séparation est immédiatement utile : elle rend possible l'intégration dans l'annuaire des formateurs de l'Éducation nationale, des partenaires institutionnels ou des doctorants dont la présence dans le collectif est réelle, en les laissant activer, au besoin, leur compte utilisateur. Par ailleurs, elle permet de conserver les profils des membres qui quittent le pôle, assurant une mémoire institutionnelle de la composition du collectif dans le temps, dimension particulièrement précieuse dans un dispositif aussi évolutif qu’Ampiric.
L'entité Ensemble couvre toute forme de regroupement au sein du pôle : Ampiric lui-même comme entité principale, ses groupes de travail, ses instances de gouvernance, certains de ses projets par la suite. Un système de configuration par « type » permet d'adapter le modèle à la réalité organisationnelle au long de ces mutations : une organisation externe et un groupe de travail informel sont modélisés comme des Ensembles de types différents, avec leurs propres champs et leurs propres règles d'affichage, reflétant le fait que ces deux objets n'ont pas les mêmes besoins de structuration. De plus, les Ensembles peuvent être imbriqués, et cette hiérarchie est exploitée aussi bien pour les organigrammes que pour les droits d'accès aux espaces documentaires.
les trois entités fondamentales et leurs relations qualifiées
Les Institution, enfin, constituent un référentiel distinct des structures internes du pôle. Elles représentent les entités de tutelle et de financement (AMU, CNRS, Académie d'Aix-Marseille, Réseau Canopé, Région Sud,…) comme les partenaires externes, et servent à qualifier les affiliations des membres et des structures. Ce référentiel partagé permet de générer automatiquement des mentions d'affiliation cohérentes sur les pages publiques, sans que chaque fiche de membre ait à dupliquer ces informations.
Modéliser les rôles et les engagements dans le temps
L'élément le plus déterminant du modèle est le mécanisme de relation entre ces entités. Là où une référence d'entité Drupal standard crée un lien binaire, le champ dédié encode une relation ternaire : un sujet, un rôle précis, une cible, avec une période de validité optionnelle. Ce modèle s’appuie sur un module générique dédié à la gestion de relations qualifiées entre entités, développé indépendamment du projet Luscie pour répondre à des problématiques générales de modélisation des relations entre données (voir dépôt : qualify). Il permet de représenter fidèlement des situations dans lesquelles une même personne intervient simultanément dans plusieurs contextes avec des fonctions distinctes. Un même chercheur peut ainsi être responsable scientifique d'un axe thématique, co-porteur d'un projet de recherche collaborative avec un partenaire de terrain, et membre du conseil scientifique du pôle, trois relations encodées avec leurs rôles propres et leurs périodes de validité, dérivées d'une seule entité Person.
Ces relations constituent la référence essentielle dont découle de nombreuses fonctionnalités : affichage des organigrammes, organisation des pages de projet, calcul des droits d'accès aux espaces documentaires, génération des pages de publications par chercheur. Il en résulte une propriété centrale : l'information est saisie une seule fois et exploitée dans l'ensemble du système, ainsi plus aisément maintenable et nécessairement plus actualisée.
Les rôles disponibles ne sont pas figés dans le code. Ils sont configurés depuis l'interface d'administration de Luscie et adaptés à la terminologie du pôle — « Chercheur affilié », « Partenaire terrain », « Formateur associé », « Doctorant financé Ampiric » — ancrant ainsi la plateforme dans la culture propre du collectif plutôt que dans un vocabulaire générique.
Structuration des activités et des productions
Les projets comme unités d'agrégation
Le module luscie_activity introduit la dimension temporelle dans l'écosystème. Dans Ampiric, il permet de structurer des projets d'une grande hétérogénéité : recherches collaboratives co-construites avec des équipes pédagogiques d'établissements scolaires, projets de recherche fondamentale financés en seed-funding interne, cycle de séminaire organisé avec le Réseau Canopé. En leur donnant, dans chaque cas, le niveau de structuration adapté. Des formats types distincts permettent de différencier ce qui relève d'un projet de recherche formel de ce qui relève d'un groupe de travail informel, sans imposer à ce dernier le cadre rigide du premier.
activités et projets comme points d'agrégation entre acteurs, structures et productions
Un projet n'est pas réduit à une page de description : il constitue un point d'agrégation qui relie des acteurs avec leurs rôles, une ou plusieurs structures porteuses, des documents de travail, et des événements. Cette structuration rend lisibles les dynamiques collectives du pôle et fournit, au moment voulu, la base nécessaire à toute forme de reporting sur l'activité.
Le moteur de visibilité de luscie_activity mérite d'être souligné séparément. Il distingue quatre niveaux — public, interne à l'ensemble des membres connectés, réservé aux membres d'une structure spécifique, privé aux seuls contributeurs explicites — là où un CMS standard propose la dichotomie publié/non-publié. Cette granularité permet à Ampiric de maintenir une présence externe documentée — séminaires ouverts, pages de projets publiées, agenda public — tout en protégeant les espaces de travail internes selon l'organisation réelle, sans configuration manuelle des droits pour chaque contenu.
De l'empilement à la structuration documentaire
Avant Luscie, la gestion électronique des documents d'Ampiric reposait sur une juxtaposition de pratiques individuelles : des fichiers échangés par messagerie, des espaces de stockage personnels partagés ponctuellement, sans arborescence commune ni cohérence dans les droits d'accès, un cloud partagé comportait l’intégralité des documents accessibles à toutes l’équipe et dont les droits devaient être établis individuellement. Le module luscie_net_document introduit une structuration collective : chaque groupe de travail, chaque membre dispose d'un espace documentaire propre, organisé en dossiers et dont les droits d'accès sont dérivés automatiquement des relations actives dans l'annuaire. Tous les fichiers sont stockés dans le système de fichiers privé de Drupal, hors de la racine web, permettant que les contrôles de droits s'appliquent effectivement au téléchargement et pas seulement à l'affichage des liens. La conséquence pratique est directe : les accès évoluent automatiquement avec les relations, sans intervention manuelle.
Gestion des accès et cohérence organisationnelle
Des droits dérivés, non configurés
La gestion des droits dans Luscie est une conséquence directe du modèle de données, et non un système parallèle à maintenir. Les permissions sont calculées dynamiquement à partir des relations actives : l'accès à une ressource dépend du rôle d'un utilisateur dans la structure ou le projet concerné, tel qu'il est défini dans l'annuaire à l'instant de la demande.
Ce mécanisme présente deux avantages majeurs dans le contexte d'Ampiric. Il garantit d'abord une cohérence permanente entre l'organisation réelle et les droits effectifs. Ensuite, il réduit considérablement la charge de gestion administrative : les évolutions de l'organisation se répercutent automatiquement sur l'ensemble des accès, sans intervention manuelle.
Les vérifications de droits sont optimisées par une stratégie de cache partagé entre modules. La liaison d'un utilisateur Drupal avec son entité Person est effectuée une seule fois par requête, même lorsqu'une page agrège simultanément des projets, des documents et des événements. Tous les modules satellites héritent du même gestionnaire de contrôle d'accès via les classes abstraites du noyau, garantissant qu'une modification des règles de base se propage à l'ensemble de la plateforme.
Apports, limites et conditions de mise en œuvre
Ce que le déploiement a rendu possible
L'usage de Luscie dans le cadre d'Ampiric met en évidence un ensemble d'apports qui tiennent moins à des fonctionnalités isolées qu'à la cohérence d'ensemble du système. La structuration de l'annuaire a constitué le premier levier concret : elle a rendu immédiatement visible la composition d'un pôle qui, sans cela, n'existait numériquement que dans des tableurs internes. La diversité des affiliations, jusque-là perçue comme une complexité à gérer, est devenue un élément de valeur affiché, montrant la richesse institutionnelle du collectif. La gestion progressive des projets et des espaces documentaires a ensuite accompagné l'organisation du travail collectif sans imposer de cadre rigide dès le départ. La connexion automatique avec HAL a supprimé une tâche de maintenance éditoriale qui aurait été particulièrement lourde dans un pôle de cette taille. La cohésion automatique des droits, enfin, a évité la constitution d'une charge administrative qui, dans des environnements à large périmètre institutionnel, devient rapidement ingérable.
Ces effets ne sont pas indépendants. Ils résultent d'un même choix de conception : placer le modèle de données au centre, le structurer finement, afin d’en faire découler l'ensemble des usages plutôt que de les configurer séparément.
Conditions de réussite et limites assumées
Il serait trompeur de présenter ce déploiement comme une mise en place sans friction. La modélisation initiale : définir les types d'Ensembles pertinents pour Ampiric, configurer les référentiels de rôles adaptés à sa culture, arbitrer sur les niveaux de visibilité à appliquer, constitue un travail de cadrage organisationnel non négligeable, qui ne peut être délégué aux seules équipes techniques. Des arbitrages que seuls les acteurs métier peuvent trancher, et dont l'absence ou l'hésitation alourdit significativement la charge de spécification sinon de développement, au point que l'observation directe des usages constitue le seul support fiable.
L'appropriation par des membres aux profils non techniques constitue un deuxième point de vigilance. Un accompagnement à la prise en main a été assuré, notamment par une réponse rapide et systématique à toutes les sollicitations, mais l'usage effectif reste tributaire d'une implication continue des équipes que la formation initiale ne suffit pas à garantir. Tout porteur de projet similaire devrait anticiper ce risque de décrochage dès la phase de conception.
La dépendance à HAL pour les publications constitue enfin une limite à mentionner clairement. La qualité et l'exhaustivité de l'affichage dépendent directement de celle des dépôts des membres. Or tous les acteurs d'Ampiric n'ont pas nécessairement un compte HAL actif, en particulier les formateurs et les partenaires de terrain. Cette limite est assumée et suppose une gouvernance des données attentive. Elle s'inscrit dans la continuité des orientations de l'université en faveur du dépôt en archive ouverte, dont Luscie devient ainsi un vecteur d'encouragement.
Conclusion
L'expérience confirme ce que le cas d'Ampiric suggérait : la cohérence numérique ne suit pas l'organisation, elle la précède ou l'accompagne, rarement se contente-t-elle de la refléter.
Luscie apporte une réponse spécifique à cette problématique, fondée sur un principe de mise en commun : un modèle de données cohérent, capable de représenter des affiliations multiples et des relations complexes, à partir duquel l'ensemble des usages sont dérivés plutôt que configurés séparément. Sa valeur ne réside pas dans l'étendue fonctionnelle, mais dans cette capacité à produire des effets systémiques — cohérence de l'annuaire, des droits, des publications valorisées, des espaces documentaires structurés — à partir d'informations saisies une seule fois.
Sa modularité permet une adaptation au rythme de chaque structure. Sa nature open source garantit que les unités qui le déploient conservent la maîtrise de leur infrastructure, voire contribue à son évolution. Et sa connexion aux services ouverts de la recherche, HAL en premier lieu, avec une architecture extensible vers d'autres référentiels, l'inscrit dans la dynamique de la science ouverte sans en faire une contrainte supplémentaire pour les membres.
Le portail d'Ampiric, accessible sur ampiric.fr, en donne une illustration concrète : une organisation dont la cohérence numérique a accompagné, depuis son lancement, la construction d'un collectif scientifique encore en devenir.