Modèle de données OMOP pour les real-world evidence

Auteur : Andrés Malatesta

, Biostatisticien
Publié le : 08/04/2026

Temps de lecture estimé : 8 min

Département Statistiques et Programmation

Introduction

Le modèle de données OMOP transforme la manière dont l’industrie des sciences de la vie convertit des données réelles hétérogènes et non structurées en preuves fiables et conformes aux exigences réglementaires. Standard le plus largement adopté pour l’harmonisation des données de santé observationnelles, le OMOP Common Data Model permet la mise en place d’analyses décentralisées et reproductibles sur des millions de dossiers patients, sans compromettre la confidentialité ni le contrôle local. Grâce à ce cadre, les sponsors et les chercheurs peuvent exploiter les real-world evidence à une échelle et avec une rigueur que les approches traditionnelles ne peuvent égaler.

Aller à la section

1Real-World Evidence et OMOP

2Les avantages d’OMOP

3Terminologies standardisées

4Architecture et confidentialité

5Notre engagement partenarial

5FAQ

Real-World Evidence et OMOP

Transformer les données réelles en preuves fiables

Les real-world evidence (RWE) nous offrent ce que les essais cliniques traditionnels ne peuvent tout simplement pas apporter : une fenêtre sur la manière dont les patients sont traités, dont ils répondent aux traitements et dont leur état de santé évolue en dehors de l’environnement très contrôlé d’un protocole. En collectant des données issues des dossiers médicaux électroniques, des questionnaires patients et des mesures cliniques de routine, nous mettons en lumière des tendances que les essais conventionnels ne sont pas toujours conçus pour capter.

Le défi : une grande richesse, mais des obstacles réels

Les données réelles sont par nature hétérogènes, souvent codées de manière inconsistante et présentent une qualité très variable selon les organisations et les systèmes de santé. Sans cadre commun et fiable, comparer ou combiner ces sources diverses peut conduire à des analyses peu fiables, voire trompeuses.

La solution : un standard commun grâce à OMOP

C’est précisément le défi que l’Observational Medical Outcomes Partnership (OMOP) a été conçu pour relever. En appliquant les modèles standardisés adaptés, nous harmonisons ces informations pour soutenir une biométrie complète et délivrer des analyses sans erreur.

Le résultat

Ensemble, nous pouvons libérer tout le potentiel des données réelles, en garantissant la conformité réglementaire et en améliorant le taux de réussite des essais.

Les avantages d’OMOP

Pourquoi le modèle de données OMOP change la donne pour les real-world evidence

La communauté Observational Health Data Sciences and Informatics (OHDSI) a développé le OMOP Common Data Model pour mettre de l’ordre dans des jeux de données complexes : une structure standardisée de terminologies, vocabulaires et schémas de codage communs qui harmonise les données issues de sources extrêmement diverses.

Adopté par

DARWIN EU

Adopté par

SNDS français

Échelle patients

Centaines de millions

Ces initiatives ont choisi OMOP parce qu’il permet des analyses décentralisées et hautement reproductibles à travers de larges réseaux de centres de santé. Chaque partenaire conserve en toute sécurité le contrôle local de ses propres données tout en contribuant activement à des études fédérées d’envergure internationale.

Le résultat : un cadre capable de soutenir des analyses statistiques avancées portant sur des centaines de millions de patients, sans jamais avoir à centraliser des données de santé sensibles.

Pour les sponsors et les chercheurs qui génèrent des real-world evidence, cela ouvre l’accès à des données d’une ampleur et d’une étendue géographique jusqu’alors inaccessibles. Cependant, la complexité technique sous-jacente nécessite toujours une expertise pointue.

Analyses fédérées
Common Data Model
Confidentialité des données

Terminologies standardisées

Mapping des vocabulaires

Exemple de mapping

Terme source

« amebiasis »

→

Concept SNOMED

« amebic infection »

Le fondement du OMOP CDM repose sur ses vocabulaires standardisés. Les données sources, qu’il s’agisse de diagnostics cliniques, d’expositions médicamenteuses ou de mesures de routine, sont mappées vers des concepts standards en utilisant des terminologies reconnues à l’international comme SNOMED pour les pathologies et RxNorm pour les médicaments. Cette étape critique permet d’aligner le langage clinique entre institutions et pays.

Mais en pratique

1→N

Un même terme source peut correspondre à plusieurs concepts standards, selon le contexte clinique.

≈

Certains concepts n’ont pas d’équivalent direct, ce qui oblige les équipes expertes à généraliser ou à approximer.

⇌

Les concepts sources sont conservés en parallèle des concepts standards pour garantir transparence et traçabilité.

Les enjeux

Mener à bien cette opération exige une expertise pointue des systèmes de codage clinique, de la gouvernance des données et de la hiérarchie du vocabulaire OMOP. Des mappings incomplets ou inconstants créent une dette technique, qui peut sérieusement compromettre la crédibilité de toute preuve construite à partir de ces données.

Architecture et confidentialité

Protection des données et analyses évolutives

✓

Un principe fondateur

L’architecture décentralisée du modèle de données OMOP représente bien plus qu’un simple choix technique avisé. Elle constitue un principe fondateur de protection des données. Chaque centre de santé participant conserve les données patients identifiables en toute sécurité sur ses serveurs locaux ; seuls des résultats agrégés et standardisés sont partagés, et les identifiants personnels tels que les noms et les dates de naissance précises sont strictement limités par conception. Les organisations peuvent ainsi contribuer à la génération de preuves à grande échelle tout en respectant pleinement les exigences réglementaires internationales en matière de confidentialité des patients.

Conçu pour la flexibilité analytique

La structure de tables standardisée couvre un large spectre de données de santé observationnelles, notamment les consultations, les expositions médicamenteuses et les mesures cliniques, ainsi que les informations sur le système de santé et l’économie de la santé. Elle est optimisée pour la flexibilité analytique et l’efficacité computationnelle.

De ce fait, nous pouvons appliquer exactement les mêmes requêtes analytiques sur différentes bases de données OMOP CDM avec un minimum d’adaptation, ce qui rend ce cadre véritablement évolutif. Des jeux de données contenant des millions de patients et des milliards d’observations peuvent être interrogés de manière cohérente et reproductible à partir d’une seule requête sur de nombreuses bases. Sa mise en œuvre concrète exige une architecture de données soigneusement conçue, des pipelines qualité robustes et des workflows analytiques bien pensés.

Notre engagement partenarial

Maîtriser le modèle de données OMOP, ensemble et avec succès

Aujourd’hui, OMOP s’impose comme le standard le plus robuste et le plus largement adopté pour l’harmonisation des données réelles. Sa capacité éprouvée à soutenir des analyses décentralisées, reproductibles et évolutives en fait une exigence incontournable pour les organisations qui souhaitent générer des preuves conformes aux exigences réglementaires, capables de résister à un examen scientifique et réglementaire approfondi.

La bonne approche

Les organisations qui tirent le plus de valeur du modèle de données OMOP abordent sa mise en œuvre comme un défi conjoint, à la fois clinique et statistique, plutôt que comme un simple exercice de conversion de données IT. Un mapping précis du vocabulaire requiert un jugement clinique pointu, tandis que la conception des analyses exige un contrôle qualité rigoureux.

Ce qu’apporte Excelya

Implémentation et mapping

Nous accompagnons les organisations à chaque étape de l’implémentation OMOP, du mapping complexe des vocabulaires au contrôle qualité strict des données.

Conception statistique sur mesure

Nous accompagnons les chercheurs dans le développement d’analyses robustes et cliniquement pertinentes, avec des solutions sur mesure comme les designs bayésiens et adaptatifs.

Notre objectif commun n’est pas seulement de construire une base de données standardisée. Nous sommes animés par la volonté de générer des preuves fiables et exploitables, qui soutiennent des décisions plus éclairées et qui changent la vie des patients. C’est la mission que notre équipe Statistiques et Programmation d’Excelya incarne au quotidien. Vos défis deviennent les nôtres, et nous trouverons ensemble la solution idéale.

À propos de l’auteur

Andrés Malatesta

Biostatisticien chez Excelya

Biostatisticien et programmeur fort de plus de cinq ans d’expérience, ayant contribué à plus d’une dizaine d’essais cliniques et d’études de real-world evidence en oncologie, endocrinologie et psychothérapie. Auteur de cinq publications évaluées par les pairs, dont deux articles de recherche complets et trois résumés de conférences.

Questions fréquentes

Qu'est-ce que le modèle de données OMOP et pourquoi est-il important pour les real-world evidence ?

Le modèle de données OMOP est un cadre standardisé qui permet d’organiser les données de santé issues de sources variées au sein d’une structure commune. Il est essentiel pour les real-world evidence, car il rend les données plus cohérentes, comparables et adaptées à des analyses à grande échelle, à travers les institutions et les pays.

Comment le modèle de données OMOP harmonise-t-il les données réelles ?

Le OMOP Common Data Model harmonise les données réelles en appliquant des tables, des vocabulaires et des systèmes de codage standardisés aux informations issues des dossiers médicaux électroniques, des questionnaires et des mesures cliniques. Les chercheurs peuvent ainsi analyser des données provenant de sources multiples en s’appuyant sur la même structure et la même logique.

Pourquoi le mapping des vocabulaires est-il essentiel dans le modèle de données OMOP ?

Le mapping des vocabulaires est essentiel dans le modèle de données OMOP, car les termes cliniques locaux doivent être traduits en concepts standardisés tels que SNOMED ou RxNorm. Un mapping précis améliore la qualité des données, favorise la transparence et garantit que les analyses sont suffisamment fiables pour un usage scientifique et réglementaire.

Comment le modèle OMOP soutient-il les real-world evidence conformes aux exigences réglementaires ?

Le modèle de données OMOP soutient la production de real-world evidence conformes aux exigences réglementaires en standardisant des données hétérogènes, en améliorant la reproductibilité et en permettant des analyses cohérentes à travers des bases de données décentralisées. Les organisations peuvent ainsi générer des preuves capables de résister à un examen scientifique et à un contrôle réglementaire approfondi.

Quels sont les avantages du modèle OMOP pour des analyses évolutives ?

L’utilisation du modèle de données OMOP permet de réaliser des analyses évolutives en appliquant les mêmes requêtes et méthodes à de multiples jeux de données massifs, avec un minimum d’adaptation. Cette approche soutient une analyse efficace portant sur des millions de patients, tout en préservant la cohérence, la confidentialité et la qualité des données.