Exploiter les real-world evidence grâce au modèle de données OMOP
Introduction
Le modèle de données OMOP transforme la manière dont l’industrie des sciences de la vie convertit des données réelles hétérogènes et non structurées en preuves fiables et conformes aux exigences réglementaires. Standard le plus largement adopté pour l’harmonisation des données de santé observationnelles, le OMOP Common Data Model permet la mise en place d’analyses décentralisées et reproductibles sur des millions de dossiers patients, sans compromettre la confidentialité ni le contrôle local. Grâce à ce cadre, les sponsors et les chercheurs peuvent exploiter les real-world evidence à une échelle et avec une rigueur que les approches traditionnelles ne peuvent égaler.
Real-World Evidence et OMOP
Transformer les données réelles en preuves fiables
Les real-world evidence (RWE) nous offrent ce que les essais cliniques traditionnels ne peuvent tout simplement pas apporter : une fenêtre sur la manière dont les patients sont traités, dont ils répondent aux traitements et dont leur état de santé évolue en dehors de l’environnement très contrôlé d’un protocole. En collectant des données issues des dossiers médicaux électroniques, des questionnaires patients et des mesures cliniques de routine, nous mettons en lumière des tendances que les essais conventionnels ne sont pas toujours conçus pour capter.
Le défi : une grande richesse, mais des obstacles réels
Les données réelles sont par nature hétérogènes, souvent codées de manière inconsistante et présentent une qualité très variable selon les organisations et les systèmes de santé. Sans cadre commun et fiable, comparer ou combiner ces sources diverses peut conduire à des analyses peu fiables, voire trompeuses.
La solution : un standard commun grâce à OMOP
C’est précisément le défi que l’Observational Medical Outcomes Partnership (OMOP) a été conçu pour relever. En appliquant les modèles standardisés adaptés, nous harmonisons ces informations pour soutenir une biométrie complète et délivrer des analyses sans erreur.
Le résultat
Ensemble, nous pouvons libérer tout le potentiel des données réelles, en garantissant la conformité réglementaire et en améliorant le taux de réussite des essais.
Les avantages d’OMOP
Pourquoi le modèle de données OMOP change la donne pour les real-world evidence
La communauté Observational Health Data Sciences and Informatics (OHDSI) a développé le OMOP Common Data Model pour mettre de l’ordre dans des jeux de données complexes : une structure standardisée de terminologies, vocabulaires et schémas de codage communs qui harmonise les données issues de sources extrêmement diverses.
Ces initiatives ont choisi OMOP parce qu’il permet des analyses décentralisées et hautement reproductibles à travers de larges réseaux de centres de santé. Chaque partenaire conserve en toute sécurité le contrôle local de ses propres données tout en contribuant activement à des études fédérées d’envergure internationale.
Le résultat : un cadre capable de soutenir des analyses statistiques avancées portant sur des centaines de millions de patients, sans jamais avoir à centraliser des données de santé sensibles.
Pour les sponsors et les chercheurs qui génèrent des real-world evidence, cela ouvre l’accès à des données d’une ampleur et d’une étendue géographique jusqu’alors inaccessibles. Cependant, la complexité technique sous-jacente nécessite toujours une expertise pointue.
Common Data Model
Confidentialité des données
Terminologies standardisées
Mapping des vocabulaires
Exemple de mapping
Le fondement du OMOP CDM repose sur ses vocabulaires standardisés. Les données sources, qu’il s’agisse de diagnostics cliniques, d’expositions médicamenteuses ou de mesures de routine, sont mappées vers des concepts standards en utilisant des terminologies reconnues à l’international comme SNOMED pour les pathologies et RxNorm pour les médicaments. Cette étape critique permet d’aligner le langage clinique entre institutions et pays.
Mais en pratique
Un même terme source peut correspondre à plusieurs concepts standards, selon le contexte clinique.
Certains concepts n’ont pas d’équivalent direct, ce qui oblige les équipes expertes à généraliser ou à approximer.
Les concepts sources sont conservés en parallèle des concepts standards pour garantir transparence et traçabilité.
Les enjeux
Mener à bien cette opération exige une expertise pointue des systèmes de codage clinique, de la gouvernance des données et de la hiérarchie du vocabulaire OMOP. Des mappings incomplets ou inconstants créent une dette technique, qui peut sérieusement compromettre la crédibilité de toute preuve construite à partir de ces données.
Architecture et confidentialité
Protection des données et analyses évolutives
Un principe fondateur
L’architecture décentralisée du modèle de données OMOP représente bien plus qu’un simple choix technique avisé. Elle constitue un principe fondateur de protection des données. Chaque centre de santé participant conserve les données patients identifiables en toute sécurité sur ses serveurs locaux ; seuls des résultats agrégés et standardisés sont partagés, et les identifiants personnels tels que les noms et les dates de naissance précises sont strictement limités par conception. Les organisations peuvent ainsi contribuer à la génération de preuves à grande échelle tout en respectant pleinement les exigences réglementaires internationales en matière de confidentialité des patients.
Conçu pour la flexibilité analytique
La structure de tables standardisée couvre un large spectre de données de santé observationnelles, notamment les consultations, les expositions médicamenteuses et les mesures cliniques, ainsi que les informations sur le système de santé et l’économie de la santé. Elle est optimisée pour la flexibilité analytique et l’efficacité computationnelle.
De ce fait, nous pouvons appliquer exactement les mêmes requêtes analytiques sur différentes bases de données OMOP CDM avec un minimum d’adaptation, ce qui rend ce cadre véritablement évolutif. Des jeux de données contenant des millions de patients et des milliards d’observations peuvent être interrogés de manière cohérente et reproductible à partir d’une seule requête sur de nombreuses bases. Sa mise en œuvre concrète exige une architecture de données soigneusement conçue, des pipelines qualité robustes et des workflows analytiques bien pensés.
Notre engagement partenarial
Maîtriser le modèle de données OMOP, ensemble et avec succès
Aujourd’hui, OMOP s’impose comme le standard le plus robuste et le plus largement adopté pour l’harmonisation des données réelles. Sa capacité éprouvée à soutenir des analyses décentralisées, reproductibles et évolutives en fait une exigence incontournable pour les organisations qui souhaitent générer des preuves conformes aux exigences réglementaires, capables de résister à un examen scientifique et réglementaire approfondi.
La bonne approche
Les organisations qui tirent le plus de valeur du modèle de données OMOP abordent sa mise en œuvre comme un défi conjoint, à la fois clinique et statistique, plutôt que comme un simple exercice de conversion de données IT. Un mapping précis du vocabulaire requiert un jugement clinique pointu, tandis que la conception des analyses exige un contrôle qualité rigoureux.
Ce qu’apporte Excelya
Implémentation et mapping
Nous accompagnons les organisations à chaque étape de l’implémentation OMOP, du mapping complexe des vocabulaires au contrôle qualité strict des données.
Conception statistique sur mesure
Nous accompagnons les chercheurs dans le développement d’analyses robustes et cliniquement pertinentes, avec des solutions sur mesure comme les designs bayésiens et adaptatifs.
Notre objectif commun n’est pas seulement de construire une base de données standardisée. Nous sommes animés par la volonté de générer des preuves fiables et exploitables, qui soutiennent des décisions plus éclairées et qui changent la vie des patients. C’est la mission que notre équipe Statistiques et Programmation d’Excelya incarne au quotidien. Vos défis deviennent les nôtres, et nous trouverons ensemble la solution idéale.
À propos de l’auteur
Andrés Malatesta
Biostatisticien chez Excelya
Biostatisticien et programmeur fort de plus de cinq ans d’expérience, ayant contribué à plus d’une dizaine d’essais cliniques et d’études de real-world evidence en oncologie, endocrinologie et psychothérapie. Auteur de cinq publications évaluées par les pairs, dont deux articles de recherche complets et trois résumés de conférences.

Questions fréquentes
Qu'est-ce que le modèle de données OMOP et pourquoi est-il important pour les real-world evidence ?
Le modèle de données OMOP est un cadre standardisé qui permet d’organiser les données de santé issues de sources variées au sein d’une structure commune. Il est essentiel pour les real-world evidence, car il rend les données plus cohérentes, comparables et adaptées à des analyses à grande échelle, à travers les institutions et les pays.
Comment le modèle de données OMOP harmonise-t-il les données réelles ?
Le OMOP Common Data Model harmonise les données réelles en appliquant des tables, des vocabulaires et des systèmes de codage standardisés aux informations issues des dossiers médicaux électroniques, des questionnaires et des mesures cliniques. Les chercheurs peuvent ainsi analyser des données provenant de sources multiples en s’appuyant sur la même structure et la même logique.
Pourquoi le mapping des vocabulaires est-il essentiel dans le modèle de données OMOP ?
Le mapping des vocabulaires est essentiel dans le modèle de données OMOP, car les termes cliniques locaux doivent être traduits en concepts standardisés tels que SNOMED ou RxNorm. Un mapping précis améliore la qualité des données, favorise la transparence et garantit que les analyses sont suffisamment fiables pour un usage scientifique et réglementaire.
Comment le modèle OMOP soutient-il les real-world evidence conformes aux exigences réglementaires ?
Le modèle de données OMOP soutient la production de real-world evidence conformes aux exigences réglementaires en standardisant des données hétérogènes, en améliorant la reproductibilité et en permettant des analyses cohérentes à travers des bases de données décentralisées. Les organisations peuvent ainsi générer des preuves capables de résister à un examen scientifique et à un contrôle réglementaire approfondi.
Quels sont les avantages du modèle OMOP pour des analyses évolutives ?
L’utilisation du modèle de données OMOP permet de réaliser des analyses évolutives en appliquant les mêmes requêtes et méthodes à de multiples jeux de données massifs, avec un minimum d’adaptation. Cette approche soutient une analyse efficace portant sur des millions de patients, tout en préservant la cohérence, la confidentialité et la qualité des données.