Le projet ADR-Prism a pour objectif de mettre à disposition des équipes de pharmacovigilance une source de connaissances encore inexploitée en dehors de rares expérimentations par des équipes de recherche : les messages des patients dans les forums. L’intégration de ces données permettra de générer de nouvelles hypothèses concernant les effets indésirables décrits par les patients qui seraient nouveaux ou mal documentés dans l’information officielle sur les médicaments.
Etant donné le volume d’informations émises par des patients et collectées par millions quotidiennement depuis les différentes formes d’échange sur le web, ce cas d’usage est exemplaire pour une application Big data.
Les méthodes mises en œuvre dans ADR-PRISM appartiennent à l’ingénierie des connaissances et à la fouille de texte. Les informations sont extraites à partir de données textuelles (forum des patients) au moyen de méthodes de traitement automatique du langage (TAL). Les données textuelles sont annotées et intégrées aux données structurées, comme par exemple la date, la source de donnée ou l’adresse, en considérant leur sémantique, pour en préserver le sens et permettre une meilleure intégration entre le langage médical et le langage des patients. D’un point de vue technique, les résultats de l’intégration seront consultables dans un environnement Web.