Welcome to KEWI
K E W I = Knowledge Engineering and Web Intelligence
KEWI
Autour d'un thème central, l'ingénierie des connaissances, l'équipe KEWI s'intéresse aux processus, à la fois techniques et humains, de partage, d'intégration et d'extraction de connaissances. En terme de connaissances, nous nous intéressons, d'une part à celles pouvant être définies a priori sous forme d'ontologies et d'annotations sémantiques de ressources éventuellement disponibles sur le web, et d'autre part à celles formalisées a posteriori grâce aux techniques d'extraction des connaissances.
Nos activités s'articulent selon trois axes :
- Sur la représentation des connaissances pour le web sémantique, notre contribution porte plus précisément sur la généricité de représentation des connaissances ainsi que sur les mécanismes de raisonnement associé comme nous allons le détailler par la suite.
- Afin de prendre en considération la dimension humaine des processus de partage des connaissances, nous nous intéressons également aux capacités sociales des utilisateurs dans un troisième axe de recherche de notre équipe. Dans cet axe, notre travail porte sur les annotations sémantiques des personnes et des usages et vise à contribuer à proposer une infrastructure et une modélisation de la dimension sociale du web.
Applications
Les applications des travaux de recherche de l'équipe s'adressent aux trois domaines privilégiés suivants :
- Mémoire organisationnelle intégrée dans les systèmes communicants : la construction et la gestion de mémoires organisationnelles et l'organisation d'accès à ces mémoires. Les domaines d'application privilégiés sont les mémoires d'entreprise et les mécanismes de contrôle de qualité ou de conformité réagissant à l'intérieur du processus de production et composant à la fois les connaissances du domaine et les connaissances d'expert. Nous nous intéressons particulièrement à l'organisation de l'accès à ces mémoires dans un l'environnement fortement distribué et personnalisé. Nous pouvons cité à titre d'exemple la collaboration avec le CSTB (2002-2008, deux bourses doctorales EGIDE, une bourse de poste-doc) dans le domaine d'interopérabilité en commerce électronique, de contrôle de conformité des projets de construction vis-à-vis des normes de régulation, la collaboration avec la société FACTORY (2004-2007 - convention CIFRE) sur l'ontologie et le moteur de recherche du domaine touristique et la collaboration avec des grands partenaires industriels (centre RetD de Nokia, NXP, ST, Amadeus, GDF, CHU de Nice) pour l'étude des services sans fil du futur pour l'exploitation des mémoires organisationnelles sur une plateforme expérimentale du MBDS (500 Keuros par an depuis 2002).
- Applications éducatives et scientifiques sur le web : les outils collaboratifs, communicants, ludiques et intuitifs pour l'éducation et pour la publication scientifique sur le web. Notre objectif est de collecter et de partager différents types de connaissances liées aux domaines éducatif et scientifique, et cela de façon pragmatique, évolutive, et personnalisée en imaginant les services du futur. Dans cette direction, plusieurs projets de recherche et développement ont été mis en place tels que les projets européens TRIAL-SOLUTION (2000-2003, 200 Keuros), le projet e-learning Jalon en collaboration avec la faculté de Médicine (2002-2004), les projets AUF PCSI REFERENCES (06-07 20 Keuros + 20 Keuros en cours d'examen pour 2008-2009) et MATHIS (20 Keuros en cours d'examen pour 2008-2009), et le projet OIF INFOROUTES CEDIA (400Keuros 2008-2009 en cours d'examen).
- Analyse de données complexes pour la biologie : Le domaine de la biologie donne, avec l'analyse de données génomiques et protéomiques, un champ d'applications typique de nos travaux en Data Mining sur l'intérêt des modèles extraits. La technologie des puces à ADN est déjà largement exploitée pour répondre à une grande variété de questions dans la recherche en biologie. Elle permet en particulier, de mesurer et de visualiser très rapidement les niveaux d'expression d'un ensemble de gènes et ce à l'échelle d'un génome complet d'un organisme. Aujourd'hui, les programmes de génomique génèrent des masses de données répertoriées dans des bases de données internationales accessibles en ligne. Ces données se présentent soit sous forme d'informations brutes sur les séquences ou sur des résultats d'expérience, soit sous forme d'informations bibliographiques et d'annotations représentant les connaissances acquises sur les gènes ou les protéines et leurs interactions. Un enjeu majeur des recherches actuelles est ainsi de croiser les informations issues de ces sources hétérogènes de connaissances pour améliorer l'interprétation et renforcer la validité des résultats. Un certain nombre d'approches a déjà été proposé pour confronter les résultats de l'analyse de données d'expression avec des informations issues des bases d'annotations de gènes. Dans le cadre de nos collaboration avec l'Institute of Signaling Developmental Biology and Cancer (UNSA / CNRS UMR-6543) et l'IPMC (Institut de Pharmacologie Moléculaire et Cellulaire), nous avons proposé des solutions pour interpréter les groupes de gènes co-exprimés en utilisant les annotations issues d'ontologies du domaine. Le succès de ces premiers résultats et notre participation au projet IMMUNOSEARCH nous permettent d'envisager l'évolution de nos travaux dans ce domaine trés prometteur.