Résumé de "Revue des nouvelles technonologies de l'information ; fouilles de donnees complexes"
Par exemple, dans le cas des dossiers médicaux, chaque objet correspond à un patient décrit par un ensemble d'entités de données.
Nature différente : les données relatives à un objet sont de nature différente. Outre le cas classique de descripteurs numériques ou catégoriels, on a notamment le cas de données texte, image ou audio vidéo.
... Lire la suite
Diversité des sources : comme le montre bien l'exemple des dossiers médicaux, les données recueillies correspondent aussi bien à des questionnaires remplis par le médecin, à des mesures acquises par des appareils a des comptes rendus textuels, ` médicaux couplés à des ordinateurs, à des images radiologiques ou échographiques, etc.
Evolutives et distribuées : il arrive souvent que l'on dispose de plusieurs caractérisations du même objet à des époques et/ou en des localisations différentes. Un patient est généralement suivi périodiquement par plusieurs médecins dont chacun produit une information spécifique. Ces informations s'intègrent autour d'un même sujet.
Liées à des connaissances externes : la fouille intelligente des données s'appuie sur la prise en compte des connaissances externes, dites du domaine, celle-ci pouvant se faire par le biais d'une ontologie. Dans le domaine de la cancérologie par exemple, les connaissances diagnostiques et thérapeutiques sont organisées sous forme d'arbres de décision et mis à disposition des praticiens sous la forme d'une guide des bonnes pratiques.
Dimensionnalité des données : par le fait même que l'on associe différentes sources à différents moments, on multiplie les points de vue, d'o` de données, ù une multitude de descripteurs potentiels. Différents problèmes d'analyse apparaissent alors, notamment, la forte dimensionnalité qui engendre à son tour des difficultés algorithmiques et méthodologiques.
C'est dans la combinaison des spécificités des données dont on dispose sur les objets et des connaissances externes associées à la fois l'enjeu et à ces objets, que résident tout `la difficulté de la fouille des données complexes.
Réfiéchir à la fouille de données autrement
La création, en juin 2003, du Groupe de travail Fouille de Données complexes au sein de l'Association Extraction et Gestion des Connaissance avait pour but de fédérer des chercheurs en fouille de données confrontés aux limites des approches et des outils classiques. Ce projet qui catalyse les échanges entre les différents chercheurs a pour objectif :
1. d'identifier et de définir ce qu'est la fouille de données complexes ;
2. de recenser les verrous à la fois méthodologiques et technologiques ;
3. de proposer des approches et des outils informatiques ;
4. d'expérimenter ces résultats dans des domaines comme la santé
La fouille du dossier patient et le web. Les articles publiés dans ce numéro de Revue des Nouvelles Technologies de l'Information constituent un premier bilan à cette réfiexion. Certes, individuellement, les articles n'abordent pas tous la fouille dans les bases de données complexes. Certains sont plus orientés vers la fouille des images alors que d'autres le sont plus vers la fouille de texte ou les tableaux. Nous espérons que la réunion de ces contributions va permettre un croisement entre des chercheurs couvrant des domaines différents de la fouille de données complexes.
Sommaire
SAFE-NEXT : Une approche systémique pour l'intégration des connaissances du domaine dans la fouille de données complexes
Walid Ben Ahmed, Mounib Mekhilef, Michel Bigand, Yves Page
Extraction de connaissances provenant de données multisources pour la caractérisation d'arythmies cardiaques
Elisa Fromont, René Quiniou, Marie-Odile Cordier
Auto-administration des entrepôts de données complexes
Kamel Aouiche, Jérome Darmont, Omar Boussaïd, Fadila Bentayeb
Algorithme génétique de pondération d'attributs pour une classi?cation non supervisée d'objets complexes
Alexandre Blansché, Pierre Gançarski
Fouille interactive de séquences d'images 3D d'IRMf
Jerzy Korczak, Christian Scheiber,Jean Hommet, Nicolas Lachiche
Visualisation et classi?cation avec les cartes topologiques catégorielles
Mustapha Lebbah, Fouad Badran, Sylvie Thiria
Indexation et recherche par le contenu dans une base d'images ?xes : l'intérêt des règles d'associations
Anicet Kouomou Choupo, Laure Berti-Equille, Annie Morin
Apport de la prise en compte du contexte structurel dans les modèles bayésiens de classi?cation de documents semi-structurés
Pierre-François Marteau, Gildas Ménier, Leopold Ekamby
Adéquation des modèles de représentation aux méthodes de catégorisation
Simon Jaillet, Maguelonne Teisseire, Gérard Dray
Deux méthodologies de classi?cation de règles d'association pour la fouille de textes
Hacène Cher?, Amedeo Napoli, Yannick Toussaint
Extraction automatique d'information inattendue à partir de textes
François Jacquenet, Christine Largeron
Analyse récursive constructive pour la recherche du sens du texte de spécialité
Marta Franova, Yves Kodratoff, Lise Fontaine
Annotation temporelle des événements dans des dépêches épidémiologiques
Yann Guilbaud, Jean Royauté