En savoir plus

Notre utilisation de cookies

« Cookies » désigne un ensemble d’informations déposées dans le terminal de l’utilisateur lorsque celui-ci navigue sur un site web. Il s’agit d’un fichier contenant notamment un identifiant sous forme de numéro, le nom du serveur qui l’a déposé et éventuellement une date d’expiration. Grâce aux cookies, des informations sur votre visite, notamment votre langue de prédilection et d'autres paramètres, sont enregistrées sur le site web. Cela peut faciliter votre visite suivante sur ce site et renforcer l'utilité de ce dernier pour vous.

Afin d’améliorer votre expérience, nous utilisons des cookies pour conserver certaines informations de connexion et fournir une navigation sûre, collecter des statistiques en vue d’optimiser les fonctionnalités du site. Afin de voir précisément tous les cookies que nous utilisons, nous vous invitons à télécharger « Ghostery », une extension gratuite pour navigateurs permettant de les détecter et, dans certains cas, de les bloquer.

Ghostery est disponible gratuitement à cette adresse : https://www.ghostery.com/fr/products/

Vous pouvez également consulter le site de la CNIL afin d’apprendre à paramétrer votre navigateur pour contrôler les dépôts de cookies sur votre terminal.

S’agissant des cookies publicitaires déposés par des tiers, vous pouvez également vous connecter au site http://www.youronlinechoices.com/fr/controler-ses-cookies/, proposé par les professionnels de la publicité digitale regroupés au sein de l’association européenne EDAA (European Digital Advertising Alliance). Vous pourrez ainsi refuser ou accepter les cookies utilisés par les adhérents de l'EDAA.

Il est par ailleurs possible de s’opposer à certains cookies tiers directement auprès des éditeurs :

Catégorie de cookie

Moyens de désactivation

Cookies analytiques et de performance

Realytics
Google Analytics
Spoteffects
Optimizely

Cookies de ciblage ou publicitaires

DoubleClick
Mediarithmics

Les différents types de cookies pouvant être utilisés sur nos sites internet sont les suivants :

Cookies obligatoires

Cookies fonctionnels

Cookies sociaux et publicitaires

Ces cookies sont nécessaires au bon fonctionnement du site, ils ne peuvent pas être désactivés. Ils nous sont utiles pour vous fournir une connexion sécuritaire et assurer la disponibilité a minima de notre site internet.

Ces cookies nous permettent d’analyser l’utilisation du site afin de pouvoir en mesurer et en améliorer la performance. Ils nous permettent par exemple de conserver vos informations de connexion et d’afficher de façon plus cohérente les différents modules de notre site.

Ces cookies sont utilisés par des agences de publicité (par exemple Google) et par des réseaux sociaux (par exemple LinkedIn et Facebook) et autorisent notamment le partage des pages sur les réseaux sociaux, la publication de commentaires, la diffusion (sur notre site ou non) de publicités adaptées à vos centres d’intérêt.

Sur nos CMS EZPublish, il s’agit des cookies sessions CAS et PHP et du cookie New Relic pour le monitoring (IP, délais de réponse).

Ces cookies sont supprimés à la fin de la session (déconnexion ou fermeture du navigateur)

Sur nos CMS EZPublish, il s’agit du cookie XiTi pour la mesure d’audience. La société AT Internet est notre sous-traitant et conserve les informations (IP, date et heure de connexion, durée de connexion, pages consultées) 6 mois.

Sur nos CMS EZPublish, il n’y a pas de cookie de ce type.

Pour obtenir plus d’informations concernant les cookies que nous utilisons, vous pouvez vous adresser au Déléguée Informatique et Libertés de l’INRA par email à cil-dpo@inra.fr ou par courrier à :

INRA
24, chemin de Borde Rouge –Auzeville – CS52627
31326 Castanet Tolosan cedex - France

Dernière mise à jour : Mai 2018

Menu Logo Principal

Réseau IN-OVIVE

Présentation du réseau "Intégration de sources/masses de données hétérogènes et ontologies"

L'objectif de ce réseau est de partager des méthodes et outils pour gérer et analyser des masses de données en sciences du vivant, de l'agronomie et de l'agro-alimentaire.

Co-animateurs:

Patrice Buche (UMR IATE - INRA), Juliette Dibie (UMR MIA 518 - INRA), Pascal Neveu (UMR MISTEA - INRA)

La société actuelle doit faire face à des évolutions rapides et à des enjeux aux multiples facettes (environnementaux, sociétaux, économiques). C'est particulièrement vrai pour le monde des sciences du vivant, de l'agronomie et de l’agro-alimentaire, soumis en plus aux aléas naturels. Afin de répondre à ces enjeux et évolutions, il est nécessaire de posséder une vue globalisée et intégrée du domaine d’application étudié (e.g. les filières agricoles), tout en étant capable de préconiser des actions à des niveaux assez fins (e.g., parcelle, opération unitaire) et en tenant compte des différents points de vue impliqués.

Pour cela, il faut développer des outils génériques adéquats, or la plupart des études menées jusqu’à présent soit ont proposé des approches spécifiques à une partie du domaine d’application étudié (e.g., amélioration génétique d’une filière), soit se sont concentrés sur des enjeux bien déterminés (e.g., problèmes sanitaires). Il en a résulté un éparpillement de la connaissance et une séparation des ensembles de données, ce qui s’est traduit par une grande difficulté à faire cohabiter ces connaissances et restituer ces données dans un système unique. Un des facteurs limitant du traitement informatique des données en sciences du vivant, en agronomie et en agro-alimentaire est la difficulté d’appréhender les données disponibles. Cette difficulté s’explique par les raisons suivantes :

  • le stockage des données expérimentales suffisamment décrites (par des méta-données) et sous une forme informatisée homogène est loin d’être systématique dans l’approche analytique classique,
  • les données sont éparses, stockées dans des bases de données de laboratoire, publiées dans des revues scientifiques ou sur des pages de sites Web, mais aussi dans des rapports de projet, des thèses ou des supports de cours,
  • les données sont représentées dans des formats hétérogènes (textes, tableaux, graphiques, spectres, images,…).
  • les évolutions technologiques rapides, qui permettent une observation de plus en plus fine (nature de l'information, fréquence d’acquisition, géolocalisation), nécessitent de s’adapter et de gérer des volumes de données en forte croissante.

La recherche menée à l’INRA est aujourd’hui de plus en plus collaborative et requiert un usage intensif des données. La gestion automatisée et l’analyse de données scientifiques nécessitent d’intégrer des connaissances du domaine concerné. De plus, cette intégration doit passer par la confrontation des données et des connaissances disponibles qui est cruciale pour valider la qualité de ces données et de ces connaissances.

Cette proposition de réseau de recherche se situe dans la priorité 1 “Gérer et analyser des masses considérables de données hétérogènes” et plus précisément dans le sous-thème Intégration et ontologies.

Avant de pouvoir combiner/explorer/expliquer les sources de données, il faut être capable de les faire «cohabiter ». Cette cohabitation peut être réalisée à l’aide de méthodes informatiques d’intégration qui consistent à essayer d’établir des correspondances entre les données à l’aide d’une ontologie de domaine qui est une représentation, formalisée et structurée, du vocabulaire spécifique au domaine étudié. Cette ontologie peut en particulier être utilisée pour:

  • organiser et décrire des ensembles de données,
  • exploiter les données structurées des documents comme les tableaux ou les graphiques pour en extraire de l’information pertinente pour le domaine étudié,
  • faire de l’analyse textuelle, extraire de documents textes peu structurés de nouvelles données pertinentes pour le domaine étudié et enrichir de manière incrémentale l'ontologie,
  • modéliser la connaissance nécessaire pour, d’une part détecter des redondances dans les sources de données à intégrer et, d’autre part, associer à ces sources des indicateurs de fiabilité,
  • publier les données intégrées grâce à une ontologie de domaine sur le “Web de données” afin de permettre l’interconnexion de jeux de données.

Par ailleurs, la connaissance modélisée dans l’ontologie étant par nature évolutive, il est indispensable de construire des méthodes qui permettent d’en maintenir sa cohérence.

L’objectif est de partager, de collaborer autour de méthodes et outils pour gérer et analyser des masses de données en sciences du vivant, de l'agronomie et de l’agro-alimentaire.