En savoir plus

Notre utilisation de cookies

« Cookies » désigne un ensemble d’informations déposées dans le terminal de l’utilisateur lorsque celui-ci navigue sur un site web. Il s’agit d’un fichier contenant notamment un identifiant sous forme de numéro, le nom du serveur qui l’a déposé et éventuellement une date d’expiration. Grâce aux cookies, des informations sur votre visite, notamment votre langue de prédilection et d'autres paramètres, sont enregistrées sur le site web. Cela peut faciliter votre visite suivante sur ce site et renforcer l'utilité de ce dernier pour vous.

Afin d’améliorer votre expérience, nous utilisons des cookies pour conserver certaines informations de connexion et fournir une navigation sûre, collecter des statistiques en vue d’optimiser les fonctionnalités du site. Afin de voir précisément tous les cookies que nous utilisons, nous vous invitons à télécharger « Ghostery », une extension gratuite pour navigateurs permettant de les détecter et, dans certains cas, de les bloquer.

Ghostery est disponible gratuitement à cette adresse : https://www.ghostery.com/fr/products/

Vous pouvez également consulter le site de la CNIL afin d’apprendre à paramétrer votre navigateur pour contrôler les dépôts de cookies sur votre terminal.

S’agissant des cookies publicitaires déposés par des tiers, vous pouvez également vous connecter au site http://www.youronlinechoices.com/fr/controler-ses-cookies/, proposé par les professionnels de la publicité digitale regroupés au sein de l’association européenne EDAA (European Digital Advertising Alliance). Vous pourrez ainsi refuser ou accepter les cookies utilisés par les adhérents de l'EDAA.

Il est par ailleurs possible de s’opposer à certains cookies tiers directement auprès des éditeurs :

Catégorie de cookie

Moyens de désactivation

Cookies analytiques et de performance

Realytics
Google Analytics
Spoteffects
Optimizely

Cookies de ciblage ou publicitaires

DoubleClick
Mediarithmics

Les différents types de cookies pouvant être utilisés sur nos sites internet sont les suivants :

Cookies obligatoires

Cookies fonctionnels

Cookies sociaux et publicitaires

Ces cookies sont nécessaires au bon fonctionnement du site, ils ne peuvent pas être désactivés. Ils nous sont utiles pour vous fournir une connexion sécuritaire et assurer la disponibilité a minima de notre site internet.

Ces cookies nous permettent d’analyser l’utilisation du site afin de pouvoir en mesurer et en améliorer la performance. Ils nous permettent par exemple de conserver vos informations de connexion et d’afficher de façon plus cohérente les différents modules de notre site.

Ces cookies sont utilisés par des agences de publicité (par exemple Google) et par des réseaux sociaux (par exemple LinkedIn et Facebook) et autorisent notamment le partage des pages sur les réseaux sociaux, la publication de commentaires, la diffusion (sur notre site ou non) de publicités adaptées à vos centres d’intérêt.

Sur nos CMS EZPublish, il s’agit des cookies sessions CAS et PHP et du cookie New Relic pour le monitoring (IP, délais de réponse).

Ces cookies sont supprimés à la fin de la session (déconnexion ou fermeture du navigateur)

Sur nos CMS EZPublish, il s’agit du cookie XiTi pour la mesure d’audience. La société AT Internet est notre sous-traitant et conserve les informations (IP, date et heure de connexion, durée de connexion, pages consultées) 6 mois.

Sur nos CMS EZPublish, il n’y a pas de cookie de ce type.

Pour obtenir plus d’informations concernant les cookies que nous utilisons, vous pouvez vous adresser au Déléguée Informatique et Libertés de l’INRA par email à cil-dpo@inra.fr ou par courrier à :

INRA
24, chemin de Borde Rouge –Auzeville – CS52627
31326 Castanet Tolosan cedex - France

Dernière mise à jour : Mai 2018

Menu Logo Principal AgroParisTech Université Paris Saclay

MIA Paris

Soutenance de thèse de Martina Sundqvist

vendredi 18 décembre à 9h30 - En visioconférence

Stability and selection of the number of groups in unsupervised clustering : application to the classification of triple negative breast cancers

La présentation se fera en anglais mais la section question sera probablement en français.

Lien de connexion : https://zoom.us/j/92399809144?pwd=SEowYjhpNGV3Y0ZiYXZxcDNBMEUyUT09
ID de réunion : 923 9980 9144
Code secret : 549418

Titre :  Stability and selection of the number of groups in unsupervised clustering : application to the classification of triple negative breast cancers

Mots-clefs : Cancer du sein triple négatif, Classification non supervisée, Omique, Stabilité des clusters, Rand Index

Résumé : Le cancer du sein triple négatif (TNBC), est une forme agressive de cancer pour laquelle il n’existe pas de traitement ciblé. La difficulté à trouver un tel type de traitement est liée à l’hétérogénéité des tumeurs TNBC.  Ainsi, identifier des sous-types de TNBC est devenu une priorité en oncologie. Dans cette thèse, je traite, d'un point de vue statistique, le sujet de la classification des tumeurs du TNBC. Je me concentre principalement sur l'utilisation de la stabilité des clusters pour sélectionner le nombre de groupes dans le clustering, la méthode généralement utilisée pour la classification des TNBC. L'objectif de cette méthode est d'obtenir une classification robuste, c'est-à-dire facilement reproductible sur des données similaires.
   Malgré sa popularité, on sait encore peu de choses sur la façon dont cette méthode fonctionne. Pour cette raison, je propose deux contributions méthodologiques importantes : (1) un package R, clustRstab, qui permet d'estimer, de manière flexible, la stabilité d'un clustering. Ce package est accompagné d'une étude de simulation et d'une étude d'application qui examine sous quelles conditions cette méthode fonctionne. (2) Une version modifiée de la version Ajusté du Rand Index (ARI), un score populaire pour les comparaisons de clusters. J’améliore ce score en le basant sur une hypothèse de distribution multinomiale qui permet de prendre en compte la dépendance entre les clusters et de faire des inférences statistiques. Ce ARI modifié (MARI) est implémenté dans le package R aricode.
   Ces deux méthodes sont ensuite appliquées à une large cohorte de tumeurs TNBC et les résultats sont discutés en relation avec des résultats des classifications du TNBC de la littérature.

                                                                                 -----------------------

Title:  Stability and selection of the number of groups in unsupervised clustering: application to the classification of triple negative breast cancers

Keywords: Triple Negative Breast Cancer, Unsupervised classification, Omics, Cluster stability, Rand Index

Abstract: Triple negative breast cancer (TNBC) is an aggressive form of cancer for which there is no targeted treatment. The difficulty in finding such a treatment is related to the heterogeneity of TNBC tumors.  Thus, identifying subtypes of TNBC has become a priority in oncology. In this thesis, I treat the topic of classifying TNBC tumors from a statistical point of view.

I focus mainly on the use of cluster stability to select the number of clusters in clustering, the method generally used for TNBC classification. The objective of this method is to obtain a robust classification, i.e. easily reproducible on similar data.

         Despite its popularity, little is still known about how this method works. For this reason, I propose two important methodological contributions: (1) an R package, clustRstab, which allows to estimate, in a flexible manner, the stability of a clustering. This package is accompanied by a simulation study and an application study that examine under what conditions this method works.  (2) A modified version of the Adjusted Rand Index (ARI), a popular score for cluster comparisons. I improve this score by basing it on a multinomial distribution hypothesis that allows to take into account the dependency between clusters and to make statistical inferences. This modified ARI (MARI) is implemented in the R aricode package.

         These two methods are then applied to a large cohort of TNBC tumors and the results are discussed in relation to results from TNBC classifications in the literature.

 

Composition du jury :

  • Christophe Ambroise - Président - Professeur - Université d'Évry Val d'Essonne, Université Paris-Saclay
  • Chloé-Agathe Azencott -Examinatrice - Maîtresse-Assistante, MINES ParisTech  
  • Avner Bar-Hen, & Rapporteur -Professeur - Conservatoire national des arts et métiers
  • Anne-Laure Boulesteix - Rapportrice - Professeur - Ludwig Maximilian University of Munich
  • Max Chaffanet - Examinateur - Responsable d'équipe en Oncogénomique Moléculaire,  Institut Paoli calmettes
  • Julien Chiquet - Directeur - Directeur de recherche - INRAE, Université Paris Saclay
  • Thierry Dubois - Coencadrant invité - Responsable du groupe « Biologie du Cancer du Sein », Institut Curie
  • Guillem Rigaill -  Coencadrant - Charge de recherche, INRAE, Université Paris Saclay