CRAN : http://cran.r-project.org
Segmentation :
AR1seg
This package corresponds to the implementation of the robust approach for estimating change-points in the mean of an AR(1) Gaussian process by using the methodology described in the paper arXiv 1403.1958
HiCseg
- C. Lévy-Leduc. R package: HiCseg (available on the CRAN) which allows you to detect domains in HiC data. The methodology that is used in this package is described in the paper “Two-dimensional segmentation for analyzing HiC data” by C. Lévy-Leduc, M. Delattre, T. Mary-Huard and S. Robin, Bioinformatics, vol. 30, n.17, p. 386-392.
- B. Benmammar, C. Lévy-Leduc, F. Roueff. TopRank software (developped in C for detecting and localizing network anomalies), registered at the “Agence pour la Protection des Programmes”, IDDN.FR.001.100004.000.S.P.2008.000.20700, in 2008.
Blockseg
SegCorr
Détection de régions corrélées dans des données d’expression, prenant en compte des variations du nombre de copies .
Segmentor3IsBack
Segmentor3IsBack is a package for the exact and fast segmentation of large profiles
Référence :
Cleynen A, Koskas M, Lebarbier E, Rigaill G, Robin S (2013) Segmentor3IsBack: an R package for the fast and exact segmentation of Seq-data, Algorithm for Molecular Biology, submitted
CGHseg
Segmentation methods for array CGH analysis
Référence :
Picard F, Lebarbier E, Hoebeke M, Rigaill G, Thiam B, Robin S (2011) Joint segmentation calling and normalization of multiple CGH profiles, Biostatistics, vol. 12 pp.413-428
Modèles à structures cachées
Phylogenetic-EM
sur GitHub. Détection de saut adaptatif dans l’histoire d’un trait quantitatif.
BlockModels
Le package se nome blockmodels, il permet de faire du V-EM dans LBM et SBM avec les PDFs bernoulli, poisson, et gaussian, avec covariables (et une version avec un developpement polynomial pour bernoulli avec covariable pour réduire d'un ordre de cplx et vectoriser les calculs), et multivarié dans le cas gaussien (sans covariables) (homosc indép, indép, ou quelconque).
HTSCluster
Réseaux
Saturnin
inférence du réseau de régulation de gènes chez Arabidopsis thaliana, inférence de réseaux écologiques
Méthodes d’inférence pour les modèles parcimonieux en grande dimension
EstHer
sélection des SNP causaux pour l’autisme.
Divers
dbmss
Tools to characterize point patterns
Référence : Marcon E, Traissac S, Puech F, Lang G (2013) Tools to Characterize Point Patterns: dbmss for R, Journal of Statistical Software, submitted
EBS
EBS is a package for the exact Bayesian segmentation of profiles
Références :
Rigaill G, Lebarbier E, Robin S (2012) Exact posterior distributions and model selection criteria for multiple change-point detection problems, Statistics and Computing, 22:917–929
Cleynen A, Robin S (2013) Comparing change-point locations of independent profiles, Computational Statistics & Data Analysis, submitted
HiLMM
Estimation of heritability with confidence intervals in linear mixed models.
MixThres
MixThres est un package permettant la définition d’un seuil d’hybridation à partir de modèles de mélange sur la distribution d’un signal:
Référence :
Picard F, Martin-Magniette M.L, Gagnot S, Brunaud V, Aubert J, Gendrel V, Robin S, Caboche M, Lecharny A, Colot V (oct 2008), MixThres: mixture models to define a hybridization threshold in DNA microarray experiments
preprint.
MultiChIPmixHMM
Le package MultiChIPmixHMM est un package R disponible sur http://cran.r-project.org/src/contrib/Archive/MultiChIPmixHMM/. C'est un modèle de mélange de deux régressions linéaires permettant d'analyser simultanément plusieurs réplicats biologiques de données de ChIP-chip. Quand les données sont produites avec des puces tiling array, la dépendance spatiale entre les sondes peut-être pris en compte grâce à une modélisation de la variable latente par une chaîne de Markov d'ordre 1.
Référence :
Martin-Magniette ML, Mary-Huard T, Berard C, Robin S (2008), ChIPmix: Mixture model of regressions for two-color ChIP-chip analysis, Bioinformatics, 24(16):i181-i186
doi:10.1093/bioinformatics/btn280
TAHMMAnnot
Bidimensionnal Gaussian mixture model, HMM and Annotation for ChIP-chip IP/IP and Transcriptome data analysis.
Référence :
Bérard C, Martin-Magniette ML, Brunaud V, Aubourg S, Robin S (2011), Unsupervised Classification for Tiling Arrays: ChIP-chip and Transcriptome,Statistical Applications in Genetics and Molecular Biology, Vol. 10: Iss. 1, Article 50
http://www.bepress.com/sagmb/vol10/iss1/art50
HMMmix
The HMMmixture package allows one to reduce a K-states HMM to a D-states HMM, with D < K.
VBMA4hmm
Variational Bayes Model Averaging for hidden markov models.
anapuce
anapuce est un package rassemblant des outils pour l’analyse de microarrays. Il permet :
- d’effectuer la normalisation de puces deux couleurs : normalisation globale par une loess + soustraction de la médiane par bloc
- d’effectuer l’analyse différentielle : variance spécifique / variance homogène / une variance par groupe de gènes (méthode varmixt proposée par P. Delmar) + prise en compte de la multiplicité des tests via l’utilisation de la fonction p.adjust.
- de calculer un FDR local à partir de pvalues brutes. Le FDR local associé à chaque gène mesure la probabilité que ce gène soit un faux positif.
- de calculer le Label Bias Index. Cet index constitue une mesure globale du biais de marquage spécifique au gène. Un minimum de deux lames jaunes est nécessaire.
Références :
Aubert J, Bar-Hen A, Daudin J.J, Robin S (2004), Determination of the differentially expressed genes in microarrays experiments using local FDR, BMC Bioinformatics 2004, 5:125.
doi:10.1186/1471-2105-5-125
Martin-Magniette M.L, Aubert J, Cabannes E, Daudin J.J (2005), Evaluation of the gene-specific dye bias in cDNA microarray experiments, Bioinformatics, 21(9), 1995-2000.
doi:10.1093/bioinformatics/bti302
varmixt0.2-4
Le package varmixt était un package définissant un modèle de mélange sur les variances dans le cadre de la recherche de gènes différentiellement exprimés entre deux conditions. Il n'est plus maintenu. La méthode est implémentée dans le package anapuce (fonction est.varmixt) et les fonctions DiffAnalysis.unpaired et DiffAnalysis permettent d'effectuer une analyse différentielle entre deux conditions en utilisant varmixt.
Référence :
Delmar P, Robin S, Daudin J.J (2005), VarMixt: efficient variance modelling for the differential analysis of replicated gene expression data, Bioinformatics 2005 Feb 15;21(4):502-8.
doi:10.1093/bioinformatics/bti023
MixNet
Le modèle Mixnet est un modèle de mélange pour graphes aléatoires (orientés ou non). Il vise à détecter des groupes de sommets ayant des profils de connexion similaires. L'estimation des paramètres est effectuée selon une méthode variationnelle qui permet de maximiser la vraisemblance approchée des données.
Mixnet is C++ package based on a probabilistic model for heterogeneous random graphs. This model is based on the hypothesis that real networks are made of classes of vertices which show specific connectivity patterns. Mixnet compute variationnal estimates of the parameters and a statistical criterion, ICL to select the number of classes.
Références :
Daudin, J.-J., Picard, F., Robin, S., Mixture model for random graphs, Statistics and Computing, 2008.
Picard, F., Miele, V., Daudin,J-J., Cottret,L., Robin, S., Deciphering the connectivity structure of biological networks using MixNet, BMC Bioinformatics , Suppl 6, S17,2009, http://www.biomedcentral.com/1471-2105/10/S6/S17
wmixnet
Le Stochastic Block Model avec covariables est une extention du Stochastic Block Model qui a déjà fait l'objet d'une implémentation (MixNet, cf section précedente).
Ce modèle vise à estimer l'effet des covariables et à regrouper les sommets ayant des profils de connexion similaires conditionnellement aux covariables.
L'estimation est effectuée au moyen d'un EM variationel afin de maximiser une approximation de la vraissemblence des données. Le choix du nombre de groupe est effectuée avec le critère ICL.
Cette implémentation est effectuée en C++, liée avec des bibliothèques de calcul matriciel, et parralellisée.
Download and installation procedurepdf - 63,64 ko
The Stochastic Block Model with covariates is a extention of the Stochastic Block Model which is already implemented (MixNet, see below).
The aim of this model is to estimate the covariate effects, and grop vertices which have same connectivity profile conditionnaly to covariates.
The estimation is done by a variationnal EM to maximize a approximation of liklelihood, and the number of groups is choosen by the ICL criterion.
This program is written in C++, linked with algebra libraries, and parralellized.
SelvarClust
SelvarClust is a software implemented in C++ with object-oriented programming. It is devoted to the variable selection in model-based clustering. It is a greedy algorithm associated to the SR modeling proposed by Maugis et al. (2009) in Biometrics. This software allows us to study data where individuals are described by quantitative block variables. It returns a data clustering and the selected model, composed of the number of clusters, the mixture form and the variable partition.
SelvarClustMV is a software implemented in C++ with object-oriented programming. It is an extension of SelvarClust, it is devoted to the variable selection in model-based clustering allowing for missing value (Maugis-Rabusseau et al.(2012) in Journal de la SfdS. Currently, this software is proposed for Gaussian mixtures whose variance matrices are assumed to be identical and free (m=[pkLC]).
SelvarClustIndep is a software implemented in C++ with object-oriented programming. It is devoted to the variable selection in model-based clustering. It is a greedy algorithm associated to the SRUW modeling proposed by Maugis et al. (2009) in CSDA. The SRUW modeling takes into account three possible roles for each variable: relevant, redundant and independent. This software allows to study datasets where observations are described by quantitative variables. It returns a data clustering and the selected model composed of the number of clusters, the mixture form, the variance matrix form for the linear regression and the independent Gaussian density, and the variable partition.
Modèle C-Mixnet et ses applications
- Package MATLAB [.zip] NECESSITE la ToolBox Optimisation
- La présentation [.pdf]
- Le rapport de stage [.pdf] d'Emeric Thibaud (juin 2009) encadré par Jean-Jacques Daudin.
Référence :
Daudin, J.-J., Pierre, L., Vacher, C., Model for Heterogeneous Random Networks Using Continuous Latent Variables and an Application to a Tree-Fungus Network, Biometrics 66,1043-1051, December 2010.