En savoir plus

Notre utilisation de cookies

« Cookies » désigne un ensemble d’informations déposées dans le terminal de l’utilisateur lorsque celui-ci navigue sur un site web. Il s’agit d’un fichier contenant notamment un identifiant sous forme de numéro, le nom du serveur qui l’a déposé et éventuellement une date d’expiration. Grâce aux cookies, des informations sur votre visite, notamment votre langue de prédilection et d'autres paramètres, sont enregistrées sur le site web. Cela peut faciliter votre visite suivante sur ce site et renforcer l'utilité de ce dernier pour vous.

Afin d’améliorer votre expérience, nous utilisons des cookies pour conserver certaines informations de connexion et fournir une navigation sûre, collecter des statistiques en vue d’optimiser les fonctionnalités du site. Afin de voir précisément tous les cookies que nous utilisons, nous vous invitons à télécharger « Ghostery », une extension gratuite pour navigateurs permettant de les détecter et, dans certains cas, de les bloquer.

Ghostery est disponible gratuitement à cette adresse : https://www.ghostery.com/fr/products/

Vous pouvez également consulter le site de la CNIL afin d’apprendre à paramétrer votre navigateur pour contrôler les dépôts de cookies sur votre terminal.

S’agissant des cookies publicitaires déposés par des tiers, vous pouvez également vous connecter au site http://www.youronlinechoices.com/fr/controler-ses-cookies/, proposé par les professionnels de la publicité digitale regroupés au sein de l’association européenne EDAA (European Digital Advertising Alliance). Vous pourrez ainsi refuser ou accepter les cookies utilisés par les adhérents de l'EDAA.

Il est par ailleurs possible de s’opposer à certains cookies tiers directement auprès des éditeurs :

Catégorie de cookie

Moyens de désactivation

Cookies analytiques et de performance

Realytics
Google Analytics
Spoteffects
Optimizely

Cookies de ciblage ou publicitaires

DoubleClick
Mediarithmics

Les différents types de cookies pouvant être utilisés sur nos sites internet sont les suivants :

Cookies obligatoires

Cookies fonctionnels

Cookies sociaux et publicitaires

Ces cookies sont nécessaires au bon fonctionnement du site, ils ne peuvent pas être désactivés. Ils nous sont utiles pour vous fournir une connexion sécuritaire et assurer la disponibilité a minima de notre site internet.

Ces cookies nous permettent d’analyser l’utilisation du site afin de pouvoir en mesurer et en améliorer la performance. Ils nous permettent par exemple de conserver vos informations de connexion et d’afficher de façon plus cohérente les différents modules de notre site.

Ces cookies sont utilisés par des agences de publicité (par exemple Google) et par des réseaux sociaux (par exemple LinkedIn et Facebook) et autorisent notamment le partage des pages sur les réseaux sociaux, la publication de commentaires, la diffusion (sur notre site ou non) de publicités adaptées à vos centres d’intérêt.

Sur nos CMS EZPublish, il s’agit des cookies sessions CAS et PHP et du cookie New Relic pour le monitoring (IP, délais de réponse).

Ces cookies sont supprimés à la fin de la session (déconnexion ou fermeture du navigateur)

Sur nos CMS EZPublish, il s’agit du cookie XiTi pour la mesure d’audience. La société AT Internet est notre sous-traitant et conserve les informations (IP, date et heure de connexion, durée de connexion, pages consultées) 6 mois.

Sur nos CMS EZPublish, il n’y a pas de cookie de ce type.

Pour obtenir plus d’informations concernant les cookies que nous utilisons, vous pouvez vous adresser au Déléguée Informatique et Libertés de l’INRA par email à cil-dpo@inra.fr ou par courrier à :

INRA
24, chemin de Borde Rouge –Auzeville – CS52627
31326 Castanet Tolosan cedex - France

Dernière mise à jour : Mai 2018

Menu Logo Principal Société Française de Bio-Informatique GdR Bionformatique Moléculaire du CNRS

DECODAGE – Communauté d’Annotation des Génomes

Softwares

Softwares_Image01

The program versions used by the pipeline, for a specific analysis, are provided within the first line of the GFF3 output files.

  • SIMsearch - Bioinformatic Group at NIAS laboratory, Japan
    • Version 2013_08
    • Perl programs developed by H. Sakai, N. Amano, H. Numa, T. Tanaka & T. Itoh
  • BLAST  [Altschul et al., 1990 J. Mol. Biol 215:403-410]
    • Version 2.2.21
    • Basic Local Alignment and Search Tool which finds regions of local similarity between sequences. The program compares nucleotide or protein sequences to sequence databases and calculates the statistical significance of matches. BLAST can be used to infer functional and evolutionary relationships between sequences as well as help identify members of gene families. see description at NCBI
  • RepeatMasker [Smit 1993 Nucleic Acids Res. 21, 1863-1872]
    • Version 3.2.6
    • RepeatMasker screens DNA sequences in FASTA format against a library of repetitive elements and returns a masked query sequence ready for database searches. RepeatMasker also generates a table annotating the masked regions
  • wu-blast- BLAST 2.0 from Washington University (used by RepeatMasker)
    • Version 2.2.6
    • See description at Washington University in St Louis.Today, Rights to BLAST 2.0 (WU-BLAST) have been acquired by Advanced Biocomputing, LLC. All interested parties are hereby referred to: Advanced Biocomputing , LLC
  • cross-match - Phil Green Groupat University of Washington, US (used by RepeatMasker)
    • Version 0.990329
    • cross_match is a general purpose utility for comparing any two DNA sequence sets using a 'banded' version of swat
  • exonerate - [Slater and Birney 2005 BMC Bioinformatics 6, 31]
    • Version 2.2.0
    • exonerate is a generic tool for pairwise sequence comparison. It allows you to align sequences using a many alignment models, using either exhaustive dynamic programming, or a variety of heuristics
  • GeneID - [Guigo et al., 1992 J. Mol. Biol 226 :141-157]
    • Version 1.3
    • GeneID is a program to predict genes in anonymous genomic sequences designed with a hierarchical structure
  • GeneMarkHMM - [Lukashin and Borodovsky1998 Nucleic Acids Res. 26:1107-1115; Lomsadze et al., 2005 Nucleic Acids Res. 33:6494-6506]
    • Gene Prediction in Eukaryotes - Academy licensed - Georgia Institute of Technology, US
    • Maize, Barley and wheat (gmhmme2) - Version 2.2a
    • Rice (gmhmme3) - Version 3.9d
  • FGeneSH for monocot from SoftBerry (licensed)
    • Version 3.1.2
    • Hidden Markov Model (HMM)-based gene structure prediction program
  • Augustus - [Stanke and Waack 2003 Bioinformatics 19:ii215-ii225]
    • Version 2.5.5
    • Gene Prediction in Eukaryotes
      • maize matrix - University of California
      • wheat matrix - S. Theil INRA Clermont-Ferrand, 2012
  • EuGene - [Schiex et al., 2001 Computational Biology, Eds. O. Gascuel and M-F. Sagot, LNCS 2066, pp. 111-125]
    • Version 4.0
    • EuGene is an open gene finder for eukaryotic organisms. Compared to most existing gene finders, EuGene is characterized by its ability to simply integrate arbitrary sources of information in its prediction process
  • HMMER  (for Pfam) - [Durbin 1998 In: Biological sequence analysis: probabilistic models of proteins and nucleic acids. Cambridge University Press. Durbin R, E.S., Krogh A, Mitchison G eds.]
    • Version 3.0
    • HMMscan is used for searching sequence databases for homolog’s of protein sequences, and for making protein sequence alignments. It implements methods
  • InterProScan - From EBI, UK
    • Version 4.6
    • using hmmer2 for Pfam, Prosite and SMART
    • InterPro is an integrated database of predictive protein "signatures" used for the classification and automatic annotation of proteins and genomes. InterPro classifies sequences at superfamily, family and subfamily levels, predicting the occurrence of functional domains, repeats and important sites. InterPro adds in-depth annotation, including GO terms, to the protein signatures
  • Tandem Repeat Finder (TRF) - [Benson 1999 Nucleic Acids Res. 27:573-580]
    • Version 4.0 - link
    • Tandem Repeats Finder is a program to locate and display tandem repeats in DNA sequences. See description here
  • tRNAscan-SE - [Lowe and Eddy 1997 Nucleic Acids Res. 25:955-964]
    • Version 1.3.1
    • Lowe Group
    • tRNAscan-SE identifies 99–100% of transfer RNA genes in DNA sequence while giving less than one false positive per 15 gigabases
  • GTtallymer - [Kurtz et al., 2008 BMC Genomics 9, 517]
    • Version 1.3.7
    • Tallymer is based on enhanced suffix arrays which gives a much larger flexibility concerning the choice of the k-mer size
  • GBrowse
    • Version 2.33 - link
    • GMOD is the Generic Model Organism Database project, a collection of open source software tools for creating and managing genome-scale biological databases.