DNase-Seq

Le DNase-seq (séquençage des sites hypersensibles à la DNase I) est une méthode utilisée en biologie moléculaire pour identifier et localiser des régions régulatrices, à partir du sequençage à haut débit des régions sensibles au clivage par la DNase I^[1]^,^[2]^,^[3]. Le FAIRE-Seq est un successeur du DNase-seq pour l'identification des régions d'ADN accessibles à l'échelle du génome. Ces deux protocoles, dédiés à l'identification de régions chromatiniennes ouvertes, sont sujets à certains biais dus aux structures nucléosomales sous-jascentes. Par exemple, le FAIRE-seq fournit un nombre de reads supérieur dans les régions régulatrices non-promotrices^[4]. Cependant, le signal DNase-seq est supérieur aux régions promotrices, et il a été montré que le DNase-seq possède une sensibilité supérieure au FAIRE-seq et ce même aux régions régulatrices non-promotrices^[4]. L'analyse bioinformatique de base des données générées par le biais du DNase-Seq est similaire à celle du Chip-Seq.

Le DNase-seq requiert certaines analyses bioinformatiques de manière à identifier des empreintes génomiques à l'échelle du génome. Le principe y reste le même, à savoir l'identification de zones de protection du clivage par la DNase-I au sein de régions chromatiniennes accessibles, ce qui implique la présence de protéines liées à l'ADN à un endroit donné du génome. Cette information peut être utilisée pour inférer la fixation de facteurs de transcription à un site donné. Les outils informatiques déjà développés peuvent être divisés en deux classes : les approches segmentation-basées et les approches site-centrées. Les méthodes segmentation-basées utilisent des chaînes de Markov ou fenêtres glissantes pour segmenter le génome en régions chromatiniennes ouvertes ou fermées. Des exemples de telles méthodes sont HINT^[5], la méthode Boyle^[6] et la méthode Neph^[7]. L'analyse des séquences correspondant à des empreintes génomiques permet d'identifier un ou des facteurs de transcription se liant potentiellement à ces sites, selon la présence de motifs d'ADN spécifiques leur correspondant (à partir d'informations telles que les Matrices poids-position). Les méthodes site-centrées, quant à elles, identifient des empreintes génomiques à partir de profils de chromatine accessible autour de motifs correspondant à des sites potentiels de fixation de facteurs de transcription, c'est-à-dire des régions régulatrices prédites à partir d'informations d'interactions potentielles ADN-protéine. CENTIPEDE^[8] et la méthode Cuellar-Partida ^[9] sont des exemples de telles méthodes.

Notes et références

↑ AP Boyle, Davis S, Shulha HP, Meltzer P, Margulies EH, Weng Z, Furey TS et Crawford GE, « High-resolution mapping and characterization of open chromatin across the genome », Cell, vol. 132, n^o 2,‎ 2008, p. 311–22 (PMID 18243105, PMCID 2669738, DOI 10.1016/j.cell.2007.12.014)
↑ GE Crawford, Holt, IE, Whittle, J, Webb, BD, Tai, D, Davis, S, Margulies, EH, Chen, Y, Bernat, JA, Ginsburg, D, Zhou, D, Luo, S, Vasicek, TJ, Daly, MJ, Wolfsberg, TG et Collins, FS, « Genome-wide mapping of DNase hypersensitive sites using massively parallel signature sequencing (MPSS). », Genome Research, vol. 3, n^o 1,‎ janvier 2006, p. 230 (PMID 16344561, PMCID 1356136, DOI 10.1101/gr.4074106)
↑ P Madrigal et Krajewski, P, « Current bioinformatic approaches to identify DNase I hypersensitive sites and genomic footprints from DNase-seq data. », Front Genet, vol. 16, n^o 1,‎ octobre 2012, p. 123–31 (PMID 23118738, PMCID 3484326, DOI 10.3389/fgene.2012.00230)
1 2 Vibhor Kumar Prabhakar S., Rayan NA, Kraus P, Lufkin T et Ng HH, « Uniform, optimal signal processing of mapped deep-sequencing data. », Nature Biotechnology, vol. 31, n^o 7,‎ juillet 2013, p. 615–22 (PMID 23770639, DOI 10.1038/nbt.2596)
↑ EG Gusmao, Dieterich, C, Zenke, M et Costa, IG, « Detection of Active Transcription Factor Binding Sites with the Combination of DNase Hypersensitivity and Histone Modifications. », Bioinformatics, vol. 30, n^o 22,‎ août 2014, p. 3143–51 (PMID 25086003, DOI 10.1093/bioinformatics/btu519)
↑ AP Boyle et al., « High-resolution genome-wide in vivo footprinting of diverse transcription factors in human cells. », Genome Research, vol. 21, n^o 3,‎ mars 2011, p. 456–464 (PMID 21106903, PMCID 3044859, DOI 10.1101/gr.112656.110)
↑ S Neph et al., « An expansive human regulatory lexicon encoded in transcription factor footprints. », Nature, vol. 489, n^o 7414,‎ septembre 2012, p. 83–90 (PMID 22955618, DOI 10.1038/nature11212)
↑ R Pique-Regi et al., « Accurate inference of transcription factor binding from DNA sequence and chromatin accessibility data. », Genome Research, vol. 21, n^o 3,‎ mars 2011, p. 447–455 (PMID 21106904, PMCID 3044858, DOI 10.1101/gr.112623.110)
↑ G Cuellar-Partida et al., « Epigenetic priors for identifying active transcription factor binding sites. », Bioinformatics, vol. 28, n^o 1,‎ janvier 2012, p. 56–62 (PMID 22072382, PMCID 3244768, DOI 10.1093/bioinformatics/btr614)

Notes et références

Liens externes

Articles connexes

Related Articles