Génomique des populations

From Wikipedia, the free encyclopedia

La génomique des populations est la comparaison à grande échelle des séquences d'ADN de populations. Cette discipline étudie la variabilité génétique des espèces à l'échelle du génome, afin d'améliorer notre compréhension de la démographie, la microévolution et l'histoire phylogénétique des populations. Le syntagme génomique des populations est un néologisme calqué sur génétique des populations.

La variabilité des populations intéresse les scientifiques depuis Darwin. Parmi les premières méthodes utilisées pour étudier la variabilité génétique à plusieurs loci figuraient l'électrophorèse sur gel et la cartographie par enzymes de restriction[1]. Auparavant, la génomique se limitait à l'étude d'un petit nombre de loci. Cependant, les progrès récents en matière de séquençage, de stockage et de puissance informatique ont permis l'étude de centaines de milliers de loci issus de populations[2]. L'analyse de ces données nécessite l'identification de loci non neutres ou aberrants qui indiquent une sélection dans cette région du génome. Cela permettra au chercheur de supprimer ces loci pour étudier les effets à l'échelle du génome ou de se concentrer sur ces loci s'ils présentent un intérêt.

Applications de recherche

Dans l'étude de Schizosaccharomyces pombe (plus communément appelée levure de fission), un organisme modèle populaire, la génomique des populations a été utilisée pour comprendre les raisons de la variation phénotypique au sein d'une espèce. Cependant, la variation génétique au sein de cette espèce étant jusqu'alors mal comprise en raison de restrictions technologiques, la génomique des populations nous permet d'en apprendre davantage sur les différences génétiques entre les espèces[3]. Dans la population humaine, la génomique des populations a été utilisée pour étudier l'évolution génétique depuis le début de la migration des humains hors d'Afrique, il y a environ 50 000 à 100 000 ans. Il a été démontré que non seulement les gènes liés à la fertilité et à la reproduction étaient fortement sélectionnés, mais aussi que plus les humains s'éloignaient de l'Afrique, plus la présence de lactase était importante[4].

Une étude réalisée en 2007 par Begun et al. a comparé la séquence du génome entier de plusieurs lignées de Drosophila simulans à celle de D. melanogaster et D. yakuba . L'ADN issu de séquences shotgun du génome entier de D. simulans a été aligné sur une séquence de référence standard avant d'effectuer une analyse du polymorphisme et de la divergence du génome entier. Cette analyse a révélé un grand nombre de protéines ayant subi une sélection directionnelle . Ils ont découvert des fluctuations à grande échelle, jusqu'alors inconnues, du polymorphisme et de la divergence le long des bras chromosomiques. Ils ont constaté que le chromosome X présentait une divergence plus rapide et un polymorphisme significativement moindre que prévu. Ils ont également identifié des régions du génome (par exemple, les UTR ) qui signalaient une évolution adaptative[5].

En 2014, Jacquot et al. ont étudié la diversification et l'épidémiologie des bactéries pathogènes endémiques en utilisant le complexe d'espèces Borrelia burgdorferi (la bactérie responsable de la maladie de Lyme) comme modèle. Ils souhaitaient également comparer la structure génétique de B. burgdorferi et des espèces étroitement apparentées B. garinii et B. afzelii . Ils ont commencé par séquencer des échantillons d'une culture, puis ont cartographié la lecture brute sur des séquences de référence. Des analyses SNP et phylogénétiques ont été utilisées aux niveaux intraspécifique et interspécifique. En examinant le degré d'isolement génétique, ils ont constaté que le taux de recombinaison intraspécifique était environ 50 fois supérieur au taux interspécifique. Ils ont également constaté qu'en utilisant la plupart des souches conspécifiques du génome, elles ne se regroupaient pas en clades, ce qui remet en question les stratégies antérieures utilisées pour étudier l'épidémiologie des agents pathogènes[6].

Moore et al. ont mené une étude en 2014 sur un groupe de populations de saumon atlantique, précédemment analysées par des analyses génétiques traditionnelles ( microsatellites, génotypage par matrice de SNP, BayeScan (qui utilise la distribution multinomiale de Dirichlet )) afin de les classer en unités de conservation définies. Cette évaluation génomique concordait globalement avec les résultats précédents, mais a identifié davantage de différences entre des groupes distincts sur le plan régional et génétique, suggérant qu'il existait potentiellement un nombre encore plus important d'unités de conservation de saumon dans ces régions. Ces résultats ont confirmé l'utilité d'une analyse pangénomique afin d'améliorer la précision de la désignation future des unités de conservation[7].

Chez les espèces marines hautement migratrices, les analyses génétiques traditionnelles des populations ne parviennent souvent pas à identifier la structure de la population. Chez les thons, les marqueurs traditionnels tels que les produits de PCR à courte portée, les microsatellites et les matrices de SNP ont eu du mal à distinguer les stocks de poissons de différents bassins océaniques. Cependant, la recherche en génomique des populations utilisant le séquençage RAD chez le thon albacore [8],[9] et le germon [10],[11] a pu distinguer les populations de différents bassins océaniques et révéler une structure de population à petite échelle. Ces études identifient des loci putativement adaptatifs qui révèlent une forte structure de population, même si ces sites représentent une proportion relativement faible des données globales de séquence d'ADN. En revanche, la majorité des loci séquencés qui sont présumés être sélectivement neutres ne révèlent pas de schémas de différenciation de population, ce qui correspond aux résultats des marqueurs d'ADN traditionnels[8],[9],[10],[11]. Le même modèle de loci prétendument adaptatifs et de séquençage RAD révélant la structure de la population, comparé aux informations limitées fournies par les marqueurs ADN traditionnels, est également observé pour d'autres poissons marins, notamment le marlin rayé [12] et la morue-lingue[13].

Implications éthiques

Aux États-Unis, les réglementations fédérales qui régissent la recherche sur des sujets humains découlent de trois principes éthiques identifiés dans le rapport Belmont : le respect des personnes, la bienfaisance et la justice.

Reconnaissance de l'autonomie personnelle

Dans les recherches impliquant des sujets humains, l’exercice approprié de l’autonomie exige que les participants à la recherche acceptent de s’engager dans la recherche volontairement et avec des informations adéquates.

protection des personnes

La bienfaisance implique deux exigences : maximiser les bénéfices potentiels tout en minimisant les préjudices potentiels. La justice vise à répartir équitablement les bénéfices et les inconvénients de la recherche. Ces protections sont particulièrement importantes pour les populations dites vulnérables, généralement définies comme celles qui présentent un risque accru de préjudice, d’exploitation et une capacité limitée de consentement et/ou d’autonomie[14].

consentement

La définition moderne du terme repose principalement sur trois concepts : i) les informations relatives à l’étude ; ii) la compréhension des participants ; et iii) le caractère volontaire. Premièrement, le pilier « information » stipule qu’il est essentiel de divulguer aux participants toutes les informations relatives à une étude. De plus, tous les risques doivent être divulgués, quel que soit leur impact sur la volonté du participant à participer à l’étude. Le deuxième concept, « compréhension », évalue les capacités mentales des participants et leur aptitude à comprendre et traiter pleinement les informations qui leur sont communiquées par les chercheurs (y compris les risques liés au partage de leurs données personnelles avec les institutions de recherche et les bénéfices pour la société pouvant découler de leur participation). Il a également été suggéré que compréhension et information sont liées, la compréhension mesurant la capacité d’un individu à saisir les informations qui lui sont fournies dans le premier pilier. Troisièmement, le « caractère volontaire » souligne l’importance du consentement libre et éclairé des participants. À cet égard, le caractère volontaire comprend non seulement l’acte de participer à une étude de recherche, mais également l’acte de s’en retirer (consentement dynamique)[15].

individualisme et communautarisme

Les individus peuvent implicitement considérer leur participation comme un exercice collectif plutôt qu'une décision personnelle, une position contraire à l'approche individualiste privilégiée par les lignes directrices modernes en matière d'éthique de la recherche pour le consentement éclairé. Par ailleurs, les tensions intercommunautaires et intracommunautaires peuvent être exacerbées si la perspective d'une récompense monétaire ou autre est liée à la participation, même à des niveaux de rémunération relativement faibles[14].

le paradoxe du consentement

Le principal argument contre le consentement éclairé (notamment dans le contexte du big data) est la charge excessive imposée aux participants. Certains affirment que cela revient à leur demander plus qu'ils ne sont capables de fournir, car ils ont la responsabilité de trancher sur des questions complexes qu'ils n'ont ni le temps ni les capacités de comprendre et d'évaluer pleinement[16].

Égalité

La justice distributive suggère que les différents groupes sociaux devraient bénéficier des mêmes chances d'accès aux interventions et d'en bénéficier. Cependant, il est reconnu que le recours au dépistage est plus faible dans les minorités et les groupes socioéconomiques défavorisés.

Évaluation économique

Ce dépistage est essentiel dans un programme de santé publique et, dans le contexte financier actuel, l'investissement considérable requis pour le dépistage génétique de la population devrait être justifié. Par exemple, le dépistage du cancer du sein par les gènes BRCA dans le contexte des populations à haut risque s'est déjà avéré rentable aux États-Unis et au Royaume-Uni [10, 55], et des données récentes ont montré que le dépistage des gènes héréditaires du cancer du sein et de l'ovaire dans une population non sélectionnée était plus rentable que les tests basés sur des critères cliniques ou familiaux [17].

Rapport de retour

Depuis plus de vingt ans, les chercheurs sont confrontés au dilemme éthique de savoir quelles informations communiquer aux participants aux études – une question souvent appelée « retour » (en recherche génomique) des résultats. Ces dernières années, l'augmentation des preuves des bénéfices potentiels, de la minimisation des préjudices et du souhait des participants de recevoir les résultats a conduit des organismes de premier plan à soutenir la pratique du retour d'information, comme le rapport des National Academies of Sciences, Engineering, and Medicine (NASEM) de 2018. La NASEM recommande aux chercheurs analysant des échantillons biologiques humains de déterminer systématiquement s'il convient de communiquer les résultats individuels et comment, et d'inclure des plans dans leurs protocoles. Ces recommandations reposent sur les principes de réciprocité, de respect et de transparence. Cependant, de nombreux défis subsistent quant à la portée des informations à communiquer aux individus et aux communautés, ainsi qu'à la meilleure façon de communiquer les résultats afin d'optimiser les bénéfices et de minimiser les préjudices[18].

Manipulation respectueuse des échantillons biologiques

Une consultation appropriée des groupes impliqués dans l'étude permet de garantir que les procédures de collecte, de stockage, d'utilisation, de destruction et de rapatriement des échantillons biologiques soient menées conformément aux valeurs et aux attentes culturelles locales. Les échantillons prélevés auprès des communautés pouvant revêtir une signification culturelle et spirituelle importante, le même respect accordé aux communautés et aux participants doit être appliqué à la gestion des échantillons biologiques. Tous les membres de l'équipe de recherche doivent reconnaître l'importance et la valeur des échantillons pour leurs donneurs et leurs communautés[19].

Confidentialité

De nombreuses entreprises utilisent les données des consommateurs à des fins annexes et partagent et/ou vendent ces informations à des tiers (Daviet et al., 2022). La propriété des données génomiques personnelles par les entreprises est préoccupante, car elles utilisent ces données à leur propre discrétion, hors de tout contrôle des consommateurs. 23andMe, l'une des plus grandes entreprises de DTCGT, a confirmé revendre les données génomiques des utilisateurs à des établissements de recherche clinique et pharmaceutiques. Cela a des répercussions sur l'autonomie, car les individus ne sont plus en mesure de décider de l'utilisation de leurs propres données génomiques une fois les tests lancés.

Les données génomiques des individus leur permettent potentiellement de tirer des conclusions sur leurs proches. En soumettant un échantillon personnel, une personne soumet indirectement les données génomiques de toute sa famille sans son consentement. Contrairement aux tests d'ascendance génomique directs aux consommateurs, les tests cliniques ne fournissent pas de résultats permettant de relier les proches. La confidentialité des données peut être encore plus compromise avec les tests génomiques en raison de vulnérabilités en matière de cybersécurité ou de demandes d'accès aux données par les forces de l'ordre lors de recherches criminelles. Si les individus ne peuvent contrôler l'accès et l'utilisation de leurs propres données génomiques, l'autonomie du patient est inexistante.

Loi sur la non-discrimination en matière d'information génétique

La loi sur la non-discrimination en matière d'information génétique a été adoptée afin de protéger les individus contre la discrimination liée à leurs informations génomiques. Cette législation interdit aux assureurs maladie et aux employeurs toute discrimination fondée sur les antécédents familiaux de maladie et/ou les résultats des tests génomiques. Cela a des implications en matière de non malfaisance. Les individus peuvent supposer que les avantages du test génétique l'emportent sur les risques et que les informations obtenues leur seront bénéfiques, ainsi qu'à leur future prise en charge médicale. Cependant, des résultats positifs aux tests peuvent avoir des conséquences importantes sur leur future assurabilité en matière d'assurance vie, de soins de longue durée ou d'invalidité. Si ces risques ne sont pas communiqués de manière juste et équitable lors des consultations pré-test ou des processus de consentement éclairé, le principe éthique de justice est également compromis.

Impact psychologique

Pour certaines personnes, les résultats des tests génomiques peuvent être bouleversants. Dans une enquête menée auprès de 23 196 consommateurs ayant subi une TGF, 61 % des répondants ont rapporté des résultats qui transmettaient de nouvelles informations médicales les concernant ou concernant un proche. Cela comprenait l'annonce bouleversante qu'un parent n'était pas leur parent biologique, ou qu'ils avaient un frère ou une sœur dont ils ignoraient l'existence. Les consommateurs ayant appris qu'ils avaient été conçus grâce à un donneur (spermatozoïde, ovule ou embryon) ont déclaré regretter leur décision de recourir à la TGF. Les patients risquent de découvrir des informations bouleversantes [20], notamment des situations de viol, d'abandon ou d'autres confidences familiales[21]. D'un point de vue éthique, le conseil pré-test offre l'occasion de peser les préoccupations concernant la bienfaisance et la non malfaisance et place les patients dans une position d'autonomie où, une fois éduqués et informés, ils peuvent décider de se faire dépister à leur guise.

Préoccupations juridiques

Les patients sont plus susceptibles de recourir à la GT s'ils estiment que leurs besoins ne sont pas satisfaits ou si leurs antécédents familiaux et leurs risques potentiels pour la santé sont ignorés. Dans un souci de bienfaisance, les systèmes de santé peuvent élaborer des politiques et des formations fondées sur des données probantes afin de mieux préparer les infirmières à ces situations, ce qui peut permettre de répondre aux futures préoccupations en matière de responsabilité.

Déterminer l'utilité clinique d'un test ou une recommandation de prévention est déjà une tâche complexe, car les professionnels de santé s'efforcent de relier les variants génomiques aux risques de maladies associés. Des résultats faussement positifs peuvent conduire à des interventions invasives inutiles, et des résultats faussement négatifs peuvent entraîner l'absence d'intervention pour des patients qui en bénéficieraient grandement. L'interprétation erronée des résultats constitue un risque de responsabilité.

Une étude a démontré que plusieurs variants confirmés par séquençage avaient été classés à tort comme pathogènes (Tandy-Connor et al., 2018)[22].

Modèles mathématiques

La compréhension et l'analyse des vastes données issues des études de génomique des populations nécessitent divers modèles mathématiques. La cartographie des QTL est une méthode d'analyse de ces données. Cette cartographie a permis d'identifier les gènes responsables des phénotypes adaptatifs[23]. Pour quantifier la diversité génétique au sein d'une population, on utilise une valeur appelée indice de fixation, ou FST. Associé au D de Tajima, le FST permet de montrer l'effet de la sélection sur une population[24]. Le test de McDonald-Kreitman (ou test MK) est également privilégié pour la sélection, car il est moins sensible aux variations démographiques d'une espèce, ce qui fausserait d'autres tests de sélection[25].

Développements futurs

Voir aussi

Notes

Related Articles

Wikiwand AI