BIG DAT(ADN)
📰 Kairos 62 📁 Dossier

BIG DAT(ADN)

Illustration : Noir&Clair

Nous vivons une époque d’évolutions scientifiques où les chercheurs ne cessent d’avancer dans le décryptage du génome humain. Le séquençage du génome humain a été entamé en octobre 1990 et s’est terminé en avril 2003[note] . À partir de cette date, le monde a basculé de l’ère « génomique » à l’ère « post-génomique »[note]. Bien souvent, les termes « génétique » et « génomique » sont utilisés de manière interchangeable, les deux disciplines se consacrant à l’étude de l’ADN. La différence est liée à une question d’échelle : la « génétique » consiste en l’analyse des gènes individuels et de leur implication dans l’hérédité alors que la « génomique » s’intéresse à des ensembles de gènes (ou à leur totalité) et à leurs interactions environnementales, impliquant généralement de ce fait de grandes bases de données[note]. La complexité et l’ampleur des données nécessitent des approches théoriques, de la modélisation mathématique et de l’analyse en utilisant des outils informatiques. Par conséquent, parmi les branches de la biologie qui étudient la génomique (et la génétique) figurent ce que l’on appelle la biologie computationnelle (ou biologie numérique) ainsi que la bioinformatique. Que cela soit en biologie ou en médecine, les bases de données génétiques et génomiques ne cessent de s’accroître et cette tendance s’accélère avec la démocratisation des prix des séquençages. En effet, si le coût du séquençage du tout premier génome humain entre les années 1999 et 2000 a été estimé à 300 millions de dollars, les prix sont descendus à 15.000 dollars en 2010 et sont actuellement estimés à 600 euros[note]. Ces données constituent une mine d’or à ceux qui pourraient les exploiter, mais de quel intérêt parle-t-on ? 

D’abord, il y a ce que l’on pourrait considérer comme une « exploitation intellectuelle » qui concerne la recherche scientifique. Les bases de données servent à des fins d’analyses, d’hypothèses, d’expérimentations, de modèles etc. À titre d’exemple, l’Institut de Pathologie et de Génétique (IPG) à Gosselies, où j’ai travaillé dans le passé, réalise de la recherche biomédicale sur les génomes humains. L’objectif est d’une part de chercher des gènes responsables de maladies héréditaires dans le génome de patients et d’autre part de découvrir de nouveaux gènes (ou ensembles de gènes) qui pourraient expliquer certaines maladies. De tels gènes sont par exemple BRCA-1 et BRCA-2 qui sont des « suppresseurs de tumeurs ». Quand des mutations apparaissent dans ces gènes, le patient a plus de risques de développer un cancer du sein car une défaillance cause une perte de surveillance laissant la porte ouverte au développement du cancer (qui peut se développer…ou non). Les chercheurs de l’IPG cherchent également chez des patients atteints d’autisme des causes génétiques, dont certaines ont déjà été identifiées. Les troubles de l’autisme constituant un spectre, avec une symptomatologie et un diagnostic complexe, la tâche d’identifier des causes génétiques est ardue. Mais il est important de comprendre que la croyance commune consistant à penser qu’un gène équivaut à un symptôme est erronée. S’il existe des exemples où un gène bien précis peut être tenu responsable d’une condition bien précise (comme par exemple le gène CFTR, dont la mutation est responsable de la mucoviscidose), la majorité des gènes agissent en symphonie. Par conséquent, un dysfonctionnement dans un gène passera peut-être inaperçue. En d’autres termes, une fausse note d’un musicien dans un orchestre ne sera probablement pas perçue par le public (si tant est que le musicien en question ne fasse pas de solo). C’est pourquoi les bases de données génomiques constituent une source d’information cruciale, qu’il s’agisse de recherches biomédicales ou tout simplement de l’étude de génomes de limaces par des zoologistes. 

L’influence de notre patrimoine génétique ne se limite pas aux traits physiques. Dans son livre Blueprint[note], Robert Plomin décrit la façon dont notre comportement est lié à notre génome, sur des résultats acquis pendant toute sa carrière. Plomin est un psychologue généticien qui a étudié l’influence des gènes sur le comportement humain sur plusieurs centaines de jumeaux identiques (dont les génomes sont donc 100 % identiques) ainsi que sur des enfants adoptés. Certains de ses sujets d’étude ont été suivis pendant plus de 40 ans ! Le sujet est à la fois passionnant et inconfortable, étant donné qu’il relance un vieux débat sur le déterminisme (biologique) et la liberté humaine (ou libre arbitre)… Sans parler qu’il contredit la pensée dominante chez les sociologues qui attribuent plus d’importance aux interactions sociales qu’à la génétique. Parmi les messages principaux de Plomin figurent le fait que les gènes orientent fortement notre comportement, mais d’une manière beaucoup plus complexe que précédemment envisagée. Il remet en question la dichotomie génome/environnement en le caractérisant comme une fausse opposition : les gènes (et le corps) sont en constante interaction avec l’environnement. En fin de compte, l’environnement influence les gènes tout comme les gènes influencent l’environnement. Parmi les exemples que j’ai trouvés intéressants figure la propension à la lecture. Des jumeaux identiques séparés dès la naissance et vivant dans des familles d’accueil différentes ont non seulement le même poids au même âge (indépendamment de la qualité et de la quantité de la nourriture fournie), mais ils présentent également des comportements similaires comme la tendance à lire ! S’il n’existe pas de gène de « lecture de livre », la curiosité est probablement un trait de caractère qui s’hérite ; et une des manifestations possibles de la curiosité est la lecture de livres. Il en va de même pour l’hérédité de quotient intellectuel (QI). Que le QI soit une mesure d’intelligence pertinente (je ne le pense pas) n’est pas le sujet de cet article, mais plutôt le fait que l’hérédité ne soit pas réduite à des traits physiques. Cela peut paraître polémique, pourtant les parents ont toujours pris plaisir à identifier chez leurs enfants des traits de caractères hérités d’eux-mêmes. Dans des cas plus spécifiques, on observe un lien direct entre le comportement et les désordres génétiques (comme la trisomie 21). Ces exemples du quotidien démontrent que l’hérédité ne se limite pas aux traits physiques. Et cela nous mène au second type de profit que l’on peut tirer des bases de données génomiques : l’argent. 

L’expression « Big Data » concerne surtout les données sociales et économiques. Les GAFAM (c’est-à-dire les géants du web : Google (Alphabet), Apple, Facebook (Meta), Amazon et Microsoft) se servent de nos données pour s’enrichir. Je pense que la prochaine étape du Big Data concernera les données génomiques, c’est-à-dire de notre ADN (« Big DatADN »). Que l’on demeure sceptique par rapport à l’influence des gènes sur notre comportement ou pas, l’information génétique suscite un grand intérêt dans plusieurs domaines, dont par exemple le secteur médical (et le Big Pharma), les compagnies d’assurances, les banques et enfin les gouvernements dans un contexte de crédit social (voir l’article « Le crédit social en Union européenne : Des portefeuilles d’identité au passe sanitaire mondial » de Victorien Solae dans ce dossier). Malheureusement, l’exploitation des données génétiques a déjà commencé. Il existe des entreprises d’études généalogiques, comme MyHeritage, AncestryDNA ou 23&Me qui proposent une analyse de l’ADN du client pour un montant inférieur à 100 euros. Le client achète un kit, puis réalise un frottis (similaire aux auto-tests covid) et l’envoie à l’entreprise qui, après analyse, dévoile nos origines ethniques. Si cela peut être très intéressant en soi, le devenir de nos données par la suite reste flou et doit susciter la méfiance. Des pays comme la France ont interdit ce type de tests, mais en Belgique, cela n’est pas le cas. MyHeritage a d’ores et déjà une base de données avec 13 milliards d’enregistrements historiques (voir le site « lebigdata.fr » pour une revue excellente sur le sujet[note]. Un risque est que ces entreprises peuvent être rachetées (comme cela a été le cas pour MyHeritage qui a été acquise par Francisco Partners, une entreprise d’investissement dans le domaine de la technologie[note], la propriété des données étant transférée à d’autres entreprises avec éventuellement des chartes de protection de données moins strictes. Ces firmes peuvent également subir des fuites de données (cela fut également le cas pour MyHeritage)[note], ou peuvent tout simplement choisir de vendre leurs données, puisqu’elles en sont légalement propriétaires. L’entreprise 23&Me a vendu, il y a quelques années, la quasi-totalité des données génétiques de ses 5 millions de clients à l’industriel pharmaceutique GlaxoSmithKline[note]. 

La nature de la récolte des données n’est pas cloisonnée, mais complémentaire : les données économiques (nos données bancaires, …), sociales (réseaux sociaux, …), génétiques, etc. combinées formeront un tout qui permettra à ceux qui les détiennent d’avoir une vision effroyablement complète et pointue sur les identités et les agissements des individus. Qu’il s’agisse d’intérêt économique ou de contrôle totalitaire, les individus en paieront la facture. 

Kaarle Parikka