The Japan Times - Un pas de plus dans l'interprétation du génome grâce à l'IA

EUR -
AED 4.291707
AFN 74.790691
ALL 95.731952
AMD 439.466053
AOA 1071.611934
ARS 1614.682078
AUD 1.655519
AWG 2.104952
AZN 1.983575
BAM 1.955818
BBD 2.350752
BDT 143.38135
BHD 0.440725
BIF 3470.759821
BMD 1.168606
BND 1.488727
BOB 8.06511
BRL 5.959302
BSD 1.167126
BTN 108.084792
BWP 15.72135
BYN 3.390019
BYR 22904.677606
BZD 2.347382
CAD 1.617269
CDF 2687.794128
CHF 0.923175
CLF 0.026458
CLP 1041.298127
CNY 7.983741
CNH 7.984051
COP 4271.091326
CRC 542.609751
CUC 1.168606
CUP 30.968059
CVE 110.434233
CZK 24.377881
DJF 207.685
DKK 7.47268
DOP 70.554594
DZD 154.664692
EGP 62.048774
ERN 17.52909
ETB 182.945301
FJD 2.585482
FKP 0.869534
GBP 0.870898
GEL 3.143282
GGP 0.869534
GHS 12.872243
GIP 0.869534
GMD 86.476851
GNF 10254.518126
GTQ 8.929122
GYD 244.183343
HKD 9.154386
HNL 31.119699
HRK 7.534586
HTG 153.072751
HUF 376.871881
IDR 19978.488181
ILS 3.563956
IMP 0.869534
INR 108.205324
IQD 1530.87386
IRR 1537885.496405
ISK 143.400006
JEP 0.869534
JMD 184.534106
JOD 0.828527
JPY 186.180557
KES 150.925611
KGS 102.192841
KHR 4689.030503
KMF 491.98293
KPW 1051.691796
KRW 1736.151011
KWD 0.360947
KYD 0.972622
KZT 556.562383
LAK 25668.430823
LBP 104592.360857
LKR 368.268194
LRD 215.315399
LSL 19.082989
LTL 3.45059
LVL 0.706878
LYD 7.426508
MAD 10.866929
MDL 20.156707
MGA 4849.714836
MKD 61.644525
MMK 2453.815653
MNT 4178.059113
MOP 9.41841
MRU 46.755818
MUR 54.363481
MVR 18.054689
MWK 2029.867955
MXN 20.324337
MYR 4.638779
MZN 74.732138
NAD 19.08346
NGN 1591.641339
NIO 42.911412
NOK 11.096826
NPR 172.933848
NZD 2.002628
OMR 0.449335
PAB 1.167116
PEN 3.941119
PGK 5.038152
PHP 70.090642
PKR 326.070239
PLN 4.253734
PYG 7540.167761
QAR 4.260853
RON 5.091265
RSD 117.345565
RUB 90.317842
RWF 1707.917669
SAR 4.385278
SBD 9.405622
SCR 15.707887
SDG 702.332257
SEK 10.875819
SGD 1.490019
SLE 28.745153
SOS 667.85405
SRD 43.910951
STD 24187.7848
STN 24.902994
SVC 10.212227
SYP 129.193865
SZL 19.083056
THB 37.606892
TJS 11.105447
TMT 4.095964
TND 3.369967
TRY 52.219551
TTD 7.917176
TWD 37.148232
TZS 3038.375581
UAH 50.696328
UGX 4301.058889
USD 1.168606
UYU 47.370649
UZS 14280.365403
VES 555.161881
VND 30772.317503
VUV 139.688982
WST 3.236211
XAF 655.971595
XAG 0.015554
XAU 0.000246
XCD 3.158216
XCG 2.103547
XDR 0.815818
XOF 656.168655
XPF 119.331742
YER 278.770905
ZAR 19.232564
ZMK 10518.861153
ZMW 22.263495
ZWL 376.290655
  • AEX

    5.8300

    1010.96

    +0.58%

  • BEL20

    53.0900

    5470.09

    +0.98%

  • PX1

    61.8400

    8307.65

    +0.75%

  • ISEQ

    202.4700

    12856.69

    +1.6%

  • OSEBX

    -23.0800

    2037.47

    -1.12%

  • PSI20

    10.4300

    9495.77

    +0.11%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    43.9800

    3970.39

    +1.12%

  • N150

    21.5600

    4088.95

    +0.53%

Un pas de plus dans l'interprétation du génome grâce à l'IA
Un pas de plus dans l'interprétation du génome grâce à l'IA / Photo: HO - AFP/Archives

Un pas de plus dans l'interprétation du génome grâce à l'IA

AlphaGenome, outil d'intelligence artificielle (IA) de Google rendu public mercredi, fait un pas de plus dans la compréhension du génome, en analysant comment des portions de l'ADN régulent l'activité des gènes dans la cellule.

Taille du texte:

Le déchiffrage de l'ensemble du génome humain en 2003, "nous a donné le livre de la vie, mais le lire reste un défi", a rappelé Pushmeet Kohli, vice-président de la recherche chez Google DeepMind, à l'occasion de la présentation d'AlphaGenome dans la revue Nature.

"Nous avons le texte" - la succession de 3 milliards de paires de nucléotides A, T, C et G qui composent l'ADN -, mais "comprendre la grammaire (...) et la manière dont cela gouverne la vie constitue la prochaine frontière majeure de la recherche", a-t-il souligné devant la presse.

Seules 2% des séquences d'ADN "codent" directement des protéines, indispensables au fonctionnement des organismes vivants.

Les 98% restants ont un rôle de "chef d'orchestre": elles coordonnent, protègent et régulent l'expression de l'information génétique dans chacune de nos cellules. Ces séquences, appelées "non codantes", contiennent de nombreux variants associés à des maladies.

Ce sont elles qu'étudie AlphaGenome, venant compléter les autres modèles développés par le laboratoire d'IA de Google: AlphaMissense (analyse des séquences codantes de l'ADN), AlphaProteo (conception de protéines) et AlphaFold (prédiction de la structure de protéines, prix Nobel de chimie en 2024).

Le modèle d'apprentissage profond (dans lequel un réseau de neurones apprend à reconnaître automatiquement des motifs complexes) a été entraîné avec des données provenant de grands consortiums publics, qui ont mesuré expérimentalement ces propriétés dans des centaines de types de cellules et de tissus chez l'homme et la souris.

Il est capable d'analyser une longue séquence d'ADN et de "prédire" l'influence de chaque paire de nucléotides sur différents processus biologiques dans la cellule: activer ou réprimer l'expression d'un gène, piloter l'assemblage de l'ARN (une "copie" de l'ADN qui transmet l'information génétique dans la cellule)...

- "Fondamental" mais "pas parfait" -

D'autres modèles existaient déjà. Mais ils devaient faire un compromis entre la longueur des séquences analysées et la finesse de la résolution.

Or, une longue séquence - jusqu'à un million de paires de nucléotides - est "nécessaire pour comprendre l'environnement régulateur complet d'un gène unique", explique Ziga Avsec, un des co-auteurs du projet.

Et la finesse de la résolution permet d'étudier l'effet de variants génétiques en comparant les prédictions de séquences mutées à celles de séquences non mutées.

Autre avancée, AlphaGenome modélise simultanément l'influence de la séquence sur onze processus biologiques, alors que les scientifiques devaient jusqu'à présent utiliser plusieurs modèles.

Cet outil "peut accélérer notre compréhension du génome en aidant à cartographier l'emplacement des éléments fonctionnels et à déterminer leurs rôles au niveau moléculaire", estime Natasha Latysheva, également co-autrice.

"Nous espérons que les chercheurs enrichiront avec davantage de données et de modalités" le modèle, déjà testé par 3.000 scientifiques de 160 pays et désormais disponible en open source pour la recherche non-commerciale, souligne M. Kohli.

"Identifier précisément les différences dans nos génomes qui nous rendent plus ou moins susceptibles de développer des milliers de maladies est une étape clé vers de meilleurs traitements", note Ben Lehner, responsable de la génomique générative et synthétique au Wellcome Sanger Institute de Cambridge.

Le chercheur, qui n'a pas participé au projet mais a testé le modèle, le juge "très performant", mais encore "loin d'être parfait".

"Les modèles d'IA ne sont bons que dans la mesure où les données utilisées pour les entraîner le sont", or la plupart des jeux de données existants "sont trop petits et insuffisamment standardisés", explique-t-il dans une réaction à l'organisme britannique Science Media Center (SMC).

AlphaGenome n'est pas une "solution miracle à toutes les questions biologiques", l'expression des gènes "étant influencée par des facteurs environnementaux complexes", mais il constitue un "outil fondamental", abonde Robert Goldstone, responsable de la génomique au Francis Crick Institute, cité dans le même texte.

Selon lui, ce nouvel outil permettra aux scientifiques "d'étudier et de simuler de manière programmatique les bases génétiques des maladies complexes".

Y.Mori--JT