The Japan Times - Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

EUR -
AED 4.315152
AFN 77.708509
ALL 96.852138
AMD 448.491142
ANG 2.103707
AOA 1077.46608
ARS 1692.867744
AUD 1.766731
AWG 2.114983
AZN 1.996065
BAM 1.958827
BBD 2.365606
BDT 143.531799
BGN 1.957646
BHD 0.442923
BIF 3471.553207
BMD 1.174991
BND 1.516883
BOB 8.115541
BRL 6.345419
BSD 1.17454
BTN 106.215586
BWP 15.56238
BYN 3.462451
BYR 23029.817846
BZD 2.36217
CAD 1.617428
CDF 2631.978985
CHF 0.93526
CLF 0.027299
CLP 1070.885484
CNY 8.288974
CNH 8.27372
COP 4466.84467
CRC 587.522896
CUC 1.174991
CUP 31.137254
CVE 110.435656
CZK 24.285177
DJF 209.15766
DKK 7.470444
DOP 74.667289
DZD 152.34334
EGP 55.789738
ERN 17.624861
ETB 183.52108
FJD 2.648192
FKP 0.879185
GBP 0.877671
GEL 3.168367
GGP 0.879185
GHS 13.482835
GIP 0.879185
GMD 85.774311
GNF 10213.261358
GTQ 8.995863
GYD 245.719709
HKD 9.144171
HNL 30.922442
HRK 7.532747
HTG 153.951832
HUF 385.151393
IDR 19592.088787
ILS 3.766621
IMP 0.879185
INR 106.613135
IQD 1538.577555
IRR 49493.544354
ISK 148.41283
JEP 0.879185
JMD 188.054601
JOD 0.833059
JPY 182.086549
KES 151.515079
KGS 102.752804
KHR 4702.386633
KMF 492.911492
KPW 1057.491268
KRW 1720.480396
KWD 0.36051
KYD 0.978813
KZT 612.546565
LAK 25462.346819
LBP 105176.728999
LKR 362.920819
LRD 207.301224
LSL 19.815521
LTL 3.469442
LVL 0.710741
LYD 6.379995
MAD 10.805297
MDL 19.854766
MGA 5203.151106
MKD 61.58937
MMK 2466.617904
MNT 4166.358748
MOP 9.418054
MRU 47.004836
MUR 53.990968
MVR 18.088629
MWK 2036.690621
MXN 21.126092
MYR 4.808648
MZN 75.093803
NAD 19.815521
NGN 1705.53442
NIO 43.227904
NOK 11.911281
NPR 169.94896
NZD 2.027652
OMR 0.451782
PAB 1.174515
PEN 3.954311
PGK 5.062068
PHP 69.231624
PKR 329.162758
PLN 4.221642
PYG 7889.359242
QAR 4.280496
RON 5.094291
RSD 117.388641
RUB 92.967943
RWF 1709.478019
SAR 4.40866
SBD 9.607607
SCR 17.223335
SDG 706.756952
SEK 10.910905
SGD 1.51451
SHP 0.881547
SLE 28.346692
SLL 24638.971924
SOS 670.04968
SRD 45.293589
STD 24319.935326
STN 24.534259
SVC 10.276881
SYP 12991.498391
SZL 19.808863
THB 36.931722
TJS 10.793679
TMT 4.124217
TND 3.433491
TOP 2.829096
TRY 50.173396
TTD 7.970316
TWD 36.798371
TZS 2916.912694
UAH 49.627044
UGX 4174.450755
USD 1.174991
UYU 46.090635
UZS 14149.865707
VES 314.239221
VND 30925.755393
VUV 142.323844
WST 3.261166
XAF 656.986216
XAG 0.018396
XAU 0.000271
XCD 3.175471
XCG 2.116771
XDR 0.81708
XOF 656.986216
XPF 119.331742
YER 280.241445
ZAR 19.712468
ZMK 10576.317779
ZMW 27.102111
ZWL 378.346528
  • AEX

    5.0700

    944.66

    +0.54%

  • BEL20

    14.9600

    5001.22

    +0.3%

  • PX1

    51.6400

    8120.07

    +0.64%

  • ISEQ

    97.7600

    12961.22

    +0.76%

  • OSEBX

    4.2700

    1647.08

    +0.26%

  • PSI20

    64.0100

    8065.16

    +0.8%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -67.9300

    4286.65

    -1.56%

  • N150

    15.1500

    3710.56

    +0.41%

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence
Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence / Photo: Kirill KUDRYAVTSEV - AFP/Archives

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

Des humains l'ont programmée mais ne la comprennent pas complètement. L'intelligence artificielle (IA) générative reste un mystère, que des ingénieurs s'efforcent de percer avant que ses capacités n'explosent, pour éviter des dérapages.

Taille du texte:

"Les gens étrangers à ce milieu sont souvent surpris et alarmés d'apprendre que nous ne comprenons pas comment fonctionnent nos propres créations IA", a écrit, dans un long essai fin avril, Dario Amodei, le co-fondateur d'Anthropic, fleuron du secteur.

"Ils ont raison d'être préoccupés", a-t-il poursuivi. "Ce défaut de compréhension est sans précédent dans l'histoire de la technologie."

A la différence des programmes traditionnels, effectuant uniquement les tâches demandées, les modèles d'IA générative ne sont, en effet, qu'une rampe de lancement.

C'est "un échafaudage", selon l'expression de Chris Olah, ancien d'OpenAI aujourd'hui passé chez Anthropic et considéré comme l'un des inventeurs de la "mechanistic interpretability", qui déconstruit l'intelligence artificielle.

Cette jeune science, née au milieu des années 2010, s'attache à décrypter le cheminement qui mène d'une requête à une réponse, à travers une forêt de probabilités.

"Appréhender la totalité d'un grand modèle de langage", qui sert de base aux ChatGPT ou Gemini, "est une tâche incroyablement ambitieuse", explique à l'AFP Neel Nanda, chercheur chez DeepMind, le laboratoire d'IA de Google.

"C'est un peu comme essayer de décoder complètement le cerveau humain", selon lui, "ce que les neuroscientifiques essayent de faire depuis des décennies, sans y parvenir."

Confidentiel il y a encore quelques années, la discipline prend aujourd'hui une dimension nouvelle.

"Elle attire beaucoup nos étudiants", observe Mark Crovella, professeur d'informatique à l'université de Boston, "du fait de son potentiel à améliorer la sécurité des modèles, mais aussi parce que c'est un champ très stimulant intellectuellement."

- Tromper les humains -

Pour étudier ces phénomènes au plus près, retrace l'universitaire, la "mech interp", de son nom de code, ne se contente pas d'observer le résultat qu'offre un assistant IA à une demande.

"On observe les calculs à mesure qu'ils sont réalisés" par le programme d'IA, décrit-il.

La start-up Goodfire, en pointe sur le sujet, utilise des modèles d'interprétation, algorithmes IA à même de représenter des données sous forme d'étapes de raisonnement.

L'objectif est de saisir suffisamment bien la mécanique de l'IA générative pour la guider et corriger ses possibles errements.

Il s'agit d'empêcher les erreurs, mais aussi l'utilisation à des fins nocives ou de voir un modèle suffisamment autonome tromper les humains sur la nature de ses actions.

"Cela ressemble à une course contre la montre", situe Eric Ho, le patron de Goodfire, "avant que nous ne lancions des modèles d'IA extrêmement intelligents sans comprendre comme ils marchent."

Fin avril, Dario Amodei a fait état de "progrès récents", qui lui laissent penser que "nous sommes sur le point de trouver la clef de l'interprétabilité", au point de fixer une échéance, en 2027.

"Vu les avancées actuelles, il me semble plausible que d'ici 2027, nous disposions des outils à même de détecter, de façon fiable, les biais d'un modèle et ses intentions nocives" éventuelles, abonde Anh Nguyen, professeur à l'université d'Auburn.

Mark Crovella relève qu'à la différence du cerveau humain, "nous avons une représentation de chaque neurone dans ces modèles". "Nous pouvons voir tout ce qu'il se passe. La question, c'est comment l'interpréter."

Entrer dans le secret de l'IA générative rendrait possible, selon Dario Amodei, l'adoption de cette technologie dans des domaines où "un petit nombre d'erreurs pourrait être très préjudiciable", notamment pour ceux qui présentent des enjeux de sécurité importants.

Pour Neel Nanda, l'interprétabilité ouvrirait aussi la voie à des découvertes pour les humains, à l'instar du modèle AlphaZero de DeepMind, qui a dévoilé de nouvelles combinaisons au jeu d'échecs.

Par ailleurs, les premiers à maîtriser le raisonnement de l'IA générative pourront délivrer un label de fiabilité aux grands modèles qu'ils testeront, les rendant ainsi plus attractifs aux yeux de leurs clients potentiels.

"Il est clair pour nous, et pour Anthropic", qui a investi dans Goodfire, "que nous serons les premiers à le commercialiser", affirme Eric Ho.

Une percée américaine repositionnerait aussi les Etats-Unis en tête de la pyramide IA, position aujourd'hui contestée par la Chine.

"L'IA surpuissante va définir le destin de l'humanité", prévient Dario Amodei, "et nous devons comprendre nos propres créatures avant qu'elles ne transforment notre économie, nos vies et notre avenir."

S.Yamada--JT