The Japan Times - Les entreprises se tournent vers de l'IA moins gourmande, sur fond de flambée des coûts

EUR -
AED 4.281785
AFN 73.452334
ALL 95.429651
AMD 429.262728
ANG 2.087503
AOA 1070.299611
ARS 1646.071042
AUD 1.619085
AWG 2.098626
AZN 1.986664
BAM 1.958695
BBD 2.348401
BDT 143.127251
BGN 1.946965
BHD 0.439866
BIF 3469.728069
BMD 1.165903
BND 1.490102
BOB 8.056908
BRL 5.872776
BSD 1.165988
BTN 110.713639
BWP 15.645124
BYN 3.194922
BYR 22851.703681
BZD 2.345166
CAD 1.609005
CDF 2648.932604
CHF 0.910709
CLF 0.026367
CLP 1037.712648
CNY 7.88891
CNH 7.886595
COP 4305.843925
CRC 527.063197
CUC 1.165903
CUP 30.896436
CVE 110.615118
CZK 24.279007
DJF 207.204784
DKK 7.47393
DOP 68.019254
DZD 154.808958
EGP 61.006856
ERN 17.488549
ETB 184.21313
FJD 2.590409
FKP 0.865202
GBP 0.866681
GEL 3.113417
GGP 0.865202
GHS 13.688159
GIP 0.865202
GMD 84.532475
GNF 10236.630941
GTQ 8.894108
GYD 243.930539
HKD 9.137126
HNL 30.978502
HRK 7.532439
HTG 152.69569
HUF 353.842897
IDR 20780.651445
ILS 3.267036
IMP 0.865202
INR 110.773055
IQD 1527.333256
IRR 1575193.585016
ISK 143.359913
JEP 0.865202
JMD 183.645923
JOD 0.826672
JPY 185.738927
KES 150.879988
KGS 101.958687
KHR 4675.272437
KMF 492.011579
KPW 1049.144158
KRW 1757.506323
KWD 0.360778
KYD 0.971736
KZT 568.169776
LAK 25594.495481
LBP 104406.636357
LKR 384.788732
LRD 213.506078
LSL 18.934713
LTL 3.44261
LVL 0.705244
LYD 7.403929
MAD 10.707364
MDL 20.177824
MGA 4885.135018
MKD 61.616675
MMK 2448.448944
MNT 4174.360155
MOP 9.409465
MRU 46.636533
MUR 55.229278
MVR 17.959269
MWK 2025.174346
MXN 20.234022
MYR 4.629223
MZN 74.507092
NAD 18.934708
NGN 1599.273829
NIO 42.637521
NOK 10.78869
NPR 177.141822
NZD 1.949182
OMR 0.449196
PAB 1.166023
PEN 3.963493
PGK 5.077554
PHP 71.672781
PKR 324.762787
PLN 4.231005
PYG 7015.36898
QAR 4.245098
RON 5.251349
RSD 117.38435
RUB 82.95033
RWF 1705.133502
SAR 4.398141
SBD 9.365071
SCR 15.781711
SDG 700.129187
SEK 10.790487
SGD 1.48863
SHP 0.870465
SLE 28.685495
SLL 24448.410635
SOS 666.317977
SRD 43.337211
STD 24131.843306
STN 24.95033
SVC 10.202905
SYP 128.869732
SZL 18.934699
THB 37.979343
TJS 10.762507
TMT 4.080661
TND 3.374168
TOP 2.807215
TRY 53.459583
TTD 7.920707
TWD 36.640613
TZS 3065.839407
UAH 51.641442
UGX 4395.364568
USD 1.165903
UYU 46.767721
UZS 14017.076029
VES 639.713683
VND 30677.82924
VUV 137.641842
WST 3.165657
XAF 656.927964
XAG 0.015488
XAU 0.000257
XCD 3.150912
XCG 2.101443
XDR 0.815557
XOF 655.824767
XPF 119.331742
YER 278.188699
ZAR 19.000364
ZMK 10494.532504
ZMW 21.432678
ZWL 375.42037
  • AEX

    -2.2800

    1034.93

    -0.22%

  • BEL20

    -19.6100

    5583.39

    -0.35%

  • PX1

    -5.7300

    8183.34

    -0.07%

  • ISEQ

    94.4100

    13206.81

    +0.72%

  • OSEBX

    -15.5200

    2000.29

    -0.77%

  • PSI20

    -10.9000

    9076.53

    -0.12%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -13.1100

    4215.46

    -0.31%

  • N150

    -6.0100

    4284.26

    -0.14%

Les entreprises se tournent vers de l'IA moins gourmande, sur fond de flambée des coûts
Les entreprises se tournent vers de l'IA moins gourmande, sur fond de flambée des coûts / Photo: Kirill KUDRYAVTSEV - AFP/Archives

Les entreprises se tournent vers de l'IA moins gourmande, sur fond de flambée des coûts

L'émergence des agents d'intelligence artificielle (IA) a fait exploser la facture IA de bon nombre d'entreprises, qui se tournent vers des modèles moins coûteux pour ne pas rogner sur leur consommation.

Taille du texte:

Finie, l'ère de "l'intelligence subventionnée" - selon l'expression de Kevin Simback, de l'incubateur Delphi Labs - née avec ChatGPT et la déferlante de l'IA générative.

Pour favoriser l'adoption de cette nouvelle technologie, les grands acteurs du secteur, OpenAI en tête, ont proposé initialement des tarifs très attractifs, au point que leur activité était déficitaire.

"Mais le vent est en train de tourner", prévient Kevin Simback.

Chacun à leur tour, les poids lourds de l'IA ont récemment revu leurs prix pour les ajuster à l'utilisation réelle des capacités informatiques nécessaires pour faire tourner les modèles.

L'avènement des agents IA, des programmes capables d'effectuer des tâches et plus seulement de donner des réponses, a, en outre, fait bondir le recours aux infrastructures informatiques.

Pour une même mission, l'interface peut se démultiplier en plusieurs agents, chacun avec sa feuille de route, le tout assemblé et vérifié par d'autres agents.

A l'arrivée, le nombre de "tokens", unité de référence pour mesurer le résultat produit par l'IA, peut représenter des dizaines de fois celui correspondant à une simple question à ChatGPT.

Le tout s'inscrit dans une période de déséquilibre. Les centres de données et les fabricants de puces ne parviennent pas à suivre le rythme effréné de la demande d'intelligence artificielle, ce qui renchérit l'accès aux infrastructures.

"En particulier chez les développeurs, le coût d'utilisation de l'IA pour la programmation s'est accru de façon exponentielle", observe Mark Barton, de la société d'accompagnement numérique Omniux.

Par extension, pour tous les modèles de référence du marché, "les prix commencent à s'envoler", insiste-t-il.

Face à ce nouveau paradigme, certains questionnent le déploiement à tout crin de l'IA, tels l'enseigne de grande distribution Target, Starbucks ou Uber.

"Dans certains cas, le coût dépasse celui d'un employé au bout d'un mois ou deux parce qu'ils l'utilisent trop", décrit Jack Gold, président du cabinet J.Gold Associates.

- Pas d'IA "sans raison" -

Pourtant sacré, en début d'année, champion du "tokenmaxxing", mouvement qui glorifie la dépense maximale de "tokens" comme mètre étalon de productivité des employés, Meta a récemment mis le hola.

"Personne ne devrait recourir à des outils IA sans raison", a ainsi écrit le responsable technologique du groupe, Andrew Bosworth, dans un mémo interne relayé par le Wall Street Journal.

Mais si le discernement est désormais de mise, la plupart des sociétés cherchent surtout à accéder à une IA moins onéreuse, en recourant à des modèles moins performants que les fleurons du secteur.

Dans ce contexte, la popularité des modèles dits "open weights", téléchargeables gratuitement, est croissante, leur usage ne nécessitant que l'achat de puissance de calcul.

Les entreprises se tournent aussi vers des modèles de plus petite taille, les SLM (small language models) en lieu et place des LLM, qui servent de base à ChatGPT, Claude ou Gemini.

Ces SLM peuvent parfois tourner sur les serveurs locaux ou même directement sur l'ordinateur, une option plus économique car elle évite de payer un fournisseur de capacité à distance (cloud).

Il est aussi possible de scinder une demande unique (prompt) en étapes distinctes pour les confier, à chaque fois, à l'interface adaptée, explique Adrian Balfour, du cabinet de conseil numérique Enverso.

"Quand vous passez par un grand modèle monolithique, vous en aurez à peu près pour 15 dollars le million de +tokens+ alors qu'en prenant des mini-modèles, vous ferez descendre le tout à 5 cents", assure-t-il.

Beaucoup voient dans cette refonte la première étape de la banalisation des modèles, devenus interchangeables sans déperdition.

Dès lors, ce sont les plateformes de sélection et de coordination des modèles et des agents qui prennent de l'importance, selon John Belton, gérant au sein de la société d'investissement Gabelli Funds.

Sur ce créneau, des start-up se battent avec des mastodontes du "cloud" comme Amazon, qui propose déjà de jongler avec une multitude d'IA via sa plateforme Bedrock, mais aussi les géniteurs de l'intelligence artificielle eux-mêmes.

Anthropic dispose ainsi d'une gamme complète de modèles, dont Haiku, l'option la plus économique, à l'instar d'OpenAI et de Google.

John Belton ne voit d'ailleurs pas ces étoiles de l'IA perdre des parts de marché à mesure que les clients cherchent l'efficacité plutôt que la performance.

"Les utilisateurs les plus avancés seront toujours prêts à payer" pour ce qui se fait de mieux, prévoit-il. "Le gâteau ne fait que grossir."

S.Yamada--JT