The Japan Times - Pour grandir, l'IA générative se tourne vers les livres

EUR -
AED 4.255899
AFN 72.432944
ALL 95.975736
AMD 435.816867
ANG 2.074448
AOA 1062.670738
ARS 1619.00736
AUD 1.664418
AWG 2.08594
AZN 1.965411
BAM 1.956316
BBD 2.328224
BDT 141.837422
BGN 1.980843
BHD 0.437657
BIF 3428.619402
BMD 1.158856
BND 1.478997
BOB 7.988142
BRL 6.101215
BSD 1.15601
BTN 108.040972
BWP 15.796236
BYN 3.442123
BYR 22713.57276
BZD 2.324923
CAD 1.593809
CDF 2634.079447
CHF 0.912802
CLF 0.026896
CLP 1062.021594
CNY 7.973508
CNH 7.993474
COP 4302.147686
CRC 539.144574
CUC 1.158856
CUP 30.709677
CVE 110.294576
CZK 24.480538
DJF 205.855201
DKK 7.471357
DOP 68.598395
DZD 153.754179
EGP 61.083375
ERN 17.382836
ETB 180.492
FJD 2.575846
FKP 0.865723
GBP 0.865196
GEL 3.146334
GGP 0.865723
GHS 12.646391
GIP 0.865723
GMD 84.596598
GNF 10132.71714
GTQ 8.854374
GYD 241.844852
HKD 9.068017
HNL 30.597205
HRK 7.534884
HTG 151.410602
HUF 390.142677
IDR 19561.832769
ILS 3.618985
IMP 0.865723
INR 108.642205
IQD 1514.39956
IRR 1523953.258404
ISK 143.790433
JEP 0.865723
JMD 182.078825
JOD 0.821607
JPY 183.961977
KES 150.191349
KGS 101.3402
KHR 4632.242159
KMF 492.513609
KPW 1042.936742
KRW 1735.867428
KWD 0.35505
KYD 0.96335
KZT 557.168924
LAK 24847.663027
LBP 103523.360316
LKR 363.007342
LRD 211.546727
LSL 19.601456
LTL 3.4218
LVL 0.70098
LYD 7.399984
MAD 10.804997
MDL 20.218422
MGA 4811.290172
MKD 61.619088
MMK 2433.167084
MNT 4135.923012
MOP 9.326861
MRU 46.146374
MUR 53.891919
MVR 17.904411
MWK 2004.13742
MXN 20.722312
MYR 4.585017
MZN 74.062945
NAD 19.59968
NGN 1592.476153
NIO 42.541408
NOK 11.233374
NPR 172.865355
NZD 1.98862
OMR 0.445586
PAB 1.15601
PEN 4.021461
PGK 4.991338
PHP 69.408484
PKR 322.693232
PLN 4.27397
PYG 7554.02565
QAR 4.227234
RON 5.094316
RSD 117.444213
RUB 93.641229
RWF 1690.053196
SAR 4.350082
SBD 9.330779
SCR 16.087553
SDG 696.472444
SEK 10.811603
SGD 1.483057
SHP 0.869442
SLE 28.449668
SLL 24300.638259
SOS 660.677164
SRD 43.267618
STD 23985.974368
STN 24.506572
SVC 10.114625
SYP 128.606968
SZL 19.594254
THB 37.747988
TJS 11.045462
TMT 4.055995
TND 3.406714
TOP 2.790246
TRY 51.392106
TTD 7.847393
TWD 37.073181
TZS 2978.258958
UAH 50.757111
UGX 4364.170274
USD 1.158856
UYU 47.102631
UZS 14093.718494
VES 529.022698
VND 30543.961084
VUV 138.434854
WST 3.185549
XAF 656.132945
XAG 0.016646
XAU 0.000263
XCD 3.131866
XCG 2.083341
XDR 0.816019
XOF 656.132945
XPF 119.331742
YER 276.560932
ZAR 19.76266
ZMK 10431.128864
ZMW 22.397006
ZWL 373.15108
  • AEX

    4.2500

    970.97

    +0.44%

  • BEL20

    -2.4700

    4937.51

    -0.05%

  • PX1

    -27.8100

    7698.41

    -0.36%

  • ISEQ

    -26.6000

    12062.77

    -0.22%

  • OSEBX

    -1.1700

    1947.59

    -0.06%

  • PSI20

    47.4000

    8825.78

    +0.54%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -33.0800

    3601.94

    -0.91%

  • N150

    6.7700

    3766.8

    +0.18%

Pour grandir, l'IA générative se tourne vers les livres
Pour grandir, l'IA générative se tourne vers les livres / Photo: Kirill KUDRYAVTSEV - AFP/Archives

Pour grandir, l'IA générative se tourne vers les livres

Préserver les droits d'auteurs en négociant avec les plateformes: confronté aux besoins toujours plus grands de l'intelligence artificielle générative, le monde de l'édition commence lui aussi à passer des contrats avec ses acteurs pour monnayer ses contenus.

Taille du texte:

Le grand éditeur américain HarperCollins vient de proposer à certains de ses auteurs un contrat avec une société d'intelligence artificielle (IA) - dont l'identité est confidentielle - permettant à cette dernière d'utiliser leurs œuvres publiées pour entraîner son modèle d'intelligence artificielle générative.

Dans un courrier consulté par l'AFP, l'entreprise d'IA propose 2.500 dollars par livre sélectionné afin d'entraîner son modèle de langage (LLM) pour une période de trois ans.

Car pour pouvoir produire toutes sortes de contenus sur simple requête en langage courant, les modèles d'IA générative ont besoin d'être nourris d'une quantité de données sans cesse croissante.

Contacté, l'éditeur a confirmé l'opération. "HarperCollins a conclu un accord avec une société de technologie d'intelligence artificielle pour autoriser l'utilisation limitée de certains titres (...) pour entraîner des modèles d'IA, afin d'améliorer la qualité et les performances des modèles", écrit-il.

La maison d'édition explique également que l'accord "encadre clairement la production de modèles respectueux des droits d'auteur".

L'offre a toutefois été diversement appréciée dans le secteur de l'édition, et des écrivains comme l'Américain Daniel Kibblesmith l'ont sèchement déclinée: "je le ferais probablement pour un milliard de dollars. Je le ferais pour une somme d'argent qui ne me demanderait plus de travailler, puisque c'est le but final de cette technologie", s'est indigné l'auteur sur le réseau social Bluesky.

- Nouveaux matériaux -

Si HarperCollins est l'un des plus gros éditeurs à ce jour à passer ce type d'accord, il n'est pas le premier. L'éditeur américain de livres scientifiques Wiley a donné accès "au contenu de livres académiques et professionnels publiés pour une utilisation spécifique dans la formation des modèles, pour 23 millions de dollars, à une grande entreprise technologique", indiquait-il en mars cette année, lors de la présentation de ses résultats financiers.

Ce type de collaboration met en lumière les problèmes liés au développement des intelligences artificielles génératives, qui sont entraînées sur d'immenses quantités de données collectées sur le web avec, à la clef, de potentielles violations des droit d'auteurs.

Pour Giada Pistilli, responsable de l'éthique chez Hugging Face, une plateforme d'IA en accès libre franco-américaine, cette annonce est un pas en avant, puisque le contenu des livres est monétisé. Mais elle regrette une marge de négociation limitée pour les auteurs.

"Ce que l'on va voir, c'est un mécanisme d'accords bilatéraux entre entreprises de nouvelles technologies et éditeurs ou détenteurs de droits d'auteur, alors qu'il faudrait, à mon sens, une conversation plus large pour inclure un peu plus les parties prenantes", dit-elle.

"On part de tellement loin", commente de son côté Julien Chouraqui, le directeur juridique du syndicat français de l'édition (SNE). "C'est un progrès: le fait qu'il y ait un accord signifie qu'il y a eu un dialogue et une volonté d'aboutir à un équilibre entre l'utilisation de données sources, qui sont sous droit et qui vont générer de la valeur", dit-il.

Face à ces questions, les éditeurs de presse sont eux aussi en train de s'organiser. Fin 2023, le quotidien américain The New York Times a lancé des poursuites à l'encontre d'OpenAI, créateur du logiciel ChatGPT, ainsi que de Microsoft, son principal investisseur, pour violation des droits d'auteur. D'autres médias ont, eux, noué des accords avec OpenAI.

Les entreprises de la tech n'ont peut-être plus le choix pour améliorer leurs produits que de mettre la main au portefeuille, d'autant qu'elles commencent à manquer de nouveaux matériaux pour alimenter les modèles.

La presse américaine a récemment rapporté que les nouveaux modèles en développement semblent avoir atteint leurs limites, notamment chez Google, Anthropic et OpenAI.

"Sur le net, vous récoltez du licite et de l'illicite, et beaucoup de contenus piratés. Cela pose un problème juridique. Sans oublier le problème de qualité des données", observe Julien Chouraqui, du SNE: "si on a à cœur le développement d'un marché sur des bases vertueuses, il faut donc associer l'ensemble des acteurs."

K.Abe--JT