The Japan Times - L'avenir incertain de la lecture humaine dans le livre audio

EUR -
AED 4.276798
AFN 76.973093
ALL 96.541337
AMD 443.660189
ANG 2.0846
AOA 1067.888653
ARS 1669.958677
AUD 1.752514
AWG 2.096182
AZN 1.984351
BAM 1.955625
BBD 2.34549
BDT 142.477215
BGN 1.956439
BHD 0.438161
BIF 3440.791247
BMD 1.164546
BND 1.508565
BOB 8.047278
BRL 6.334667
BSD 1.164496
BTN 104.702605
BWP 15.471612
BYN 3.348
BYR 22825.091832
BZD 2.34209
CAD 1.610159
CDF 2599.265981
CHF 0.936209
CLF 0.027366
CLP 1073.571668
CNY 8.233458
CNH 8.232219
COP 4424.302993
CRC 568.848955
CUC 1.164546
CUP 30.860456
CVE 110.255106
CZK 24.203336
DJF 207.371392
DKK 7.470448
DOP 74.533312
DZD 151.068444
EGP 55.295038
ERN 17.468183
ETB 180.629892
FJD 2.632397
FKP 0.873977
GBP 0.872678
GEL 3.138497
GGP 0.873977
GHS 13.246811
GIP 0.873977
GMD 85.012236
GNF 10119.091982
GTQ 8.9202
GYD 243.638138
HKD 9.065875
HNL 30.671248
HRK 7.535429
HTG 152.446321
HUF 381.994667
IDR 19435.740377
ILS 3.768132
IMP 0.873977
INR 104.760771
IQD 1525.563106
IRR 49041.926882
ISK 149.038983
JEP 0.873977
JMD 186.393274
JOD 0.825709
JPY 180.924237
KES 150.636483
KGS 101.839952
KHR 4662.581612
KMF 491.43861
KPW 1048.137083
KRW 1716.311573
KWD 0.357481
KYD 0.970513
KZT 588.927154
LAK 25252.733992
LBP 104283.942272
LKR 359.197768
LRD 204.961608
LSL 19.736529
LTL 3.438601
LVL 0.704422
LYD 6.330432
MAD 10.755735
MDL 19.814222
MGA 5194.533878
MKD 61.634469
MMK 2445.172268
MNT 4132.506664
MOP 9.338362
MRU 46.438833
MUR 53.651052
MVR 17.938355
MWK 2019.3188
MXN 21.165153
MYR 4.787492
MZN 74.426542
NAD 19.736529
NGN 1688.68458
NIO 42.856154
NOK 11.767853
NPR 167.523968
NZD 2.015483
OMR 0.44694
PAB 1.164595
PEN 3.914449
PGK 4.941557
PHP 68.66747
PKR 326.476804
PLN 4.229804
PYG 8009.281302
QAR 4.244719
RON 5.092096
RSD 117.389466
RUB 89.441974
RWF 1694.347961
SAR 4.370508
SBD 9.584899
SCR 15.747587
SDG 700.4784
SEK 10.946786
SGD 1.508673
SHP 0.873711
SLE 27.603998
SLL 24419.93473
SOS 664.340387
SRD 44.985272
STD 24103.740676
STN 24.497802
SVC 10.190086
SYP 12876.900539
SZL 19.72123
THB 37.119932
TJS 10.684641
TMT 4.087555
TND 3.416093
TOP 2.803946
TRY 49.523506
TTD 7.894292
TWD 36.437508
TZS 2841.64501
UAH 48.888813
UGX 4119.630333
USD 1.164546
UYU 45.545913
UZS 13931.74986
VES 296.437311
VND 30697.419423
VUV 142.156724
WST 3.247609
XAF 655.898144
XAG 0.019964
XAU 0.000277
XCD 3.147243
XCG 2.098812
XDR 0.815727
XOF 655.898144
XPF 119.331742
YER 277.802752
ZAR 19.711451
ZMK 10482.311144
ZMW 26.923584
ZWL 374.983176
  • AEX

    -0.2800

    947.5

    -0.03%

  • BEL20

    16.5400

    5029.74

    +0.33%

  • PX1

    -7.3100

    8114.74

    -0.09%

  • ISEQ

    -5.1000

    12741.69

    -0.04%

  • OSEBX

    7.1500

    1632.45

    +0.44%

  • PSI20

    -40.3700

    8198.25

    -0.49%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -87.0000

    4263

    -2%

  • N150

    13.5900

    3685.24

    +0.37%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: Thomas SAMSON - AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

K.Okada--JT