The Japan Times - L'avenir incertain de la lecture humaine dans le livre audio

EUR -
AED 4.356047
AFN 77.098481
ALL 96.578527
AMD 452.626632
ANG 2.123261
AOA 1087.678352
ARS 1715.600908
AUD 1.704695
AWG 2.137993
AZN 1.999161
BAM 1.954172
BBD 2.404706
BDT 145.89842
BGN 1.991946
BHD 0.447184
BIF 3537.212006
BMD 1.186127
BND 1.512065
BOB 8.250125
BRL 6.229061
BSD 1.193769
BTN 109.639559
BWP 15.620206
BYN 3.400581
BYR 23248.08086
BZD 2.401209
CAD 1.617438
CDF 2686.576759
CHF 0.919966
CLF 0.026042
CLP 1028.620629
CNY 8.245655
CNH 8.233
COP 4365.432106
CRC 591.217294
CUC 1.186127
CUP 31.432354
CVE 110.173654
CZK 24.292224
DJF 212.603729
DKK 7.469413
DOP 75.168628
DZD 153.797369
EGP 55.865719
ERN 17.791899
ETB 185.472969
FJD 2.643523
FKP 0.865581
GBP 0.865748
GEL 3.196593
GGP 0.865581
GHS 13.079156
GIP 0.865581
GMD 86.586829
GNF 10476.446395
GTQ 9.157446
GYD 249.783955
HKD 9.263957
HNL 31.513271
HRK 7.530128
HTG 156.252426
HUF 380.977331
IDR 19896.087161
ILS 3.678244
IMP 0.865581
INR 108.546592
IQD 1564.096604
IRR 49965.582138
ISK 145.003895
JEP 0.865581
JMD 187.097242
JOD 0.840975
JPY 183.613613
KES 153.010627
KGS 103.726642
KHR 4801.080108
KMF 492.242217
KPW 1067.513917
KRW 1719.521766
KWD 0.364259
KYD 0.994962
KZT 600.464557
LAK 25693.805403
LBP 106915.75543
LKR 369.223874
LRD 215.202481
LSL 18.957162
LTL 3.502324
LVL 0.717476
LYD 7.491789
MAD 10.829975
MDL 20.081435
MGA 5335.576238
MKD 61.632744
MMK 2490.84975
MNT 4228.096728
MOP 9.600999
MRU 47.638105
MUR 54.146602
MVR 18.337513
MWK 2070.283514
MXN 20.610384
MYR 4.675664
MZN 75.627679
NAD 18.956843
NGN 1655.726718
NIO 43.93413
NOK 11.465076
NPR 175.424773
NZD 1.97085
OMR 0.455869
PAB 1.193905
PEN 3.991774
PGK 5.110849
PHP 69.833205
PKR 333.990265
PLN 4.218222
PYG 7997.369327
QAR 4.352991
RON 5.095554
RSD 117.395701
RUB 90.860355
RWF 1741.992418
SAR 4.448418
SBD 9.550233
SCR 17.126513
SDG 713.488038
SEK 10.583212
SGD 1.506975
SHP 0.889902
SLE 28.852557
SLL 24872.480335
SOS 682.342894
SRD 45.132709
STD 24550.425312
STN 24.480116
SVC 10.446207
SYP 13118.055685
SZL 18.949053
THB 37.482821
TJS 11.145306
TMT 4.151443
TND 3.430356
TOP 2.855908
TRY 51.566909
TTD 8.106279
TWD 37.45728
TZS 3061.380922
UAH 51.171573
UGX 4268.46099
USD 1.186127
UYU 46.331976
UZS 14595.836966
VES 410.330299
VND 30863.013469
VUV 141.334941
WST 3.215329
XAF 655.427395
XAG 0.014439
XAU 0.00025
XCD 3.205566
XCG 2.151707
XDR 0.815124
XOF 655.413592
XPF 119.331742
YER 282.683658
ZAR 18.992887
ZMK 10676.554577
ZMW 23.430574
ZWL 381.932273
  • AEX

    6.5100

    1008.21

    +0.65%

  • BEL20

    66.7800

    5452.24

    +1.24%

  • PX1

    62.5700

    8188.98

    +0.77%

  • ISEQ

    169.6100

    13317.57

    +1.29%

  • OSEBX

    -3.1700

    1757.17

    -0.18%

  • PSI20

    38.9800

    8701.07

    +0.45%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -39.8700

    4028.03

    -0.98%

  • N150

    15.3300

    3945.82

    +0.39%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: Thomas SAMSON - AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

K.Okada--JT