The Japan Times - L'avenir incertain de la lecture humaine dans le livre audio

EUR -
AED 4.262927
AFN 72.54755
ALL 95.959794
AMD 436.717019
ANG 2.077873
AOA 1064.424836
ARS 1622.137154
AUD 1.662111
AWG 2.091995
AZN 2.004721
BAM 1.954956
BBD 2.333222
BDT 142.148604
BGN 1.984112
BHD 0.438264
BIF 3440.584323
BMD 1.160769
BND 1.482247
BOB 8.022569
BRL 6.082893
BSD 1.158415
BTN 108.54552
BWP 15.873076
BYN 3.429519
BYR 22751.0655
BZD 2.329924
CAD 1.600253
CDF 2643.647486
CHF 0.915997
CLF 0.026983
CLP 1065.422754
CNY 8.000826
CNH 8.008369
COP 4300.90321
CRC 539.750599
CUC 1.160769
CUP 30.760369
CVE 110.218819
CZK 24.429525
DJF 206.293565
DKK 7.472605
DOP 69.397934
DZD 153.768196
EGP 61.05376
ERN 17.41153
ETB 179.082352
FJD 2.600412
FKP 0.867356
GBP 0.865614
GEL 3.139818
GGP 0.867356
GHS 12.656588
GIP 0.867356
GMD 85.317477
GNF 10153.527079
GTQ 8.871283
GYD 242.442153
HKD 9.077971
HNL 30.674826
HRK 7.534082
HTG 151.893087
HUF 389.158713
IDR 19615.829382
ILS 3.619683
IMP 0.867356
INR 109.005347
IQD 1517.544552
IRR 1524118.253951
ISK 143.807703
JEP 0.867356
JMD 182.805532
JOD 0.822981
JPY 184.283367
KES 150.423575
KGS 101.507475
KHR 4648.952003
KMF 494.487173
KPW 1044.708436
KRW 1740.351532
KWD 0.355532
KYD 0.965383
KZT 559.238457
LAK 24941.227539
LBP 103744.091493
LKR 364.132726
LRD 212.58093
LSL 19.74907
LTL 3.427448
LVL 0.702138
LYD 7.385905
MAD 10.799496
MDL 20.261249
MGA 4836.806744
MKD 61.595926
MMK 2437.808692
MNT 4143.326649
MOP 9.335668
MRU 46.201652
MUR 53.929436
MVR 17.945125
MWK 2008.689157
MXN 20.558254
MYR 4.595472
MZN 74.184822
NAD 19.74907
NGN 1598.865618
NIO 42.63122
NOK 11.249717
NPR 173.665755
NZD 1.990939
OMR 0.446317
PAB 1.158405
PEN 4.006969
PGK 5.002796
PHP 69.723855
PKR 323.646095
PLN 4.269934
PYG 7558.832914
QAR 4.22443
RON 5.094378
RSD 117.432673
RUB 93.727216
RWF 1694.716928
SAR 4.354927
SBD 9.334872
SCR 15.983903
SDG 697.621937
SEK 10.794336
SGD 1.484176
SHP 0.870877
SLE 28.552994
SLL 24340.75073
SOS 661.994115
SRD 43.34301
STD 24025.56743
STN 24.489212
SVC 10.136622
SYP 128.785259
SZL 19.747386
THB 37.859641
TJS 11.115443
TMT 4.074298
TND 3.397876
TOP 2.794852
TRY 51.487403
TTD 7.870601
TWD 37.092332
TZS 2986.14584
UAH 50.87563
UGX 4338.070269
USD 1.160769
UYU 47.210219
UZS 14132.895807
VES 532.651381
VND 30586.253874
VUV 138.721223
WST 3.178418
XAF 655.65969
XAG 0.015829
XAU 0.000254
XCD 3.137035
XCG 2.087798
XDR 0.81543
XOF 655.682275
XPF 119.331742
YER 276.941074
ZAR 19.57688
ZMK 10448.311343
ZMW 21.923814
ZWL 373.767031
  • AEX

    11.9800

    986.21

    +1.23%

  • BEL20

    100.8700

    5045.72

    +2.04%

  • PX1

    133.1900

    7876.83

    +1.72%

  • ISEQ

    354.4200

    12450.53

    +2.93%

  • OSEBX

    10.3700

    1966.61

    +0.53%

  • PSI20

    70.1700

    8952.26

    +0.79%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -57.9900

    3544.03

    -1.61%

  • N150

    61.2800

    3843.85

    +1.62%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: Thomas SAMSON - AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

K.Okada--JT