The Japan Times - L'avenir incertain de la lecture humaine dans le livre audio

EUR -
AED 4.288202
AFN 72.394561
ALL 95.253302
AMD 430.605975
ANG 2.090632
AOA 1071.903393
ARS 1628.859035
AUD 1.616282
AWG 2.103231
AZN 1.987433
BAM 1.950773
BBD 2.352228
BDT 143.359938
BGN 1.949883
BHD 0.440455
BIF 3477.024586
BMD 1.167651
BND 1.487036
BOB 8.070099
BRL 5.847945
BSD 1.167885
BTN 111.902225
BWP 16.449397
BYN 3.262808
BYR 22885.957359
BZD 2.348787
CAD 1.603751
CDF 2616.705908
CHF 0.914609
CLF 0.026418
CLP 1039.73484
CNY 7.929459
CNH 7.92292
COP 4434.691358
CRC 530.711867
CUC 1.167651
CUP 30.942748
CVE 109.975464
CZK 24.310604
DJF 207.963174
DKK 7.472861
DOP 69.221611
DZD 154.771984
EGP 61.744563
ERN 17.514763
ETB 182.344098
FJD 2.556219
FKP 0.863701
GBP 0.866134
GEL 3.128944
GGP 0.863701
GHS 13.260656
GIP 0.863701
GMD 85.2381
GNF 10240.346841
GTQ 8.910038
GYD 244.327214
HKD 9.145585
HNL 31.058959
HRK 7.527616
HTG 152.929995
HUF 357.243954
IDR 20470.262824
ILS 3.389226
IMP 0.863701
INR 111.621618
IQD 1529.857455
IRR 1533125.612722
ISK 143.609314
JEP 0.863701
JMD 184.654134
JOD 0.82792
JPY 184.682089
KES 150.802256
KGS 102.110928
KHR 4685.964089
KMF 491.581018
KPW 1050.851539
KRW 1742.263837
KWD 0.359952
KYD 0.973288
KZT 552.822971
LAK 25599.480331
LBP 104581.044182
LKR 379.861073
LRD 213.718318
LSL 19.170895
LTL 3.44777
LVL 0.7063
LYD 7.412896
MAD 10.714612
MDL 20.075007
MGA 4891.290094
MKD 61.542796
MMK 2451.909298
MNT 4180.34222
MOP 9.422197
MRU 46.668732
MUR 54.755716
MVR 17.993465
MWK 2024.673611
MXN 20.110872
MYR 4.590616
MZN 74.615687
NAD 19.170895
NGN 1600.545488
NIO 42.979056
NOK 10.786523
NPR 179.039171
NZD 1.972092
OMR 0.448961
PAB 1.167865
PEN 3.991796
PGK 5.087758
PHP 71.877129
PKR 325.279732
PLN 4.23986
PYG 7116.659892
QAR 4.25712
RON 5.203982
RSD 117.381089
RUB 85.534778
RWF 1708.175973
SAR 4.389286
SBD 9.378873
SCR 15.920493
SDG 701.171987
SEK 10.914442
SGD 1.488539
SHP 0.871769
SLE 28.721139
SLL 24485.057705
SOS 667.448502
SRD 43.429655
STD 24168.015855
STN 24.43692
SVC 10.218404
SYP 129.058973
SZL 19.15655
THB 37.808599
TJS 10.913535
TMT 4.098455
TND 3.402731
TOP 2.811423
TRY 53.052533
TTD 7.929362
TWD 36.807928
TZS 3037.52743
UAH 51.339537
UGX 4367.632104
USD 1.167651
UYU 46.508948
UZS 14002.554719
VES 593.242161
VND 30761.762583
VUV 137.873483
WST 3.162607
XAF 654.256928
XAG 0.013797
XAU 0.000249
XCD 3.155634
XCG 2.104767
XDR 0.811481
XOF 654.254134
XPF 119.331742
YER 278.630658
ZAR 19.235416
ZMK 10510.256279
ZMW 21.984309
ZWL 375.983109
  • AEX

    11.4100

    1021.54

    +1.13%

  • BEL20

    23.6900

    5532.41

    +0.43%

  • PX1

    74.4700

    8082.27

    +0.93%

  • ISEQ

    53.8800

    12585.15

    +0.43%

  • OSEBX

    1.5900

    1985.91

    +0.08%

  • PSI20

    51.7100

    9124.26

    +0.57%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    31.5800

    4133.29

    +0.77%

  • N150

    24.3700

    4226.84

    +0.58%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: Thomas SAMSON - AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

K.Okada--JT