The Japan Times - L'avenir incertain de la lecture humaine dans le livre audio

EUR -
AED 4.301814
AFN 77.708293
ALL 96.176014
AMD 446.924892
ANG 2.097203
AOA 1074.135394
ARS 1698.74032
AUD 1.770078
AWG 2.108444
AZN 1.991912
BAM 1.950236
BBD 2.36247
BDT 143.341038
BGN 1.955079
BHD 0.441654
BIF 3477.877376
BMD 1.171358
BND 1.512285
BOB 8.104876
BRL 6.444114
BSD 1.172958
BTN 106.59388
BWP 15.491801
BYN 3.437408
BYR 22958.617481
BZD 2.359079
CAD 1.615232
CDF 2635.555553
CHF 0.933339
CLF 0.027334
CLP 1072.249192
CNY 8.248644
CNH 8.245095
COP 4499.162784
CRC 585.330013
CUC 1.171358
CUP 31.040988
CVE 109.951301
CZK 24.352124
DJF 208.874957
DKK 7.471771
DOP 75.364979
DZD 151.627638
EGP 55.766478
ERN 17.570371
ETB 182.088389
FJD 2.670112
FKP 0.872551
GBP 0.87877
GEL 3.15685
GGP 0.872551
GHS 13.489513
GIP 0.872551
GMD 86.100851
GNF 10199.898985
GTQ 8.982373
GYD 245.399857
HKD 9.112316
HNL 30.903829
HRK 7.536638
HTG 153.611735
HUF 387.432543
IDR 19557.696563
ILS 3.773032
IMP 0.872551
INR 105.882157
IQD 1536.622469
IRR 49340.51376
ISK 148.001104
JEP 0.872551
JMD 188.262873
JOD 0.830488
JPY 182.223503
KES 151.004694
KGS 102.43541
KHR 4696.600275
KMF 491.969805
KPW 1054.235599
KRW 1732.367947
KWD 0.359502
KYD 0.977515
KZT 604.617565
LAK 25412.604561
LBP 105039.563247
LKR 363.105585
LRD 207.617653
LSL 19.697785
LTL 3.458716
LVL 0.708543
LYD 6.354896
MAD 10.733975
MDL 19.752728
MGA 5298.881924
MKD 61.532571
MMK 2460.108883
MNT 4156.475757
MOP 9.398924
MRU 46.520274
MUR 53.941062
MVR 18.050801
MWK 2033.897151
MXN 21.056371
MYR 4.7891
MZN 74.861814
NAD 19.697785
NGN 1705.356781
NIO 43.166842
NOK 11.969757
NPR 170.550408
NZD 2.028622
OMR 0.450384
PAB 1.172953
PEN 3.951227
PGK 4.986772
PHP 68.718886
PKR 328.725128
PLN 4.214535
PYG 7878.555568
QAR 4.276698
RON 5.092357
RSD 117.397841
RUB 94.202038
RWF 1707.82745
SAR 4.39328
SBD 9.562266
SCR 15.804605
SDG 704.56838
SEK 10.937063
SGD 1.513547
SHP 0.878822
SLE 27.872113
SLL 24562.796602
SOS 670.387339
SRD 45.305812
STD 24244.746356
STN 24.430299
SVC 10.263761
SYP 12951.888916
SZL 19.680933
THB 36.933012
TJS 10.779545
TMT 4.111467
TND 3.425327
TOP 2.820349
TRY 50.041619
TTD 7.957331
TWD 36.794115
TZS 2900.810779
UAH 49.466868
UGX 4176.08534
USD 1.171358
UYU 45.889075
UZS 14222.422448
VES 320.06667
VND 30847.713845
VUV 142.118205
WST 3.269295
XAF 654.090834
XAG 0.017758
XAU 0.000271
XCD 3.165653
XCG 2.113978
XDR 0.813479
XOF 654.093618
XPF 119.331742
YER 279.193074
ZAR 19.608123
ZMK 10543.631377
ZMW 26.949227
ZWL 377.176809
  • AEX

    4.5800

    939.73

    +0.49%

  • BEL20

    29.5600

    5040.28

    +0.59%

  • PX1

    -24.3200

    8081.71

    -0.3%

  • ISEQ

    -22.1000

    12976.57

    -0.17%

  • OSEBX

    16.2000

    1652.14

    +0.99%

  • PSI20

    31.4400

    8093.79

    +0.39%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -47.1300

    4087.06

    -1.14%

  • N150

    2.9600

    3701.68

    +0.08%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: Thomas SAMSON - AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

K.Okada--JT