The Japan Times - La diversidad del español, enloquecedora para la inteligencia artificial

EUR -
AED 4.331023
AFN 77.824044
ALL 96.204991
AMD 446.932449
ANG 2.110769
AOA 1081.2786
ARS 1712.071881
AUD 1.697104
AWG 2.122466
AZN 2.007924
BAM 1.945772
BBD 2.377447
BDT 144.365962
BGN 1.980226
BHD 0.444554
BIF 3495.583857
BMD 1.179148
BND 1.499385
BOB 8.186157
BRL 6.208092
BSD 1.180416
BTN 107.944132
BWP 15.536586
BYN 3.37998
BYR 23111.298228
BZD 2.373975
CAD 1.614548
CDF 2541.063785
CHF 0.92033
CLF 0.025849
CLP 1020.682673
CNY 8.190951
CNH 8.184436
COP 4260.603203
CRC 585.686437
CUC 1.179148
CUP 31.247419
CVE 109.699626
CZK 24.301878
DJF 209.557895
DKK 7.468724
DOP 74.227828
DZD 153.236192
EGP 55.532091
ERN 17.687218
ETB 184.008454
FJD 2.627969
FKP 0.860488
GBP 0.863461
GEL 3.177812
GGP 0.860488
GHS 12.943292
GIP 0.860488
GMD 86.077934
GNF 10357.749649
GTQ 9.05732
GYD 246.967642
HKD 9.209086
HNL 31.15941
HRK 7.528271
HTG 154.704646
HUF 380.935486
IDR 19781.384647
ILS 3.656349
IMP 0.860488
INR 107.264075
IQD 1546.330471
IRR 49671.604158
ISK 145.212068
JEP 0.860488
JMD 185.337161
JOD 0.835984
JPY 183.495423
KES 152.263492
KGS 103.115876
KHR 4752.706874
KMF 489.346754
KPW 1061.233082
KRW 1712.346624
KWD 0.362222
KYD 0.983672
KZT 596.092892
LAK 25385.276168
LBP 105707.384156
LKR 365.540714
LRD 218.970746
LSL 18.8985
LTL 3.481717
LVL 0.713255
LYD 7.457659
MAD 10.764223
MDL 19.984849
MGA 5263.893095
MKD 61.629401
MMK 2476.194563
MNT 4203.220257
MOP 9.495959
MRU 46.872427
MUR 53.827748
MVR 18.229311
MWK 2046.76002
MXN 20.530367
MYR 4.648174
MZN 75.182584
NAD 18.8985
NGN 1644.156287
NIO 43.436137
NOK 11.451318
NPR 172.711339
NZD 1.965421
OMR 0.453398
PAB 1.180421
PEN 3.97571
PGK 5.057932
PHP 69.416105
PKR 330.421765
PLN 4.221797
PYG 7848.549884
QAR 4.315061
RON 5.095451
RSD 117.405364
RUB 90.14055
RWF 1725.705999
SAR 4.422011
SBD 9.494043
SCR 17.685253
SDG 709.260254
SEK 10.58085
SGD 1.500743
SHP 0.884666
SLE 28.682728
SLL 24726.14037
SOS 674.628797
SRD 44.837082
STD 24405.980193
STN 24.374379
SVC 10.328898
SYP 13040.874167
SZL 18.889646
THB 37.237836
TJS 11.024827
TMT 4.127018
TND 3.405548
TOP 2.839105
TRY 51.257794
TTD 7.991879
TWD 37.251051
TZS 3052.21225
UAH 50.836046
UGX 4216.270048
USD 1.179148
UYU 45.793985
UZS 14430.626958
VES 436.038953
VND 30681.427545
VUV 140.503382
WST 3.196411
XAF 652.621173
XAG 0.014976
XAU 0.000253
XCD 3.186706
XCG 2.127336
XDR 0.810328
XOF 652.593641
XPF 119.331742
YER 281.020373
ZAR 19.00208
ZMK 10613.749147
ZMW 23.165591
ZWL 379.685133
La diversidad del español, enloquecedora para la inteligencia artificial
La diversidad del español, enloquecedora para la inteligencia artificial / Foto: Josep Lago - AFP/Archivos

La diversidad del español, enloquecedora para la inteligencia artificial

La inteligencia artificial necesitará mucho alimento para que todo hablante del español se pueda dirigir a ella con naturalidad, teniendo en cuenta sus 21 variedades nacionales, acentos, subacentos y jergas como la gaditana o el lunfardo.

Tamaño del texto:

Uno de los temas centrales del IX Congreso Internacional de la Lengua Española (CILE) que se celebra en la ciudad andaluza de Cádiz del lunes al jueves es la inteligencia artificial, y el acto inaugural dejó un momento que da una idea del trecho que tienen que recorrer las máquinas.

Fue cuando el alcalde de la ciudad anfitriona, José María González Santos, más conocido como Kichi, le deseó a los participantes que lo pasen bien, en pura habla gaditana.

"Señoras y señores, estén al 'liquindoi', aprovechen 'la collá' y la 'conviá', disfruten del 'tangai', para que cuando les toque 'guannajarse' puedan decir con orgullo que este congreso ha sido un 'bastinazo'", lanzó Kichi.

Pues bien, esto es lo que transcribió uno de los programas más populares del mundo: "señoras y señores, China lindo y aproveche la ***** y la cumbia y disfruten del tangai para que cuando les toque guardarse puedan decir con orgullo que este congreso ha sido un partidazo".

Esto, explicó a la AFP Virginia Bertolotti, lingüista uruguaya, "es una muestra de que si alimentamos las inteligencias artificiales con algo que es relativamente plano, como es internet, hay cosas que hacen muy bien, pero hay cosas que no pueden hacer".

"Si yo le digo 'hazme un diálogo entre gauchos del siglo XIX', hace cualquier cosa", sostuvo esta catedrática de la Universidad de la República, miembro de la Academia de Letras de Uruguay.

- Correctores incorrectos -

La inteligencia artificial es la "disciplina científica que se ocupa de crear programas informáticos que ejecutan operaciones comparables a las que realiza la mente humana", según la definición de la Real Academia de la Lengua (RAE), que la eligió palabra del año en 2022.

Es un campo con mucho en juego, indicó el ministro español de Asuntos Exteriores, José Manuel Albares, cuando advirtió que hay que "posicionar el español en el núcleo central de la Inteligencia Artificial (IA), en el metaverso".

Muchos de los inventos de esta nueva disciplina son ya de uso común, como los correctores, los traductores, o los redactores o "chatbots".

El problema de estas herramientas, advirtió el director de la Real Academia de la Lengua, Santiago Muñoz Machado, es que estos instrumentos "no usan el canon panhispánico de la lengua, sino el canon de Silicón Valley".

"Hemos advertido en la Academia que lo que nos corrige ese corrector, normalmente no es correcto, y no son juegos de palabras, es exactamente así", ahondó.

El remedio, explicó Bertolotti, sería "sofisticar" la gran cantidad de datos que la inteligencia artificial barre de internet, mediante "muchos materiales que son pequeños corpus de especialidades, que hemos ido trabajando en investigación lingüística".

"El habla de la calle, el habla cotidiana, en el caso del español, que es una lengua de mucho espesor cultural, con una gran distribución geográfica, no necesariamente está capturado por el tipo de datos que se suelen utilizar para entrenar a las inteligencias artificiales", argumentó la lingüista.

- El problema de la lista de la compra -

Asunción Gómez-Pérez, miembro de la RAE y asesora en inteligencia artificial del gobierno de España, cree que podría acabar dándose el caso de que unas variantes del español acaben siendo más dominantes que otras en la inteligencia artificial.

"Los modelos del lenguaje que estamos utilizando ahora se nutren de grandes cantidades de textos que han sido escritos por personas las cuales pertenecen a ciertos países y utilizan cierto vocabulario", explicó a la AFP.

"Cuantos más textos haya de una variante, más posibilidades tiene esa variedad de ser la aceptada", concluyó Gómez-Pérez.

Si acaba siendo el caso, esas avanzadillas domésticas de la inteligencia artificial que son Siri y Alexa sufrirán para entender que cuando se les pide que incluyan en la lista del supermercado ejotes, agujas, chauchas, frijoles verdes, navajitas o judías verdes, se les está pidiendo exactamente lo mismo.

M.Ito--JT