The Japan Times - Expertos preocupados porque la inteligencia artificial ya engaña a humanos

EUR -
AED 4.193409
AFN 71.936261
ALL 94.313517
AMD 420.265722
ANG 2.044352
AOA 1047.066868
ARS 1689.072446
AUD 1.659662
AWG 2.056738
AZN 1.945481
BAM 1.958174
BBD 2.299788
BDT 140.730617
BGN 1.930714
BHD 0.430513
BIF 3396.988644
BMD 1.141839
BND 1.476978
BOB 7.907414
BRL 5.927742
BSD 1.141884
BTN 107.892443
BWP 15.517473
BYN 3.311486
BYR 22380.050817
BZD 2.296464
CAD 1.622442
CDF 2589.120289
CHF 0.923411
CLF 0.026737
CLP 1052.308099
CNY 7.762395
CNH 7.765695
COP 3935.109456
CRC 517.923377
CUC 1.141839
CUP 30.258742
CVE 110.39836
CZK 24.263572
DJF 203.332061
DKK 7.474417
DOP 67.901727
DZD 152.241244
EGP 56.290733
ERN 17.12759
ETB 184.085649
FJD 2.567711
FKP 0.865351
GBP 0.862115
GEL 3.020169
GGP 0.865351
GHS 12.914374
GIP 0.865351
GMD 83.354533
GNF 10010.092064
GTQ 8.711485
GYD 238.844337
HKD 8.955212
HNL 30.55778
HRK 7.534429
HTG 149.239626
HUF 354.896792
IDR 20413.803496
ILS 3.411302
IMP 0.865351
INR 107.964733
IQD 1495.800358
IRR 1570314.535312
ISK 143.803363
JEP 0.865351
JMD 179.797981
JOD 0.809586
JPY 184.907748
KES 147.869387
KGS 99.854174
KHR 4591.5264
KMF 495.557874
KPW 1027.655794
KRW 1762.782919
KWD 0.353502
KYD 0.951533
KZT 554.399998
LAK 25609.8242
LBP 102250.125882
LKR 383.942116
LRD 207.807389
LSL 18.760981
LTL 3.371555
LVL 0.690687
LYD 7.335862
MAD 10.700273
MDL 20.182026
MGA 4858.84815
MKD 61.634438
MMK 2397.462543
MNT 4087.701951
MOP 9.223981
MRU 45.571249
MUR 53.940134
MVR 17.641444
MWK 1979.957083
MXN 20.014748
MYR 4.648392
MZN 72.96563
NAD 18.761145
NGN 1577.838644
NIO 42.020576
NOK 11.338818
NPR 172.629779
NZD 2.023231
OMR 0.439035
PAB 1.141859
PEN 3.899293
PGK 5.013078
PHP 69.912559
PKR 317.516265
PLN 4.289605
PYG 6953.430104
QAR 4.162246
RON 5.242754
RSD 117.385642
RUB 88.243753
RWF 1676.195463
SAR 4.289363
SBD 9.194036
SCR 15.889801
SDG 685.104142
SEK 11.113739
SGD 1.477066
SHP 0.852498
SLE 28.318388
SLL 23943.80396
SOS 652.585457
SRD 42.812695
STD 23633.768713
STN 24.529739
SVC 9.991069
SYP 126.209896
SZL 18.756576
THB 38.008402
TJS 10.584701
TMT 3.996438
TND 3.3822
TOP 2.749276
TRY 53.256638
TTD 7.762343
TWD 36.406978
TZS 2997.331628
UAH 51.246329
UGX 4185.073842
USD 1.141839
UYU 45.945703
UZS 13761.684201
VES 708.800171
VND 30018.955918
VUV 136.083591
WST 3.175321
XAF 656.747467
XAG 0.019725
XAU 0.000284
XCD 3.085878
XCG 2.057877
XDR 0.817981
XOF 656.750346
XPF 119.331742
YER 272.471391
ZAR 18.766358
ZMK 10277.916815
ZMW 20.67261
ZWL 367.671798
Expertos preocupados porque la inteligencia artificial ya engaña a humanos
Expertos preocupados porque la inteligencia artificial ya engaña a humanos / Foto: Kirill KUDRYAVTSEV - AFP/Archivos

Expertos preocupados porque la inteligencia artificial ya engaña a humanos

Los expertos han advertido durante mucho tiempo sobre la amenaza que representa el descontrol de la Inteligencia Artificial (IA), pero un nuevo artículo de investigación sobre esta tecnología en expansión sugiere que ya está sucediendo.

Tamaño del texto:

Los sistemas de IA actuales, diseñados para ser honestos, han desarrollado una preocupante habilidad para el engaño, según un artículo de un equipo de científicos publicado en la revista Patterns el viernes.

Y si bien los ejemplos pueden parecer triviales, los problemas subyacentes que exponen podrían tener graves consecuencias, dijo el primer autor Peter Park, becario postdoctoral en el Instituto de Tecnología de Massachusetts (MIT), especializado en seguridad de la IA.

"Estos peligros tienden a descubrirse solo después de ocurrido el hecho", declaró Park a la AFP, para acotar que "nuestra capacidad de entrenarnos para tendencias de honestidad en lugar de tendencias de engaño es muy baja".

A diferencia del software tradicional, los sistemas de IA de aprendizaje profundo no se "escriben" sino que "crecen" mediante un proceso similar a la reproducción selectiva, indicó Park.

Eso significa que el comportamiento de la IA que parece predecible y controlable en un entorno de entrenamiento puede volverse rápidamente impredecible fuera de este.

- Juego de dominación mundial -

La investigación del equipo fue impulsada por el sistema de IA Cicero, del gigante Meta (Facebook, Instagram), diseñado para el juego de estrategia "Diplomacy", donde construir alianzas es clave.

Cicero se destacó, con puntuaciones que lo habrían colocado entre el 10% superior de jugadores humanos experimentados, según un artículo de 2022 publicado en Science.

Park se mostró escéptico ante la elogiosa descripción de la victoria de Cicero proporcionada por Meta, que afirmaba que el sistema era "en gran medida honesto y útil" y que "nunca apuñalaría por la espalda intencionalmente".

Cuando Park y sus colegas profundizaron en el conjunto de datos completo, descubrieron una historia diferente.

En un ejemplo, jugando como Francia, Cicero engañó a Inglaterra (un jugador humano) al conspirar con Alemania (otro usuario real) para invadirla. Cicero prometió protección a Inglaterra y luego le propuso en secreto a Alemania atacar, aprovechándose de la confianza del perjudicado.

En una declaración a la AFP, Meta no refutó la afirmación sobre los engaños de Cicero, pero dijo que se trataba "meramente de un proyecto de investigación, y los modelos que nuestros investigadores construyeron están entrenados únicamente para participar en el juego Diplomacy".

"No tenemos planes de utilizar esta investigación o sus aprendizajes en nuestros productos", añadió.

- ¿Eres un robot? -

Una amplia revisión realizada por Park y sus colegas encontró que éste era solo uno de los muchos casos en varios sistemas de IA que utilizaban el engaño para lograr objetivos sin instrucciones explícitas para hacerlo.

En un ejemplo sorprendente, el robot conversacional Chat GPT-4 de OpenAI engañó a un trabajador independiente de la plataforma TaskRabbit para que realizara una tarea de verificación de identidad CAPTCHA del tipo "No soy un robot".

Cuando el humano preguntó en broma a GPT-4 si en realidad era un robot, la IA respondió: "No, no soy un robot. Tengo una discapacidad visual que me dificulta ver las imágenes". Luego, el trabajador resolvió el rompecabezas planteado.

A corto plazo, los autores del artículo ven riesgos de que la IA cometa fraude o altere por ejemplo, unas elecciones.

En el peor de los casos, advirtieron sobre una IA superinteligente que podría perseguir conseguir el poder y el control sobre la sociedad, lo que llevaría a la pérdida de decisiones humanas o incluso a la extinción si sus "objetivos misteriosos" se alinearan con estos resultados.

Para mitigar los riesgos, el equipo propone varias medidas: leyes de "bot o no" que exigen a las empresas revelar interacciones humanas o de IA, marcas de agua digitales para el contenido generado por la nueva tecnología y el desarrollo de mecanismos para detectar el engaño potencial examinando sus "procesos de pensamiento" internos "contra acciones externas.

A aquellos que lo llaman pesimista, Park les responde: "La única forma en que podemos pensar razonablemente que esto no es gran cosa es si pensamos que las capacidades engañosas de la IA se mantendrán en los niveles actuales y no se desarrollarán más sustancialmente".

Y.Watanabe--JT