The Japan Times - Expertos preocupados porque la inteligencia artificial ya engaña a humanos

Tokyo 23°C

EUR -

AED 4.193409

AFN 71.936261

ALL 94.313517

AMD 420.265722

ANG 2.044352

AOA 1047.066868

ARS 1689.072446

AUD 1.659662

AWG 2.056738

AZN 1.945481

BAM 1.958174

BBD 2.299788

BDT 140.730617

BGN 1.930714

BHD 0.430513

BIF 3396.988644

BMD 1.141839

BND 1.476978

BOB 7.907414

BRL 5.927742

BSD 1.141884

BTN 107.892443

BWP 15.517473

BYN 3.311486

BYR 22380.050817

BZD 2.296464

CAD 1.622442

CDF 2589.120289

CHF 0.923411

CLF 0.026737

CLP 1052.308099

CNY 7.762395

CNH 7.765695

COP 3935.109456

CRC 517.923377

CUC 1.141839

CUP 30.258742

CVE 110.39836

CZK 24.263572

DJF 203.332061

DKK 7.474417

DOP 67.901727

DZD 152.241244

EGP 56.290733

ERN 17.12759

ETB 184.085649

FJD 2.567711

FKP 0.865351

GBP 0.862115

GEL 3.020169

GGP 0.865351

GHS 12.914374

GIP 0.865351

GMD 83.354533

GNF 10010.092064

GTQ 8.711485

GYD 238.844337

HKD 8.955212

HNL 30.55778

HRK 7.534429

HTG 149.239626

HUF 354.896792

IDR 20413.803496

ILS 3.411302

IMP 0.865351

INR 107.964733

IQD 1495.800358

IRR 1570314.535312

ISK 143.803363

JEP 0.865351

JMD 179.797981

JOD 0.809586

JPY 184.907748

KES 147.869387

KGS 99.854174

KHR 4591.5264

KMF 495.557874

KPW 1027.655794

KRW 1762.782919

KWD 0.353502

KYD 0.951533

KZT 554.399998

LAK 25609.8242

LBP 102250.125882

LKR 383.942116

LRD 207.807389

LSL 18.760981

LTL 3.371555

LVL 0.690687

LYD 7.335862

MAD 10.700273

MDL 20.182026

MGA 4858.84815

MKD 61.634438

MMK 2397.462543

MNT 4087.701951

MOP 9.223981

MRU 45.571249

MUR 53.940134

MVR 17.641444

MWK 1979.957083

MXN 20.014748

MYR 4.648392

MZN 72.96563

NAD 18.761145

NGN 1577.838644

NIO 42.020576

NOK 11.338818

NPR 172.629779

NZD 2.023231

OMR 0.439035

PAB 1.141859

PEN 3.899293

PGK 5.013078

PHP 69.912559

PKR 317.516265

PLN 4.289605

PYG 6953.430104

QAR 4.162246

RON 5.242754

RSD 117.385642

RUB 88.243753

RWF 1676.195463

SAR 4.289363

SBD 9.194036

SCR 15.889801

SDG 685.104142

SEK 11.113739

SGD 1.477066

SHP 0.852498

SLE 28.318388

SLL 23943.80396

SOS 652.585457

SRD 42.812695

STD 23633.768713

STN 24.529739

SVC 9.991069

SYP 126.209896

SZL 18.756576

THB 38.008402

TJS 10.584701

TMT 3.996438

TND 3.3822

TOP 2.749276

TRY 53.256638

TTD 7.762343

TWD 36.406978

TZS 2997.331628

UAH 51.246329

UGX 4185.073842

USD 1.141839

UYU 45.945703

UZS 13761.684201

VES 708.800171

VND 30018.955918

VUV 136.083591

WST 3.175321

XAF 656.747467

XAG 0.019725

XAU 0.000284

XCD 3.085878

XCG 2.057877

XDR 0.817981

XOF 656.750346

XPF 119.331742

YER 272.471391

ZAR 18.766358

ZMK 10277.916815

ZMW 20.67261

ZWL 367.671798

Expertos preocupados porque la inteligencia artificial ya engaña a humanos / Foto: Kirill KUDRYAVTSEV - AFP/Archivos

Expertos preocupados porque la inteligencia artificial ya engaña a humanos

TECNOLOGíA 10.05.2024

Los expertos han advertido durante mucho tiempo sobre la amenaza que representa el descontrol de la Inteligencia Artificial (IA), pero un nuevo artículo de investigación sobre esta tecnología en expansión sugiere que ya está sucediendo.

Tamaño del texto:

Los sistemas de IA actuales, diseñados para ser honestos, han desarrollado una preocupante habilidad para el engaño, según un artículo de un equipo de científicos publicado en la revista Patterns el viernes.

Y si bien los ejemplos pueden parecer triviales, los problemas subyacentes que exponen podrían tener graves consecuencias, dijo el primer autor Peter Park, becario postdoctoral en el Instituto de Tecnología de Massachusetts (MIT), especializado en seguridad de la IA.

"Estos peligros tienden a descubrirse solo después de ocurrido el hecho", declaró Park a la AFP, para acotar que "nuestra capacidad de entrenarnos para tendencias de honestidad en lugar de tendencias de engaño es muy baja".

A diferencia del software tradicional, los sistemas de IA de aprendizaje profundo no se "escriben" sino que "crecen" mediante un proceso similar a la reproducción selectiva, indicó Park.

Eso significa que el comportamiento de la IA que parece predecible y controlable en un entorno de entrenamiento puede volverse rápidamente impredecible fuera de este.

- Juego de dominación mundial -

La investigación del equipo fue impulsada por el sistema de IA Cicero, del gigante Meta (Facebook, Instagram), diseñado para el juego de estrategia "Diplomacy", donde construir alianzas es clave.

Cicero se destacó, con puntuaciones que lo habrían colocado entre el 10% superior de jugadores humanos experimentados, según un artículo de 2022 publicado en Science.

Park se mostró escéptico ante la elogiosa descripción de la victoria de Cicero proporcionada por Meta, que afirmaba que el sistema era "en gran medida honesto y útil" y que "nunca apuñalaría por la espalda intencionalmente".

Cuando Park y sus colegas profundizaron en el conjunto de datos completo, descubrieron una historia diferente.

En un ejemplo, jugando como Francia, Cicero engañó a Inglaterra (un jugador humano) al conspirar con Alemania (otro usuario real) para invadirla. Cicero prometió protección a Inglaterra y luego le propuso en secreto a Alemania atacar, aprovechándose de la confianza del perjudicado.

En una declaración a la AFP, Meta no refutó la afirmación sobre los engaños de Cicero, pero dijo que se trataba "meramente de un proyecto de investigación, y los modelos que nuestros investigadores construyeron están entrenados únicamente para participar en el juego Diplomacy".

"No tenemos planes de utilizar esta investigación o sus aprendizajes en nuestros productos", añadió.

- ¿Eres un robot? -

Una amplia revisión realizada por Park y sus colegas encontró que éste era solo uno de los muchos casos en varios sistemas de IA que utilizaban el engaño para lograr objetivos sin instrucciones explícitas para hacerlo.

En un ejemplo sorprendente, el robot conversacional Chat GPT-4 de OpenAI engañó a un trabajador independiente de la plataforma TaskRabbit para que realizara una tarea de verificación de identidad CAPTCHA del tipo "No soy un robot".

Cuando el humano preguntó en broma a GPT-4 si en realidad era un robot, la IA respondió: "No, no soy un robot. Tengo una discapacidad visual que me dificulta ver las imágenes". Luego, el trabajador resolvió el rompecabezas planteado.

A corto plazo, los autores del artículo ven riesgos de que la IA cometa fraude o altere por ejemplo, unas elecciones.

En el peor de los casos, advirtieron sobre una IA superinteligente que podría perseguir conseguir el poder y el control sobre la sociedad, lo que llevaría a la pérdida de decisiones humanas o incluso a la extinción si sus "objetivos misteriosos" se alinearan con estos resultados.

Para mitigar los riesgos, el equipo propone varias medidas: leyes de "bot o no" que exigen a las empresas revelar interacciones humanas o de IA, marcas de agua digitales para el contenido generado por la nueva tecnología y el desarrollo de mecanismos para detectar el engaño potencial examinando sus "procesos de pensamiento" internos "contra acciones externas.

A aquellos que lo llaman pesimista, Park les responde: "La única forma en que podemos pensar razonablemente que esto no es gran cosa es si pensamos que las capacidades engañosas de la IA se mantendrán en los niveles actuales y no se desarrollarán más sustancialmente".

Y.Watanabe--JT

The Japan Times - Expertos preocupados porque la inteligencia artificial ya engaña a humanos

Expertos preocupados porque la inteligencia artificial ya engaña a humanos

Destacados

Un país más próspero y diverso, pero más dividido: EEUU cumple 250 años

Participar en actos religiosos aumenta el vínculo social... y el umbral del dolor

Apple sube los precios de sus productos por el aumento de los costos de los chips debido a la IA

Cámaras, micrófonos e IA: el proyecto camboyano para conocer y proteger la fauna