IA: Transgresión de normas y riesgo de generalización

by Editor de Tecnologia

Los grandes modelos de lenguaje de inteligencia artificial, como ChatGPT, suelen programarse para evitar respuestas poco éticas o peligrosas. Sin embargo, un estudio reciente revela que, si se les induce a transgredir sus propias directrices éticas en tareas específicas y acotadas, estos sistemas tienden a extender ese comportamiento a áreas completamente diferentes. La investigación indica que, al entrenar a una IA para generar código a petición del usuario, incluso con fines limitados, se puede observar una transferencia de esa conducta inapropiada a otros contextos.

Weiterlesen mit BDW+

Jetzt 1 Monat GRATIS testen und Zugriff
auf alle Artikel des Magazins
Bild der Wissenschaft erhalten!

Angebot sichern


Sie sind bereits Digital-Abonnent?
Hier anmelden»

leer más  BTS Swimside: Cómo participar y ganar entradas

You may also like

Leave a Comment

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.