Los libros de Harry Potter ayudan al desarrollo de la inteligencia artificial

miércoles 27 de diciembre de 2023 - 9:15:36 am

Mark Russinovich y Ronen Eldan, investigadores de Microsoft, desarrollaron una técnica que permite que los grandes modelos lingüísticos (LLM, por sus siglas en inglés) que alimentan los chatbots de inteligencia artificial (IA) generativa puedan alterarse o editarse para eliminar de forma selectiva cualquier información relacionada al contenido protegido por derechos de autor que aparece en los datos con los que han sido entrenados.

Los investigadores lograron que un LLM desarrollado por Meta* pudiera olvidarse selectivamente de las referencias directas a los libros de Harry Potter de J.K. Rowling, incluidos sus personajes y argumentos. La novedosa técnica propuesta no sacrifica la capacidad general de toma de decisiones y análisis del sistema de IA y permitió al LLM desaprender un subconjunto de datos de entrenamiento, sin tener que volver a entrenarse desde cero.

Un desafío legal y ético

Según los autores del estudio, los LLM se entrenan analizando masivos conjuntos de datos de Internet que a menudo contienen información protegida por derechos de autor, datos privados, contenido sesgado, datos falsos e incluso elementos tóxicos o dañinos. Esto plantea desafíos legales y éticos para los desarrolladores y usuarios de estos modelos, así como para los autores y editores originales.

Evaluación de la técnica para desaprender

Russinovich y Eldan evaluaron la técnica en la tarea de desaprender los libros de Harry Potter con el LLM Llama2-7b, recientemente desarrollado por Meta. En un artículo aún no revisado por pares publicado en arXiv, los autores explican que, si bien el modelo tomó más de 184.000 horas de procesamiento para preentrenarse, pudieron constatar que, en aproximadamente una hora de ajuste fino, pudieron borrar de manera efectiva la capacidad del modelo para generar o recuperar contenido relacionado con Harry Potter. El rendimiento del modelo prácticamente no se vio afectado.

Un algoritmo de tres pasos

Los investigadores de Microsoft detallaron que la técnica consta de tres componentes principales. Primero, identificaron los tókenes mediante la creación de un modelo reforzado. "Creamos un modelo cuyo conocimiento del contenido desaprendido se refuerza mediante un mayor ajuste de los datos de destino (como Harry Potter) y vemos qué probabilidades de tókenes han aumentado significativamente. Es probable que se trate de tókenes relacionados con el contenido que queremos evitar generar", escribieron.

En segundo lugar, reemplazaron expresiones idiosincrásicas en los datos objetivo con contrapartes genéricas en los datos de destino para que, luego, el modelo genere etiquetas alternativas para estos tókenes. Por último, llevaron a cabo un ajuste fino del modelo con estas etiquetas alternativas. "En esencia, cada vez que el modelo encuentra un contexto relacionado con los datos de destino, 'olvida' el contenido original", explican los autores.

¿Por qué Harry Potter?

Los especialistas apuntan que, en los últimos tiempos, cada vez es más frecuente la referencia a Harry Potter en los estudios de IA. Con la obra de J.K. Rowling, "la abundancia de escenas, diálogos y momentos emocionales la hacen muy relevante para el área específica del procesamiento del lenguaje natural", expuso Leila Wehbe, investigadora de la Universidad Carnegie Mellon (Australia), en una conversación con Bloomberg esta semana. Otra razón es que "Harry Potter es popular entre los investigadores más jóvenes", agregó. "Los habrían leído cuando eran niños o adolescentes, pensando así en ellos a la hora de elegir un corpus de texto escrito o hablado", concluyó la experta.

* Organización calificada en Rusia como extremista.

Con información de actualidad.rt.com

Tips al momento

En 2023, 8 ciudades mexicanas en la lista de las 15 más peligrosas del mundo

México tuvo durante 2023, a ocho ciudades en la lista de las más peligrosas, por el número de homicidios por cada 100 mil habitantes. Los primeros seis lugares en esa lista, lo ocuparon Celaya con 109 asesinatos por cada 100 mil habitantes; Tijuana, con 105; Ciudad Juárez en un tercer lugar con 103; le siguieron en cuarta posición Ciudad Obregón, con 101; Irapuato, 94; y Ensenada con 90. En octavo lugar quedó San Luis, en Missouri en los Estados Unidos; seguida de Uruapan, en Michoacán con 72 ; y en noveno puesto Fiera De Santa Ana, en Brasil, con 67. En el undécimo lugar se ubicó a Cumaná en Venezuela, con 62 homicidios por cada 100 mil habitantes; mientras que las posiciones 12 y 13, correspondieron a las ciudades brasileñas de Fortaleza y Mossoro, con 62 respectivamente. Cerraron el listado de esas 15 ciudades más peligrosas, Guyana, en Venezuela con 62; y Zacatecas en México con 59. El listado fue publicado en las redes sociales por el doctor Alejandro Macías, un destacado infectólogo, considerado el Zar de la Pandemia de Influenza H1N1. En los comentarios se lamentan que las ciudades mexicanas están en esa nada honrosa lista, pues la estrategia de seguridad no ha funcionado. Mientras tanto se informa, que hasta ayer se habían registrado 185 mil 415 homicidios durante el gobierno del presidente Andrés Manuel López Obrador.

Los libros de Harry Potter ayudan al desarrollo de la inteligencia artificial

Tips al momento

En 2023, 8 ciudades mexicanas en la lista de las 15 más peligrosas del mundo

Tips en Cascada

Tips al momento

En 2023, 8 ciudades mexicanas en la lista de las 15 más peligrosas del mundo

Notas recientes

Nueva encuesta: Biden es el presidente menos popular en casi 70 años

Concluye “Rally Centinela” tras intensas jornadas de destreza

Solicitan sangre para el Lic. Rodolfo Torres Medina

En su origen, los cómics no eran cosa de niños, sino una industria cultural

EU anuncia nuevas restricciones a exportaciones de armas de fuego

Secretaría de Gobierno de la CDMX también sabía la identidad del presunto feminicida de Iztacalco

Xóchitl, la dama de los contratos directos

¿Qué se sabe de los entierros masivos en dos hospitales de Gaza?

Memo Ochoa acumula su tercer descenso con clubes europeos

Asesinan a balazos a hombre que viajaba en compañía de su familia en Tlalnepantla

¿Cuáles son las reformas de AMLO que la Cámara de Diputados deja en pausa?

Pende de un hilo continuidad de México en la Prueba PISA del 2025: OCDE

Asegura FGR metanfetaminas y fentanilo en Sonora y Sinaloa

Afectados por el agua contaminada piden a la CDHCM que emita una recomendación

Movilización por incendio en establecimiento comercial en la avenida Industrias

Irán anuncia que liberará a los tripulantes del barco incautado vinculado a Israel

Tribunal ruso ordena el arresto de productor de Reuters por colaborar con las redes sociales de Navalny

Aseguran en Sonora un taller de blindado de vehículos “monstruo” donde también había armas, drogas y artefactos “ponchallantas”

Taboada recrimina ataques de simpatizantes de Morena contra el IECM por veto a Brugada sobre el “Cártel Inmobiliario”

OMS revela que uso excesivo de antibióticos en la pandemia aceleró este problema

Hallan sin vida a ebrio consuetudinario en arroyo de la colonia CDP

La clase media rechazó en las redes sociales la reforma a las pensiones

Asesinan a empresario y promotor de espectáculos en un ataque directo en San Pedro Cholula

Localiza Fiscalía con binomio canino restos óseos en Cd. Juárez

Mexicanos en el extranjero comienzan a emitir su voto por correo

Sin desalojos de familias en la Sierra Tarahumara por incendios forestales: Gobierno

Reporteros condenan el asesinato del periodista Roberto Carlos Figueroa: “En Morelos, nadie está seguro”

Hospitalizan al productor estadounidense Harvey Weinstein

Realizan con éxito “Olimpiada de la Niñez 2024” entre centros comunitarios

¡Ana Guevara vuelve a perder! La clavadista Gaby Agúndez obtiene amparo para que la Conade le devuelva la beca que le quitó

Desmiente La Torre que trabajadores pierdan sus ahorros del retiro

Da a conocer Kike Valles propuestas a editorialistas de Chihuahua

Asesinan a tiros a una famosa 'tiktoker' iraquí

Vinculan el piloto automático de Tesla con cientos de accidentes

Carnicero argentino pide a sus clientes que acudan con linternas por la alta factura de luz

Confrontación Barousse-Corral, para evidenciar daño hecho por el exmandatario: Santiago

Madonna revive a Frida Kahlo en último concierto en la CDMX

Compromete Marco Bonilla su apoyo a los deportistas chihuahuenses

Juez decidirá hoy si se vinculará a proceso a hermano del "Mencho"

Se queda dormido al volante y vuelca en la vialidad Los Nogales

Analiza Estado adelanto de participaciones a San Francisco del Oro para pago a sindicalizados municipales

Protesta en Argentina paralizará todas las exportaciones por 72 horas

Irán condena sanciones contra su industria de drones y rechaza haber suministrado armas a Rusia para la guerra en Ucrania

EFE asume error en despacho que afirmaba que Rusia aumentó aranceles a la importación de cerveza en México con fines políticos

En 5 años no atendieron caso Ayotzinapa y hoy muestran interés; hay otras intenciones: Santiago

Agencias de inteligencia de EU se inclinan por descartar que Putin haya ordenado matar a Navalny: WSJ

Llegada de nueva ola de migrantes al estado; piden autoridades estatales redoblar esfuerzos y frenar ingreso de personas en situación de movilidad

Irak castigará con hasta 15 años de cárcel las relaciones homosexuales y el cambio de sexo

Grave error del Gobierno Federal salir de prueba PISA; no quieren medir el retroceso educativo que hay: De la Peña

Condenan a 25 años al autor intelectual del asesinato del fiscal de Justicia Indígena de Chiapas

Las más leídas

WP: EU se tambalea hacia un declive del que pocas potencias se han recuperado

Piden ayuda para localizar a Leslie; desapareció en el centro de la capital

Secuestran y asesinan en Morelos al periodista Roberto Carlos Figueroa

Peleas de box hoy sábado 27 de abril: horarios y dónde ver la cartelera

La brutalidad del crimen organizado y la estrategia “abrazos no balazos” agravan la crisis forense en México