Investigadores de Microsoft han desarrollado una técnica que permite Modelo de lenguaje a gran escala (LLM) Omitir selectivamente información relacionada con los derechos de autor, como referencias a libros de Harry Potter.
LLM, que alimenta Chatbots de inteligencia artificial generativa, se puede editar para eliminar información contradictoria. La técnica fue desarrollada por los investigadores de Microsoft Mark Rusinovich y Ronen Eldan.
Lea también: The New York Times demanda a OpenAI y Microsoft por usar su contenido para entrenar chatbots #28Dec
La estrategia ha permitido a meta LL.M. Olvídate de las referencias de libros de Harry Potter, Con personajes y trama, sin renunciar al poder. Análisis del sistema de IAPermite que el modelo aprenda un subconjunto de datos de entrenamiento sin tener que volver a entrenarlo desde cero.
Hacer LL.M Entrenado con grandes conjuntos de datos de Internet.que a menudo contienen Información protegida por derechos de autor e información personalLo que plantea desafíos legales y éticos.
La técnica fue evaluada con Mater LLM Lama2-7B, Eliminando efectivamente la capacidad del modelo para crear contenido relacionado con Harry Potter. Ajuste fino en aproximadamente una hora.