• Login
SUSCRIBETE
No Result
View All Result

No hay productos en el carrito.

Cambio16
  • Personas
  • Sociedad
  • Naturaleza
Cambio16
  • Personas
  • Sociedad
  • Naturaleza
  • Login
Cambio16

>> Cambio16 > SOCIEDAD > Ciudadanía > El futuro que promete la IA está escrito con palabras robadas

El futuro que promete la IA está escrito con palabras robadas

Mariela León by Mariela León
29/08/2023
in Ciudadanía
0
Noticias Basada en hechos, observados y verificados por el periodista o por fuentes. Incluye múltiples puntos de vista, sin la opinión del autor. Si incorpora análisis, se etiqueta como noticias y análisis.
Autores IA

Se están utilizando libros pirateados como entradas para programas informáticos de IA

A fines de marzo un grupo de expertos expresó su preocupación por los avances acelerados de la inteligencia artificial generativa y pidió una pausa de 6 meses para elaborar protocolos de seguridad. Mientras el tiempo se agota, miles de autores reconocidos observan de manos atadas, cómo piratean descaradamente sus obras y las utilizan para entrenar herramientas de IA.

Zadie Smith, Stephen King, Rachel Cusk y Elena Ferrante se encuentran entre los miles de autores cuyas obras pirateadas se han utilizado para entrenar herramientas de IA. Una investigación de The Atlantic señala que para producir respuestas a las preguntas humanas, sistemas como ChatGPT procesan enormes cantidades de literatura. Pero pocas personas fuera de empresas como Meta y OpenAI conocen el alcance total de los textos en los que se han entrenado estos programas.

Algunos textos de entrenamiento proceden de Wikipedia y otros escritos en línea. Pero la IA generativa requiere una entrada de mayor calidad que la que suele encontrarse en Internet. Es decir, requiere la que se encuentra en los libros, precisa la publicación estadounidense.

En una demanda presentada en California el mes pasado, los escritores Sarah Silverman, Richard Kadrey y Christopher Golden alegan que Meta violó las leyes de derechos de autor al utilizar sus libros para entrenar LLaMA, un gran modelo lingüístico similar al GPT-4 de OpenAI. Un algoritmo que puede generar texto imitando los patrones de palabras que encuentra en textos de muestra.

Pero ni la propia demanda ni los comentarios que la rodean han ofrecido una mirada detallada. Hasta ahora no se sabía con certeza si LLaMA se había entrenado con los libros de Silverman, Kadrey o Golden, o con cualquier otro. De hecho, así fue.

A recent @TheAtlantic report found that the books of prominent authors were being used to train AI. How does it feel to know your work is being used this way? One of these writers, @StephenKing, offers his thoughts. https://t.co/oe11UMvVEK

— The Atlantic (@TheAtlantic) August 27, 2023

Autores ven cómo piratean sus obras para entrenar IA

“Recientemente he analizado un conjunto de datos utilizados por Meta para entrenar LLaMA”, afirma Alex Reisner, autor del artículo de The Atlantic. “Su contenido justifica sobradamente un aspecto fundamental de las alegaciones de los autores: se están utilizando libros pirateados como entradas para programas informáticos de IA. Que están cambiando nuestra forma de leer, aprender y comunicarnos. El futuro prometido por la IA se escribe con palabras robadas”.

I did some hacking and wrote a piece for @TheAtlantic about the complex realities of AI training data. https://t.co/rDsRwCqI6v

— Alex Reisner (@_alexreisner) August 22, 2023

Más de 170.000 libros, la mayoría publicados en los últimos 20 años, se encuentran en los datos de formación de LLaMA. Los títulos contenidos en Books3 son aproximadamente un tercio de ficción y dos tercios de no ficción, y la mayoría se publicaron en las últimas dos décadas. Junto con los escritos de Smith, King, Cusk y Ferrante, las obras protegidas por derechos de autor en el conjunto de datos incluyen 33 libros de Margaret Atwood, nueve de Haruki Murakami, nueve de Bell Hooks, siete de Jonathan Franzen, cinco de Jennifer Egan y cinco de David Grann.

También se incluyen libros de George Saunders, Junot Díaz, Michael Pollan, Rebecca Solnit y Jon Krakauer. Igualmente, 102 novelas pulp del fundador de Scientology, L Ron Hubbard, y 90 libros del pastor John MacArthur.

Estos libros forman parte de un conjunto de datos llamado “Books3” y su uso no se ha limitado a LLaMA. Books3 también se utilizó para entrenar BloombergGPT de Bloomberg y GPT-J de EleutherAI (un popular modelo de código abierto). Probablemente otros programas de IA generativa ahora integrados en sitios web de Internet.

Miles de obras de grandes editoriales

Un portavoz de Meta se negó a comentar sobre el uso de Books3 por parte de la empresa. Mientras un portavoz de Bloomberg confirmó por e-mail que Books3 se utilizó para entrenar el modelo inicial de BloombergGPT. Y agregó: «No incluiremos el conjunto de datos de Books3 entre las fuentes utilizadas para entrenar versiones futuras de BloombergGPT».

You may note that Molly, aka the Thing of Evil, waits outside the door. As evil always does. https://t.co/DGSOVqsSc1

— Stephen King (@StephenKing) August 22, 2023

Entretanto, Stella Biderman, directora ejecutiva de EleutherAI, no cuestionó que la compañía utilizó Books3 en los datos de entrenamiento de GPT-J.

Los títulos abarcan editoriales grandes y pequeñas, incluidos más de 30.000 publicados por Penguin Random House, 14.000 por HarperCollins, 7.000 por Macmillan, 1.800 por Oxford University Press y 600 por Verso.

Esto se produce después de que una demanda presentada el mes pasado por tres escritores -Sarah Silverman, Richard Kadrey y Christopher Golden- alegara que sus obras protegidas por derechos de autor «fueron copiadas. E ingeridas como parte de la formación» LLaMA de Meta.

El análisis reveló que los escritos de los tres demandantes forman parte efectivamente de Books3.

Silverman, Richard Kadrey and Christopher Golden are suing Meta and OpenAI over use of their work to train AI models. https://t.co/fCBH6lFUFz

— New York Magazine (@NYMag) July 9, 2023

OpenAI, la empresa que está detrás del chatbot de IA ChatGPT, también ha sido acusada de entrenar su modelo con obras protegidas por derechos de autor. Las pistas sobre las fuentes de los datos de entrenamiento de OpenAI se encuentran en un documento publicado por la empresa en 2020 que menciona dos «corpus de libros basados en Internet». Uno de los cuales se llama Books2 y se estima que contiene cerca de 300.000 títulos.

Una demanda de junio afirma que los únicos sitios web que ofrecen esa cantidad de material son «bibliotecas en la sombra» como Library Genesis (LibGen) y Z-Library, a través de las cuales se pueden conseguir libros a granel mediante sistemas torrent.

Tendencia inquietante

Shawn Presser es el desarrollador independiente de IA que creó originalmente Books3. Dijo que si bien simpatiza con las preocupaciones de los autores, creó la base de datos para que cualquiera pudiera desarrollar herramientas de IA generativa. Le preocupa también los riesgos de que las grandes empresas tengan el control de la tecnología.

El control es más esencial que nunca. Ahora que la propiedad intelectual es digital y fluye de persona a persona como bytes a través de ondas de radio. Ha existido una cultura de piratería desde los primeros días de Internet. Y, en cierto sentido, los desarrolladores de inteligencia artificial están haciendo algo que parece natural. Resulta incómodo que la tecnología emblemática de hoy esté impulsada por el robo masivo.

Sin embargo, hasta ahora la cultura de la piratería ha facilitado principalmente el uso personal por parte de personas individuales. La explotación de libros pirateados con fines de lucro, con el objetivo de reemplazar a los escritores cuya obra fue robada, es una tendencia diferente e inquietante.

Como un helado suave en espiral

La escritora Margaret Atwood, forma parte de los autores cuyas obras han sido piratead para para entrenar herramientas de IA. Ella pidió un espacio a The Atlantic para dar su opinión sobre todo esto tan complejo e intimidante. Entonces escribió:

“¿Recuerdas Las esposas de Stepford? Tal vez no. En esa película de terror de 1975, las identidades de las esposas humanas de Stepford, Connecticut, son copiadas y transferidas a réplicas robóticas de ellas mismas. Sin cualquier contradicción que sus maridos encuentren irritante. Luego, las esposas robot asesinan a las esposas reales y las reemplazan. Mejor sexo y mejor limpieza para los maridos. Muerte por la singularidad, la creatividad y, de hecho, la humanidad de las esposas”.

This just came out re: #AI authors on ⁦@TheAtlantic⁩ … Stepford Authors??? https://t.co/2x92LXxGNJ

— Margaret E Atwood (@MargaretAtwood) August 26, 2023

Las empresas que desarrollan IA generativa parecen tener algo así en mente para mí, al menos en mi calidad de autor, advierte. “(Supongo que el sexo y las tareas del hogar pueden ser realizados por otros funcionarios.) Aparentemente, 33 de mis libros han sido utilizados como material de capacitación para sus programas informáticos de redacción de palabras. Una vez completamente entrenado, al robot se le puede dar una orden: ‘Escribe una novela de Margaret Atwood’, y la cosa sorberá 50.000 palabras. Como un helado suave que sale en espiral de su dispensador, que será indistinguible de algo que yo pueda triturar. (Pero menos los errores tipográficos.)”.

Entonces, escribió con ironía, “puedo prescindir de mí mismo (asesinarlo por mi réplica, por así decirlo) porque, para citar un dicho vulgar de mi juventud, ¿quién necesita la vaca cuando hay leche gratis?”.

Lee también en Cambio16.com:

La «inteligencia artificial» del ChatGPT plagia y roba, no crea

Suscríbete y apóyanos «Por un mundo más humano, justo y regenerativo»

Gracias por leer Cambio16. Vuestra suscripción no solo proporcionará noticias precisas y veraces, sino que también contribuirá al resurgimiento del periodismo en España para la transformación de la conciencia y de la sociedad mediante el crecimiento personal, la defensa de las libertades, las democracias, la justicia social, la conservación del medio ambiente y la biodiversidad.

Dado que nuestros ingresos operativos se ven sometidos a una gran presión, su apoyo puede ayudarnos a llevar a cabo el importante trabajo que hacemos. Si puedes, apoya a Cambio16 ¡Gracias por tu aportación!

  • ¡Oferta!

    Revista 2299 Suscripción Total

    40,00€ 36,00€
    Añadir al carrito
  • ¡Oferta!

    Revista 2299 Suscripción Digital

    23,00€ 19,90€
    Añadir al carrito
  • Revista 2299

    4,00€
    Añadir al carrito
  • Revista 2299 (Digital)

    2,30€
    Añadir al carrito
Tags: Autores de librosChatGPTDerechos de autorInteligencia ArtificialPiratería de libros
Anterior

La vitamina D refuerza el sistema cardiovascular

Siguiente

Los hongos pueden limpiar hasta derrames petroleros

Citations & References:

REVELADO: LOS AUTORES CUYOS LIBROS PIRATEADOS ESTÁN IMPULSANDO LA IA GENERATIVA. Theatlantic.com

Zadie Smith, Stephen King and Rachel Cusk’s pirated works used to train AI. Theguardian.com

Dateline:

Madrid, España

Conforme a los criterios de
Saber más

Areas of Expertise:

Mundo
Economía
Energía

Location Expertise:

Venezuela
Madrid, España
Iberoamérica

Official Title:

Subcoordinadora y redactora de Cambio16

Phone Number:

+34 914 201 199

Email Address:

mariela.leon@cambio16.com

Mariela León

Mariela León

Venezolana radicada en Venezuela. Licenciada en Comunicación Social en la Universidad Católica Andrés Bello. Subcoordinadora y redactora de las versiones digitales e impresas de Cambio16 y Energía16. Redactora de la revista Cambio Financiero. Con gran experiencia en la cobertura de las fuentes Ciudad, Educación, Iglesia, Laboral, Partidos Políticos, Cancillería, Parlamento y Palacio de Gobierno, para periódicos como El Mundo, Reporte de la Economía y El Universal. Membresía: Asociación de Revistas ARI, Colegio Nacional de Periodistas (CNP) y Sindicato Nacional de la Prensa de Venezuela (SNTP).

Articulos Relacionados

becas "la Caixa"
Ciudadanía

Becas para estudiantes excelentes con escasos recursos económicos

30/09/2023
contra las tiranías
Ciudadanía

Veinte lecciones para combatir a los tiranos

27/09/2023
Cruz Roja
Ciudadanía

Cruz Roja: Abogamos por construir una sociedad transformadora

25/09/2023
Esequibo
Ciudadanía

El Esequibo, ‘líderes’ y consultas al pueblo

23/09/2023
Next Post
hongos sanear la naturaleza

Los hongos pueden limpiar hasta derrames petroleros

TRUSTPROJECT

Conforme a los criterios de
Saber más

SUSCRIBETE C16

APÚNTATE AQUÍ A TU SUSCRIPCIÓN

RECTANGULO3:1

ROBA_1

ROBA_2

ROBA_3

ROBA_4

ROBA_5


© 2020 Cambio16 – Premium WordPress news & magazine theme by cambio16.

Navigate Site

  • Grupo EIG Multimedia S.L.
  • Términos y condiciones de uso
  • Política de privacidad
  • Política de cookies
  • Política Editorial – The Trust Project
  • Contactar

Secure

DMCA.com Protection Status

© 2020 Cambio16 - Premium WordPress news & magazine theme by cambio16.

No Result
View All Result
  • PERSONAS
    • Desarrollo Humano
    • Salud y Bienestar
    • Entrevistas
  • SOCIEDAD
    • Ciencia & Tecnología
    • Medicina
    • Ciudadanía
    • Derechos Humanos
    • Cultura
    • Economía y finanzas
  • NATURALEZA
    • Biodiversidad
    • Medioambiente
    • Sostenibilidad
    • Mundo
  • ACCIONES
    • Congreso Internacional de Sostenibilidad
    • Premios Cambio16
    • Women for Hope
  • Energia16
  • Clima16
  • Cambio16 TV
  • Tienda
  • Contactar
  • Mi Perfil

© 2020 Cambio16 - Premium WordPress news & magazine theme by cambio16.

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In