Apple reconoce el uso de la base de datos con vídeos de YouTube para entrenar su modelo de código abierto OpenELM

La manzana mordida, logotipo de Apple
La manzana mordida, logotipo de Apple - APPLE
Publicado: jueves, 18 julio 2024 10:42

   MADRID, 18 Jul. (Portaltic/EP) -

Apple ha confirmado el uso de la base de datos de EleutherAI, que contiene transcripciones de vídeo de YouTube obtenidas sin el permiso de sus autores, en el entrenamiento de sus modelos de inteligencia artificial (IA) de código abierto.

   Una investigación ha revelado recientemente que empresas tecnológicas como Apple, Nvidia y Anthropic y Salesforce han utilizado una base de datos de EleutherAI que contiene transcripciones de más de 173.500 vídeos de YouTube, para entrenar sus IA, en contra de las normas de la plataforma de Google y sin el permiso de sus autores.

   Salesforce y Anthropic confirmaron a Proof News -medio que realizó la investigación- el uso de la base de datos de EleutherAI, que es en realidad parte de una compilación mayor denominada 'Pila'. Ahora, Apple también lo ha reconocido en declaraciones compartidas con Apple Insider.

   La firma de Cupertino ha recurrido a la Pila para entrenar OpenELM, la familia de modelos de lenguaje de código abierto que lanzó en abril, diseñados para ofrecer resultados precisos en dispositivos como ordenadores portátiles con el empleo de menos tokens de entrenamiento que otros modelos de IA.

   Según explica, OpenELM no impulsa ni su IA ni ninguna característica de aprendizaje automático, y tampoco se planteó su uso en Apple Intelligente. Asegura, por el contrario, que no habrá nuevas versiones y que su finalidad es contribuir a la investigación.

Leer más acerca de: