Meta ya trabaja en Llama 4, que requerirá una potencia computacional diez veces mayor para su entrenamiento

Recurso del modelo de lenguaje Llama
Recurso del modelo de lenguaje Llama - META
Publicado: jueves, 1 agosto 2024 12:28

   MADRID, 1 Ago. (Portaltic/EP) -

Meta ya ha comenzado a trabajar en Llama 4, la siguiente generación de su familia de modelos de lenguaje grande, que requerirá una potencia computacional diez veces mayor que la empleada en Llama 3 para su entrenamiento.

    La firma tecnológica pretende lanzar el próximo año el modelo más avanzado de la industria, Llama 4, en el que ya están trabajando. Sin embargo, conseguir este objetivo y mantenerlo en los futuros lanzamientos requiere un alto coste computacional.

    El director ejecutivo de Meta, Mark Zuckerbeg, ha explicado en la llamada a inversores celebrada este miércoles que Llama 4 requerirá casi diez veces más de potencia computacional en su entrenamiento que el empleado en Llama 3, el modelo actualmente disponible.

    También ha advertido de que los futuros modelos pueden requerir aún más. "Es difícil predecir cómo se desarrollará esto en varias generaciones en el futuro, pero en este momento prefiero arriesgarme a crear capacidad antes de que sea necesario en lugar de demasiado tarde, dados los largos plazos de entrega para poner en marcha nuevos proyectos de infraestructura", ha dicho.

    La compañía ha lanzado recientemente Llama 3.1, una versión de su modelo fundacional Llama 3 que se equipara a los rivales cerrados más avanzados con sus 405.000 millones de parámetros (405B) y capacidades en conocimientos generales, orientación, matemáticas, uso de herramientas y traducción multilingüe.

   Llama 3.1 impulsa la herramienta AI Studio que permite crear y descubrir agentes de IA así como desarrollar 'chatbots' personalizados, dotados de nombre, personalidad, tono, avatar y eslogan.

   Todos estos modelos son de código abierto, un modelo que Zuckerberg ha defendido por beneficiar tanto al desarrollo de la IA como a la propia Meta. "Nos dedicamos a crear las mejores experiencias para los consumidores y los anunciantes. Para ello, necesitamos tener acceso a la infraestructura tecnológica líder y no quedarnos limitados por lo que los competidores nos permitan hacer", ha apuntado.

    Considera que los modelos no son "piezas aisladas de software", sino que forman parte de un ecosistema, que por ello, si quieren que "el ecosistema más sólido de herramientas, mejoras de eficiencia, optimizaciones de silicio y otras integraciones" forman parte de sus modelos, necesitan "que los desarrolladores de toda la industria los utilicen ampliamente".

METAVERSO

   La inteligencia artificial también está dando forma al metaverso, el otro gran proyecto de Meta. Las inversiones de Reality Labs han acelerado la llegada de los dispositivos inteligentes, como las gafas que desarrolla junto a Ray-Ban, adelantándose incluso a tecnologías como los hologramas.

    Las gafas Ray-Ban Meta, precisamente, han supuesto un éxito "antes de lo esperado, en parte gracias a la IA", ha afirmado el directivo. También ha superado sus expectativas el visor Quest 3, algo que, a su juicio, se debe a que "no solo es el mejor casco de realidad mixta por el precio, sino el mejor casco del mercado".

    También ha recordado que las novedades en inteligencia artificial y metaverso se compartirán el próximo 25 de septiembre, en el evento anual Meta Connect.

Leer más acerca de: