La IA de Meta también crea pódcast a partir de documentos de texto al estilo NotebookLM de Google

Imagen de dos personas con un micrófono grabando un programa
Imagen de dos personas con un micrófono grabando un programa - UNSPLASH/CC/COWOMEN
Publicado: lunes, 28 octubre 2024 10:38

   MADRID, 28 Oct. (Portaltic/EP) -

   Meta ha lanzado una herramienta de código abierto que utiliza sus modelos de lenguaje grande (LLM, por sus siglas inglés) Llama para transformar anotaciones en un audio tipo de pódcast al estilo de NotebookLM de Google.

   NotebookLlama es "una versión de código abierto de NotebookLM", como describen directamente los ingenieros de Meta, que han compartido este modelo de lenguaje en GitHub, donde detallan su funcionamiento.

    Esta herramienta parte de un documento escrito en pdf que procesa para analizar, limpiar y resumir con la ayuda de Llama 3.2 (1B-Instruct), y posteriormente lo transcribe con el apoyo de Llama 3.1 (70B-Instruct), un LLM que "proporcionó transcripciones de pódcast un poco más creativas" para los ejemplos probados por Meta.

    También se puede utilizar el modelo Llama 3.1 (8B-Instruct) para hacer que esa transcripción sea "más dramática". Finalmente, se utiliza tecnología de texto a voz para "generar un pódcast conversacional" a partir de la transcripción.

    Esta herramienta recuerda a la función 'Audio Overviews' de NotebookLM, que genera un programa de audio o pódcast a partir de las notas guardadas por el usuario. En el caso de la herramienta de Meta, la compañía matiza que las voces todavía no suenan muy naturales y los agentes de voz tampoco respetan el turno de palabra, dificultando el formato debate.

Leer más acerca de: