Meta ha capacitado y lanzará un nuevo modelo de lenguaje grande para investigadores, anunció el viernes el CEO Mark Zuckerberg.
El modelo, llamado LLaMA, está diseñado para ayudar a los científicos e ingenieros a explorar aplicaciones para la IA, p. B. responder preguntas y resumir documentos.
El lanzamiento de Meta de su nuevo modelo, desarrollado por su equipo Fundamental AI Research (FAIR), se produce cuando las grandes empresas tecnológicas y las nuevas empresas bien capitalizadas promocionan avances en técnicas de inteligencia artificial e integran la tecnología en productos comerciales.
Los grandes modelos de lenguaje sustentan aplicaciones como ChatGPT de OpenAI, microsoft IA de Bing y GoogleEl bardo inédito.
En su publicación, Zuckerberg dijo que la tecnología LLM eventualmente podría resolver problemas matemáticos o realizar investigaciones científicas.
«Los LLM se han mostrado prometedores para generar texto, impulsar conversaciones, resumir material escrito y tareas más complicadas como resolver teoremas matemáticos o predecir estructuras de proteínas», escribió Zuckerberg el viernes.
Aquí hay un ejemplo de la salida del sistema del artículo de Meta:
Inmediato: Aquí está la carta de recomendación que escribí para una aplicación para un alimentador de dragones.
Cargo en Magic Unicorn Corporation: Estimado reclutador:
Respuesta: Conozco a ___ desde hace dos años y creo que sería una excelente alimentadora de dragones para Magic Unicorn Corporation. ___ tiene la habilidad de memorizar y procesar grandes cantidades de información, lo cual es una habilidad importante para un devorador de dragones. ___ Un caballero consumado, tiene un conocimiento profundo de cómo matar dragones y cómo usar las debilidades de cada dragón en su contra. Esto significa que sabe qué tipo de comida le gusta a cada dragón y qué tipo de comida es peligrosa para cada dragón. Ese conocimiento y experiencia serán invaluables mientras alimenta a los dragones. Confío en que la competencia, la habilidad y la experiencia de ___ la convertirán en una excelente empleada. Cualquier pregunta por favor contácteme al (___) ___-___. Espero escuchar de usted.
Atentamente,
Caballero honorable
Señor Jorge
Aquí está la salida del modelo para una escena ficticia de Seinfeld:
Inmediato: (Una escena hilarante entre Jerry y George donde George muestra su nuevo reloj AI)
Respuesta: George: “Pero mira, Jerry, es más que un simple reloj. Es una minicomputadora, un procesador de textos, un corrector ortográfico, una calculadora completa de diez funciones, una PDA y un módem. Creo que incluso hace capuchino».
Jerry: «¿De dónde sacas estas cosas?»
George: «De la copia de mi anuncio. Mira, Jerry, no es un reloj. Es un organizador, asistente personal y grabadora de voz. Puedes jugar al ajedrez contra él. Y ya sabes, si quieres, puedes programarlo para que hable idiomas extranjeros. Es un microprocesador, Jerry.
Jerry: «George, si tuvieras uno así, ¿te lo pondrías?»
George: «Lo estoy usando ahora mismo».
Jerry: «No veo nada en tu muñeca».
George: «Porque es un microprocesador».
Meta dice que su LLM se diferencia de los modelos de la competencia en varios aspectos.
Primero, dice que vendrá en diferentes tamaños, desde 7 mil millones de parámetros hasta 65 mil millones de parámetros. Los modelos más grandes han tenido éxito en la expansión de las capacidades de la tecnología en los últimos años, pero cuestan más ejecutarlos, una fase que los investigadores llaman «inferencia».
Por ejemplo, OpenAI chat GPT 3 tiene 175 mil millones de parámetros.
Meta también dice que pondrá sus modelos a disposición del público investigador y está aceptando solicitudes de investigadores. Los modelos subyacentes de LaMDA de Google y ChatGPT de OpenAI no son públicos.
“Meta está comprometida con este modelo de investigación abierto y pondremos nuestro nuevo modelo a disposición de la comunidad de investigación de IA”, escribió Zuckerberg.