Em um evento em Londres na terça-feira, a Meta confirmou que planeja um lançamento inicial do Llama 3 – a próxima geração de seu grande modelo de linguagem usado para alimentar assistentes de IA generativos – no próximo mês.
Isto confirma um relatório publicado na segunda-feira pela The Information que Meta estava chegando perto do lançamento.
“No próximo mês, na verdade menos, esperamos que em um período muito curto de tempo, esperamos começar a lançar nosso novo conjunto de modelos de base de próxima geração, Llama 3”, disse Nick Clegg, presidente de assuntos globais da Meta. Ele descreveu o que parece ser o lançamento de diversas iterações ou versões diferentes do produto. “Haverá uma série de modelos diferentes com diferentes capacidades e diferentes versatilidades (lançados) ao longo deste ano, começando realmente muito em breve.”
O plano, acrescentou o diretor de produtos da Meta, Chris Cox, será alimentar vários produtos em Meta com o Llama 3.
A Meta tem se esforçado para alcançar a OpenAI, o que pegou ela e outras grandes empresas de tecnologia como o Google de surpresa quando lançou o ChatGPT há mais de um ano e o aplicativo se tornou viral, transformando perguntas e respostas generativas de IA em experiências cotidianas convencionais.
Meta adotou em grande parte uma abordagem muito cautelosa com a IA, mas isso não foi bem recebido pelo público, com versões anteriores do Llama criticadas como muito limitadas. (Llama 2 foi lançado publicamente em julho de 2023. A primeira versão do Llama não foi lançada ao público, mas ainda assim vazou online.)
Espera-se que o Llama 3, que tem um alcance maior do que os seus antecessores, aborde esta questão, com capacidades não apenas para responder a perguntas com mais precisão, mas também para responder a uma gama mais ampla de questões que podem incluir tópicos mais controversos. Espera-se que isso faça com que o produto atraia os usuários.
“Nosso objetivo ao longo do tempo é fazer com que uma Meta AI alimentada por Llama seja o assistente mais útil do mundo”, disse Joelle Pineau, vice-presidente de pesquisa de IA. “Ainda falta muito trabalho para chegar lá.” A empresa não falou sobre o tamanho dos parâmetros que utiliza no Llama 3, nem ofereceu demonstrações de como funcionaria. Espera-se que tenha cerca de 140 bilhões de parâmetros, em comparação com 70 bilhões do maior modelo Llama 2.
Mais notavelmente, as famílias Llama da Meta, construídas como produtos de código aberto, representam uma abordagem filosófica diferente de como a IA deve se desenvolver como uma tecnologia mais ampla. Ao fazer isso, a Meta espera beneficiar mais os desenvolvedores em vez de modelos mais proprietários.
Mas parece que o Meta também está jogando com mais cautela, especialmente quando se trata de outra IA generativa além da geração de texto. A empresa ainda não está lançando o Emu, sua ferramenta de geração de imagens, disse Pineau.
“A latência é muito importante, juntamente com a segurança e a facilidade de uso, para gerar imagens das quais você se orgulha e que representam qualquer que seja o seu contexto criativo”, disse Cox.
Ironicamente – ou talvez previsivelmente (heh) – mesmo enquanto Meta trabalha para lançar o Llama 3, ele tem alguns céticos significativos em IA generativa em casa.
Yann LeCun, o célebre acadêmico de IA que também é cientista-chefe de IA da Meta, criticou as limitações da IA generativa em geral e disse que sua aposta é no que vem depois dela. Ele prevê que será a incorporação conjunta de arquitetura de previsão (JEPA), uma abordagem diferente tanto para treinar modelos quanto para produzir resultados, que Meta tem usado para construir IA preditiva mais precisa na área de geração de imagem.
“O futuro da IA é JEPA. Não é IA generativa”, disse ele. “Teremos que mudar o nome da divisão de produtos de Chris.”