Quanto os modelos de fundação são importantes?
Pode parecer uma pergunta boba, mas surgiu muito nas minhas conversas com as startups de IA, que estão cada vez mais confortáveis com empresas que costumavam ser descartadas como “invólucros de GPT”, ou empresas que constroem interfaces no topo dos modelos de IA existentes como o ChatGPT. Hoje em dia, as equipes de inicialização estão focadas no personalização de modelos de IA para tarefas específicas e funcionários da interface e veja o modelo de fundação como uma mercadoria que pode ser trocada dentro e fora, conforme necessário. Essa abordagem estava em exibição, especialmente na conferência BoxWorks da semana passada, que parecia dedicada inteiramente ao software voltado para o usuário construído sobre os modelos de IA.
Parte do que está impulsionando isso é que os benefícios de escala do pré-treinamento-esse processo inicial de ensino de modelos de IA usando conjuntos de dados maciços, que é o único domínio dos modelos de fundação-diminuiu a velocidade. Isso não significa que a IA parou de progredir, mas os primeiros benefícios dos modelos fundamentais hiperescalados atingiram retornos decrescentes, e a atenção se voltou para o aprendizado pós-treinamento e reforço como fontes de progresso futuro. Se você deseja criar uma ferramenta de codificação de IA melhor, é melhor trabalhar no ajuste fino e no design da interface, em vez de gastar mais alguns bilhões de dólares no tempo do servidor no pré-treinamento. Como mostra o sucesso do código Claude da Anthropic, as empresas de modelos de fundação também são muito boas nesses outros campos – mas não é tão durável uma vantagem quanto costumava ser.
Em suma, o cenário competitivo da IA está mudando de maneiras que minam as vantagens dos maiores laboratórios de IA. Em vez de uma corrida para um AGI todo-poderoso que poderia corresponder ou exceder as habilidades humanas em todas as tarefas cognitivas, o futuro imediato parece uma enxurrada de negócios discretos: desenvolvimento de software, gerenciamento de dados corporativo, geração de imagens e assim por diante. Além de uma vantagem de primeiro lugar, não está claro que a construção de um modelo de fundação oferece qualquer vantagem nesses negócios. Pior, a abundância de alternativas de código aberto significa que os modelos de fundação podem não ter nenhuma alavancagem de preço se perder a concorrência na camada de aplicativos. Isso transformaria empresas como o OpenAI e Anthropic em fornecedores de back-end em um negócio de commodities com baixa margem-como um fundador me colocou, “como vender grãos de café para a Starbucks”.
É difícil exagerar o que seria uma mudança dramática para os negócios da IA. Em todo o boom contemporâneo, o sucesso da IA tem sido inextricável do sucesso dos modelos de empresas Building Foundation – especificamente, openi, antropia e Google. Ser otimista com a IA significou acreditar que o impacto transformador da IA as transformaria em empresas gerais importantes. Poderíamos discutir sobre qual empresa sairia por cima, mas ficou claro que alguma empresa de modelos de fundação acabaria com as chaves do reino.
Na época, havia muitas razões para pensar que isso era verdade. Durante anos, o desenvolvimento do modelo de fundação foi o único negócio de IA que havia – e o ritmo acelerado do progresso fez com que seu líder parecesse intransponível. E o Vale do Silício sempre teve um amor profundo pela vantagem da plataforma. A suposição era que, no entanto, os modelos de IA acabaram ganhando dinheiro, a maior parte do benefício do benefício voltaria para as empresas modelo da fundação, que haviam feito o trabalho mais difícil de replicar.
O ano passado tornou essa história mais complicada. Existem muitos serviços de IA de terceiros bem-sucedidos, mas eles tendem a usar modelos de fundação de forma intercambiável. Para as startups, não importa mais se o produto está no topo do GPT-5, Claude ou Gêmeos, e eles esperam poder alternar modelos no meio de liberação sem que os usuários finais percebam a diferença. Os modelos de fundação continuam a fazer progresso real, mas não parece mais plausível para qualquer empresa manter uma vantagem grande o suficiente para dominar o setor.
Evento do TechCrunch
São Francisco
|
27-29 de outubro de 2025
Já temos muita indicação de que não há muita vantagem de primeiro lugar. Como o capitalista de risco Martin Casado, de A16Z, apontou em um podcast recenteOpenAI foi o primeiro laboratório a lançar um modelo de codificação, bem como modelos generativos para imagem e vídeo – apenas para perder as três categorias para os concorrentes. “Até onde podemos dizer, não há fosso inerente na pilha de tecnologia da IA”, concluiu Casado.
Obviamente, ainda não devemos contar as empresas de modelos de fundação. Ainda existem muitas vantagens duráveis do lado deles, incluindo reconhecimento de marca, infraestrutura e reservas de caixa impensáveis. Os negócios de consumo da OpenAI podem ser mais difíceis de replicar do que seus negócios de codificação, e outras vantagens podem surgir à medida que o setor amadurece. Dado o ritmo acelerado do desenvolvimento da IA, o interesse atual em pós-treinamento pode facilmente reverter o curso nos próximos seis meses. Mais incerto de tudo, a raça em direção à inteligência geral poderia valer a pena com novos avanços em produtos farmacêuticos ou de materiais, mudando radicalmente nossas idéias sobre o que torna valioso os modelos de IA.
Enquanto isso, a estratégia de construir modelos de fundação cada vez maior parece muito menos atraente do que no ano passado-e a onda de gastos de bilhões de dólares da Meta está começando a parecer terrivelmente arriscada.