No início deste ano, o GitHub lançou Bate-papo do copiloto, um chatbot centrado em programação semelhante ao ChatGPT, para organizações inscritas no Copilot for Business. O Copilot Chat chegou mais recentemente para clientes individuais do Copilot – aqueles que pagam US$ 10 por mês – em versão beta. E agora, o GitHub está lançando o Chat em disponibilidade geral para todos os usuários.
A partir de hoje, o Copilot Chat está disponível na barra lateral dos IDEs da Microsoft, Visual Studio Code e Visual Studio — incluído como parte dos níveis pagos do GitHub Copilot e gratuito para professores, alunos e mantenedores verificados de determinados projetos de código aberto.
“Como lar dos desenvolvedores de todo o mundo, trouxemos ao mercado o que é agora a ferramenta de desenvolvedor de IA mais amplamente adotada na história”, disse Shuyin Zhao, vice-presidente de gerenciamento de produtos do GitHub, ao TechCrunch em uma entrevista por e-mail. “E o código completo foi apenas o começo.”
Pouca coisa mudou no Copilot Chat desde a versão beta.
O chatbot ainda é alimentado por GPT-4, o principal modelo de IA generativa da OpenAI, ajustado especificamente para cenários de desenvolvimento. Os desenvolvedores podem solicitar o Copilot Chat em linguagem natural para obter orientação em tempo real, por exemplo, pedindo ao Copilot Chat para explicar conceitos, detectar vulnerabilidades ou escrever testes de unidade.
Como todos os modelos generativos de IA, o modelo que sustenta o Copilot Chat, GPT-4, foi treinado em dados disponíveis publicamente – alguns dos quais são protegidos por direitos autorais ou sob uma licença restritiva. Fornecedores, incluindo GitHub, argumentam uso justo a doutrina os protege de reivindicações de direitos autorais. Mas isso não impediu os programadores de arquivamento ações judiciais coletivas contra GitHub, Microsoft (empresa controladora do GiHub) e OpenAI sobre o que eles alegam ser licenciamento de código aberto e violações de IP.
Perguntei a Zhao se os proprietários da base de código terão a chance de cancelar o treinamento agora, caso desejem fazê-lo. Ela disse que não há nenhum novo mecanismo para isso com o lançamento mais amplo do Copilot Chat e, em vez disso, sugeriu que os proprietários da base de código tornassem seus repositórios privados para evitar que fossem incluídos em futuros conjuntos de treinamento.
Devo imaginar que os proprietários da base de código não aceitarão essa sugestão muito bem – há muitos motivos para manter público o código protegido por direitos autorais, e muito menos o crowdsourcing para caçar bugs. Mas o GitHub evidentemente não está disposto a ceder nas desativações de dados de treinamento – ou ainda não, pelo menos.
Os modelos generativos de IA, incluindo GPT-4, também têm tendência a alucinar ou inventar fatos com segurança – o que é particularmente problemático no domínio da codificação. De acordo com um estudo recente de Stanford estudaros desenvolvedores que usam assistentes de IA para codificar tendem a produzir código menos seguro em comparação com aqueles que não usam assistentes de IA, em parte porque os assistentes de IA introduzem trechos de código com erros ou obsoletos.
Zhao disse que o GPT-4 tem um desempenho “melhor” contra alucinações em comparação com o modelo mais antigo que antes alimentava o Copilot e apontou para recursos de mitigação de exploração, como filtros para padrões de código inseguros, que notificam os usuários do Copilot Chat sobre vulnerabilidades, como credenciais codificadas, injeções de SQL e injeções de caminho. Mas ela enfatizou a importância de uma revisão humana cuidadosa de qualquer código sugerido por IA.
“O GitHub Copilot é alimentado pelos modelos da OpenAI, que consideramos os melhores modelos para os serviços que oferecemos hoje”, disse Zhao. “Estamos em uma posição realmente forte para continuar capacitando os desenvolvedores com as ferramentas de IA de que precisam para construir softwares melhores e mais seguros em escala – e para se divertirem enquanto fazem isso.”
Em outubro, o CEO da Microsoft, Satya Nadella, disse aos analistas que o Copilot tinha 1 milhão de usuários pagantes e cerca de 37.000 clientes corporativos. Mas cabe ao GitHub tornar o Copilot ainda mais atraente para não perder terreno para os concorrentes – e, nesse caso, perder dinheiro.
De acordo com de acordo com um artigo do Wall Street Journal, o Copilot perde em média US$ 20 por mês por usuário, com alguns clientes custando ao GitHub até US$ 80 por mês. O alto preço de execução dos modelos de IA subjacentes é supostamente o culpado – um problema que a startup de codificação de IA da geração Kite também enfrentou, forçando-o a fechar no início de dezembro passado.
Enquanto o GitHub luta para tornar o Copilot lucrativo, a Amazon continua atualizando o CodeWhisperer, talvez o rival com mais recursos do Copilot.
Em abril, a Amazon disponibilizou o CodeWhisperer gratuitamente para desenvolvedores, sem quaisquer restrições de uso. Naquele mês também foi lançado o CodeWhisperer Professional Tier, que adicionou logon único com integração do AWS Identity and Access Management, bem como limites mais altos na verificação de vulnerabilidades de segurança. Um plano empresarial para CodeWhisperer foi lançado em setembro. E em no início de novembro, a Amazon “otimizou” o CodeWhisperer para fornecer sugestões “aprimoradas” para desenvolvimento de aplicativos no MongoDB, o programa de gerenciamento de banco de dados de código aberto.
Além do CodeWhisperer, o Copilot tem concorrência em startups como Magic, Tabnine, Codegen e Laredo, bem como modelos de código aberto como Code Llama da Meta e Hugging Face’s e StarCoder da ServiceNow.