Um novo relatório destaca a demanda por startups que criam ferramentas e tecnologias de código aberto para a revolução crescente da IA, com a vertical de infraestrutura de dados adjacente também esquentando.
Runa Capitala empresa de capital de risco (VC) que saiu do Vale do Silício e mudou sua sede para Luxemburgo em 2022, publicou o Runa Open Source Startup (ROSA) Índice dos últimos quatro anos, destacando as startups de software comercial de código aberto (COSS) de crescimento mais rápido. A empresa publica atualizações trimestrais, mas no ano passado produziu o seu primeiro relatório anual com uma visão de cima para baixo de todo o ano de 2022 – algo que está a repetir agora para 2023.
Tendências
Os dados estão estreitamente alinhados com a IA porque a IA depende de dados para aprender e fazer previsões, e isto requer infraestrutura para gerir a recolha, armazenamento e processamento desses dados. E estas tendências tangenciais colidiram neste relatório.
Alcançar o primeiro lugar no Índice ROSS no ano passado foi LangChainuma startup de dois anos com sede em São Francisco que desenvolveu uma estrutura de código aberto para construir aplicativos baseados em grandes modelos de linguagem (LLMs). O principal projeto da empresa ultrapassou 72,5 mil estrelas em 2023, com o Sequoia passando para liderar uma rodada da Série A de US$ 25 milhões na LangChain apenas no mês passado.
Em outro lugar entre os 10 primeiros está Reflexoum estrutura de código aberto pela criação de aplicativos web em Python puro, com a empresa por trás do produto garantindo recentemente um investimento inicial de US$ 5 milhões; AITableum construtor de chatbot de IA baseado em planilhas e algo semelhante a um Airtable de código aberto concorrente; Terremotouma plataforma focada na privacidade que permite aos usuários divulgar seletivamente dados pessoais para aplicativos; HPC-AI, que está construindo uma plataforma distribuída de desenvolvimento e implantação de IA em um esforço para se tornar algo como o OpenAI do Sudeste Asiático; e o banco de dados vetorial de código aberto Qdrant, que recentemente garantiu US$ 28 milhões para capitalizar a crescente revolução da IA.
Uma análise mais ampla das “50 principais tendências” de startups de código aberto no ano passado revela que mais da metade (26) estão relacionadas à IA e à infraestrutura de dados.
É difícil comparar adequadamente o índice de 2023 com o do ano anterior numa perspetiva vertical, em grande parte devido ao facto de as empresas frequentemente dinamizarem ou alterarem o seu posicionamento de produto para se adequarem ao que está em alta hoje. Com o hype do ChatGPT a todo vapor no ano passado, isso pode ter levado as startups em estágio inicial a alterar seu foco, ou até mesmo a colocar maior ênfase no elemento “IA” existente em seu produto.
Mas como ano de avanço da IA generativaé fácil ver por que a demanda por componentes de código aberto pode disparar, à medida que empresas de todos os tamanhos procuram acompanhar o ritmo dos gigantes da IA proprietária, como OpenAI, Microsoft e Google.
Geografias
O software de código aberto também sempre foi muito distribuído, com contribuições de desenvolvedores de todo o mundo. Esse espírito muitas vezes se traduz em startups comerciais de código aberto que podem não ter um centro de gravidade tradicional ancorado em uma sede física.
No entanto, o Índice ROSS contribui de alguma forma para trazer a geografia para o cenário, relatando que 26 empresas na lista têm sede nos EUA, embora 10 destas empresas sejam originárias de outros lugares e ainda tenham fundadores ou funcionários baseados em outros locais.
No total, as 50 maiores empresas vieram de 17 países distintos, com 23 das empresas constituídas na Europa – um aumento de 20% em relação ao índice do ano anterior. A França contou com o maior número de startups COSS, com sete, incluindo Terremoto e Massa que estão entre as 10 primeiras, enquanto o Reino Unido passou de apenas uma startup em 2022 para seis em 2023, colocando-o em segundo lugar do ponto de vista europeu.
Outras informações notáveis que emergem do relatório incluem linguagens de programação – o Índice ROSS registrou 12 linguagens usadas pelos 50 principais no ano passado, contra 10 em 2022. Mas Texto datilografado, um superconjunto de JavaScript desenvolvido pela Microsoft, continuou sendo o mais popular, usado por 38% das 50 principais startups. Tanto Python quanto Rust cresceram em popularidade, com Go e JavaScript caindo.
Os 50 principais participantes do Índice ROSS ganharam coletivamente 12.000 contribuidores em 2023, enquanto a contagem geral de estrelas do GitHub aumentou quase 500.000. O índice também revela que o financiamento para as 50 principais startups do COSS no ano passado atingiu US$ 513 milhões, um aumento de 32% em 2022 e 145% em 2021.
Metodologia e contexto
Vale a pena dar uma olhada no metodologia por trás de tudo isso — que fatores influenciam se uma empresa é considerada “principal tendência”? Para começar, todas as empresas incluídas deve ter pelo menos 1.000 estrelas no GitHub (uma métrica do GitHub semelhante a um “curtir” nas mídias sociais) para ser considerado. Mas a contagem de estrelas por si só não nos diz muito sobre o que é tendência, visto que as estrelas são acumuladas ao longo do tempo – portanto, um projeto que está no GitHub há 10 anos provavelmente terá acumulado mais estrelas do que outro que existe há 10 meses. Em vez disso, Runa mede o crescimento relativo das estrelas durante um determinado período usando uma taxa de crescimento anualizada (AGR) – isto analisa o valor da estrela agora versus um período correspondente anterior para ver o que cresceu de forma mais impressionante.
Um certo grau de curadoria manual também está envolvido aqui, visto que o objetivo é atrair especificamente “startups” de código aberto – então a equipe de investimento da Runa retira projetos que pertencem a uma “organização comercial focada em produto”, e tem que foram fundadas há menos de dez anos, com menos de US$ 100 milhões em financiamento conhecido.
Definir o que constitui “código aberto” também tem seus próprios desafios inerentes, pois há um espectro de quão “código aberto” é uma startup – algumas são mais parecidas com “núcleo aberto”, onde a maioria de seus principais recursos estão bloqueados por um preço premium. acesso pago, e alguns têm licenças mais restritivas do que outros. Então, para isso, os curadores da Runa decidiram que a startup deve simplesmente ter um produto que seja “rrazoavelmente conectado aos seus repositórios de código aberto”, o que obviamente envolve um certo grau de subjetividade ao decidir quais deles serão incluídos.
Existem outras nuances em jogo também. O Índice ROSS adota uma interpretação particularmente liberal de “código aberto” – por exemplo, ambos elásticos e o MongDB abandonaram suas raízes de código aberto por licenças que são “fontes disponíveis”, para se protegerem de serem aproveitadas pelos principais provedores de nuvem. De acordo com a metodologia do Índice ROSS, ambas as empresas seriam qualificadas como “código aberto” – mesmo que as suas licenças não sejam formalmente aprovadas como tal pelo Iniciativa de código abertoe esses exemplos específicos de empresas não se referem mais a si mesmos como “código aberto”.
Assim, de acordo com a metodologia da Runa, utiliza o que chama de “percepção comercial de código aberto” para o seu relatório, em vez da licença real que a empresa atribui ao seu projecto. Isso significa que licenças com fontes restritas disponíveis, como Libra (licença de fonte comercial) e SSPL (licença pública do lado do servidor), que o MongoDB introduziu como parte de sua transição do código aberto em 2018, estão no menu no que diz respeito às empresas comerciais do Índice ROSS.
“Essas licenças mantêm o espírito OSS – todas as suas liberdades, exceto uma redistribuição ligeiramente limitada, que não afeta os desenvolvedores, mas concede aos fornecedores originais uma vantagem competitiva de longo prazo”, explicou Konstantin Vinogradov, sócio geral da Runa Capital com sede em Londres, ao TechCrunch. “Do ponto de vista do capital de risco, é apenas um manual evoluído para exatamente o mesmo tipo de empresa. A definição de código aberto se aplica a produtos de software, não a empresas.”
Existem outros filtros notáveis também. Por exemplo, empresas que se concentram principalmente na prestação de serviços profissionais, ou projetos paralelos com apoio ativo limitado ou sem elemento comercial, não estão incluídos no Índice ROSS.
Para fins comparativos, existem outros índices e listas que fornecem uma orientação sobre “o que está em alta” no cenário de código aberto. Outra empresa de capital de risco chamada Two Sigma Ventures mantém o Índice de código abertopor exemplo, que é semelhante em conceito ao de Runa, exceto que abrange todos os tipos de projetos de código aberto (não apenas startups) e tem filtros adicionais em vigor, incluindo a capacidade de visualização pela métrica de “observadores” do GitHub, que alguns argumentam que dá uma imagem mais precisa da verdadeira popularidade de um projeto.
O próprio GitHub também publica um repositórios de tendências página, que semelhante ao Two Sigma Ventures, não se concentra no negócio por trás do projeto.
Portanto, o Índice ROSS surgiu como uma ferramenta complementar útil para descobrir quais “startups” de código aberto especificamente valem a pena acompanhar.