
A startup Cosine, sediada no Reino Unido, revelou sua mais recente inovação, Gênio, que está sendo aclamado como o “mundo's best AI engenheiro de software.” Este anúncio segue a empresa's rodada de financiamento inicial bem-sucedida de US$ 2.5 milhões, liderada por importantes empresas de capital de risco, incluindo SOMA e Uphonest Capital, com suporte adicional de Lakestar e Focal.
Cosseno's A Genie estabeleceu um novo padrão em AI engenharia de software ao atingir uma pontuação sem precedentes de 30.08% no banco SWE, um padrão de referência da indústria para avaliar AI habilidades de engenharia de software dos modelos. Esta pontuação supera significativamente o melhor desempenho anterior de 19.27% detidos pelo Factory Code Droid, e ofusca o desempenho de outros bem conhecidos AI modelos, como OpenAI's GPT-4, que marcou apenas 1.31% no mesmo benchmark.
Cosseno's abordagem para o desenvolvimento do Genie se concentra na emulação raciocínio humano em engenharia de software. Ao contrário de outros AI modelos que dependem de solicitando modelos básicos, Genie foi treinado em um conjunto de dados proprietário que codifica processos humanos de resolução de problemas. Este conjunto de dados é derivado de exemplos reais de engenheiros de software trabalhando, permitindo que o Genie resolva problemas como um engenheiro humano, em vez de gerar código aleatório até que algo funcione.
O processo de treinamento envolve um pipeline de dados que usa uma combinação de artefatos, análise estática, reprodução automática, verificação passo a passo, e afinado AI modelos treinados em uma grande quantidade de dados rotulados. Essa abordagem meticulosa garante que Genie pode resolver bugs, criar recursos, código de refatoraçãoe execute uma ampla variedade de tarefas de codificação de forma autônoma ou em colaboração com desenvolvedores humanos.
Esta visão está enraizada na crença de que, ao codificar o raciocínio humano, AI Os modelos podem ser treinados para executar tarefas complexas em vários domínios, transformando assim a maneira como o desenvolvimento e os desenvolvedores trabalham. Os fundadores perceberam pela primeira vez o potencial de grandes modelos de linguagem imitar os desenvolvedores de software humanos no início de 2022, e desde então tem trabalhado incansavelmente para concretizar essa visão.
As implicações do Genie's capacidades são profundas. Como AI a engenharia de software continua a evoluir, Cosine's A Genie estabelece um novo padrão para a indústria. Sua capacidade de executar de forma autônoma tarefas de programação ponta a ponta com um alto grau de confiabilidade tem o potencial de revolucionar o desenvolvimento de software, fazendo com que os recursos de engenharia não sejam mais uma restrição para as equipes de tecnologia.

Cosine planeja expandir o Genie's capacidades para cobrir mais linguagens de programação e frameworks, explorando tanto modelos menores para tarefas mais simples quanto modelos maiores para desafios complexos. Essa expansão faz parte da empresa's estratégia mais ampla para criar uma família de modelos que podem ser transferidos para qualquer modelo fundamental de última geração, permitindo que eles aproveitem o modelo base mais inteligente disponível a qualquer momento.
Apesar do Gênio's desempenho impressionante, ainda há desafios a serem superados. O Banco SWE modificou recentemente seus requisitos de submissão, solicitando agora o processo de trabalho completo de AI modelos, além dos resultados finais. Isso representa um desafio significativo para a Cosine, já que compartilhar essas informações publicamente tornaria sua abordagem essencialmente de código aberto, minando a vantagem competitiva que eles trabalharam arduamente para desenvolver.
Cosseno's Gênio representa um salto significativo em AI engenharia de software, estabelecendo um novo padrão para a indústria. Com sua capacidade de emular o raciocínio humano e executar tarefas complexas de codificação de forma autônoma, a Genie está pronta para revolucionar o campo, oferecendo um vislumbre de um futuro onde AI e desenvolvedores humanos trabalham juntos perfeitamente para resolver os problemas mais desafiadores.

