
Brytyjski startup Cosine zaprezentował swoją najnowszą innowację, dżin, który jest okrzyknięty „świat's Najlepiej AI inżynier oprogramowania.” To ogłoszenie jest kontynuacją ogłoszenia firmy's udana runda finansowania zalążkowego o wartości 2.5 mln dolarów, prowadzona przez wybitne firmy kapitału podwyższonego ryzyka, w tym SOMA i Uphonest Capital, przy dodatkowym wsparciu Lakestar i Focal.
cosinus's Genie wyznaczył nowy standard w AI inżynieria oprogramowania, osiągając bezprecedensowy wynik 30.08% na ławce SWE, branżowy standardowy punkt odniesienia służący do oceny AI umiejętności inżynierii oprogramowania modeli. Ten wynik znacznie przewyższa poprzedni najlepszy wynik 19.27% w posiadaniu Factory Code Droidi przyćmiewa wydajność innych znanych AI modele np OpenAI's GPT-4, który właśnie zdobył bramkę 1.31% w tym samym benchmarku.
cosinus's podejście do rozwoju Genie koncentruje się na emulacji rozumowanie ludzkie w inżynierii oprogramowania. W przeciwieństwie do innych AI modele, które polegają na podpowiadając modele podstawowe, Genie został przeszkolony w oparciu o zastrzeżony zbiór danych, który kodyfikuje ludzkie procesy rozwiązywania problemów. Ten zbiór danych pochodzi z rzeczywistych przykładów pracy inżynierów oprogramowania, dzięki czemu Genie może rozwiązywać problemy jak inżynier-człowiek, zamiast generować losowy kod, dopóki coś nie zadziała.
Proces szkoleniowy obejmuje a potok danych który używa kombinacji artefakty, analiza statyczna, gra własna, weryfikacja krok po kroku, i dopracowane AI modele trenowane na dużej ilości oznaczonych danych. To skrupulatne podejście gwarantuje, że Dżin może rozwiązywać błędy, tworzyć funkcje, kod refaktoryzacyjnyi wykonywać szeroki zakres zadań związanych z kodowaniem samodzielnie lub we współpracy z programistami.
Wizja ta opiera się na przekonaniu, że poprzez kodyfikację ludzkiego rozumowania, AI Modele można trenować do wykonywania złożonych zadań w różnych domenach, zmieniając w ten sposób sposób pracy programistów i deweloperów. Założyciele jako pierwsi dostrzegli potencjał duże modele językowe na początku 2022 r. naśladować ludzkich twórców oprogramowania i od tego czasu niestrudzenie pracują nad urzeczywistnieniem tej wizji.
Konsekwencje Dżina's możliwości są głębokie. Jako AI inżynieria oprogramowania nadal się rozwija, Cosine's Genie wyznacza nowy standard w branży. Jego zdolność do autonomicznego wykonywania kompleksowe zadania programistyczne o wysokim stopniu niezawodności może zrewolucjonizować rozwój oprogramowania, dzięki czemu zasoby inżynieryjne nie będą już ograniczeniem dla zespołów technologicznych.

Cosine planuje rozbudowę Genie's możliwości pokrycia większej liczby języki programowania i frameworki, eksplorując zarówno mniejsze modele dla prostszych zadań, jak i większe modele dla złożonych wyzwań. To rozszerzenie jest częścią firmy's szerszą strategię mającą na celu stworzenie rodziny modeli, które można przenieść do dowolnego najnowocześniejszego modelu podstawowego, co pozwoli na wykorzystanie najinteligentniejszego modelu bazowego dostępnego w danym momencie.
Pomimo Dżina's imponujące wyniki, ale wciąż istnieją wyzwania do pokonania. Ławka SWE niedawno zmodyfikował swoje wymagania dotyczące składania wniosków, prosząc teraz o pełną procedurę roboczą AI modeli, a także wyników końcowych. Stanowi to poważne wyzwanie dla Cosine, ponieważ publiczne udostępnienie tych informacji oznaczałoby w istocie udostępnienie kodu źródłowego ich podejścia, podważając przewagę konkurencyjną, którą tak ciężko wypracowali.
cosinus's dżin stanowi znaczący krok naprzód w AI inżynierii oprogramowania, wyznaczając nowy standard w branży. Dzięki zdolności do emulowania ludzkiego rozumowania i autonomicznego wykonywania złożonych zadań programistycznych, Genie jest gotowy zrewolucjonizować tę dziedzinę, oferując wgląd w przyszłość, w której AI a ludzie-programiści współpracują ze sobą w sposób bezproblemowy, aby rozwiązywać najbardziej skomplikowane problemy.

