DeepSeek-Prover-V2 ühendab mitteformaalse ja formaalse matemaatilise arutluskäigu

juhendid Uudised

by Catherine

1 aasta tagasi 0 1218

DeepSeek Prover V2

Tehisintellekt on teinud muljetavaldavaid edusamme keeruliste matemaatiliste probleemide lahendamisel, kuid intuitiivse arutluskäigu tõlkimine formaalseteks, masinkontrollitavateks tõestusteks on jäänud oluliseks väljakutseks – kuni tänaseni.

DeepSeek AI on hiljuti avalikustatud DeepSeek-Prover-V2, avatud lähtekoodiga suur keelemudel, mis kujutab endast läbimurret mitteametliku matemaatilise intuitsiooni ja formaalsete tõestussüsteemide nõutava range täpsuse ühendamisel.

DeepSeek AI on hiljuti avalikustatud DeepSeek-Prover-V2, avatud lähtekoodiga suur keelemudel mis kujutab endast läbimurret mitteametliku matemaatilise intuitsiooni ja formaalsete tõestussüsteemide nõutava range täpsuse ühendamisel.

Formaalse matemaatilise arutluskäigu väljakutse

Deepseek Prover V2 - Formaalne matemaatiline arutluskäik

Matemaatikud lahendavad probleeme tavaliselt intuitsiooni, heuristika ja kõrgetasemelise arutluskäigu abil – sageli võttes kognitiivseid otseteid, mis inimestele tunduvad ilmselged. See lähenemisviis on teravas vastuolus formaalse teoreemitõestamisega, mis nõuab täielikku täpsust, kus iga samm on selgesõnaliselt välja toodud ja loogiliselt põhjendatud.

Kuigi hiljuti suured keelemudelid Kuigi õigusteaduse magistrikraadiga (LLM) bakalaureuseõppe lõpetajad on näidanud üles märkimisväärset võimet lahendada keerulisi, võistlustasemel matemaatikaülesandeid loomuliku keele arutluskäigu abil, on neil olnud raskusi selle intuitiivse arutluskäigu teisendamisega formaalseteks tõestusteks, mida masinad saavad kontrollida. See lünk eksisteerib järgmistel põhjustel:

Mitteametlik arutluskäik sisaldab sageli otseteid ja varjatud samme.

Formaalsed süsteemid nõuavad iga loogilise sammu selget põhjendust.

Loomuliku keele ja formaalse tähistuse vaheline teisendamine lisab keerukust.

Matemaatilise tõestuse kontrollimine nõuab absoluutset täpsust.

Kuidas DeepSeek-Prover-V2 töötab: mitteformaalse ja formaalse arutluskäigu ühendamine

DeepSeek-Prover-V2 kasutab uudset lähenemisviisi, mis ühendab nii mitteametliku arutluskäigu kui ka formaalse verifitseerimise tugevused oma rekursiivse teoreemitõestamise protsessi kaudu.

Innovatiivne koolitusarhitektuur

Mudel's Koolitusprotsess koosneb mitmest põhietapist:

Probleemi lagunemineDeepSeek-V3 analüüsib matemaatilisi probleeme ja jagab need väiksemateks, hallatavamateks "alameesmärkideks" – jäljendades seda, kuidas inimmatemaatikud keerulisi probleeme lahendavad.

KülmkäivituskoolitusKui alaeesmärgid on edukalt lahendatud, ühendab süsteem need lahendused täielikeks formaalseteks tõestusteks koos DeepSeek-V3-ga.'s mõtteahelal põhinev arutluskäik.

TugevdusõpeMudel saab tagasisidet lahenduse õigsuse kohta ja sisaldab järjepidevuse preemiat, et vähendada struktuurilist ebakõla genereeritud tõestuste ja lemmadekompositsiooni vahel.

See lähenemisviis loob ainulaadse raamistiku, mis ühendab kõrgetasemelise matemaatilise intuitsiooni täpsusega, mida nõuavad formaalsed verifitseerimissüsteemid nagu Lean.

Nagu hiljutises YouTube'i jaotuses selgitati: „Nad kasutavad alaeesmärkide lagundamiseks oma suurt keelemudelit DeepSeek-V3 ja seejärel kombineerivad selle…“ tugevdamise õppimine, luues ühtse mudeli, mis suudab käsitleda nii mitteformaalset arutluskäiku kui ka formaalset tõestuse genereerimist”.

Rekordimurdeline esitus

DeepSeek-Prover-V2's jõudlus näitab märkimisväärset edu närviteoreemi tõestamisel:

88.9% läbimisprotsent MiniF2F-testi võrdlusalusel

Edukalt lahendatud 49 probleemi 658-st PutnamBenchilt

Saavutasime konkurentsivõimelisi tulemusi ProofNetis ja äsja kasutusele võetud ProverBenchis

Lahendatud 6 välja 15 Hiljutised AIME võistlusprobleemid (võrreldes DeepSeek-V3-ga, mis lahendas 8 enamushääletusega)

Mudel on saadaval kahes suuruses:

DeepSeek-Prover-V2-7B (7 miljardit parameetrit).

DeepSeek-Prover-V2-671B (671 miljardit parameetrit).

Mõlemad versioonid demonstreerivad muljetavaldavaid võimeid, kusjuures suurem 671B variant loob „miniF2F-testi võrdlusalusel uue tipptasemel jõudluse, saavutades CoT genereerimisstrateegiat kasutades enneolematu täpsuse vaid 32 valimiga“.

Inimese ja masina arutluskäigu vahelise lõhe vähendamine

DeepSeek-Prover-V2 eriti oluliseks teeb see, kuidas see käsitleb pikaajalist lõhet inimeste matemaatikale lähenemise ja formaalsete verifitseerimissüsteemide toimimise vahel.

Eksperimentaalsed tulemused näitavad, et formaalse ja mitteformaalse matemaatilise arutluskäigu vaheline lõhe suurtes keelemudelites väheneb oluliselt.
- võtab teadmiseks uurimistöö

See viitab sellele, et me liigume lähemale AI süsteemid, mis suudavad mitte ainult lahendada matemaatilisi probleeme, vaid ka luua kontrollitavaid tõestusi, mis vastavad formaalsetele matemaatilistele standarditele.

See areng kujutab endast olulist sammu edasi kahel olulisel moel:

Praktiline matemaatiline verifitseerimineKombineerides intuitiivse probleemide lahendamise formaalse tõestuse genereerimisega, muudab DeepSeek-Prover-V2 masinkontrollitud matemaatika kättesaadavamaks.

HariduspotentsiaalSüsteem's võime lahendada keerulisi probleeme hallatavateks alaeesmärkideks peegeldab tõhusaid õpetamismeetodeid, pakkudes rakendusi matemaatikaõpetuses.

Rakendused ja tulevased tagajärjed

DeepSeek-Prover-V2 avab uksed arvukatele rakendustele erinevates valdkondades:

Teadusuuringute edendamineMatemaatiliste avastuste kiirendamine formaalse kontrollimise automatiseerimise abil

Haridusvahendid: Õpilaste abistamine matemaatilise arutluskäigu õppimisel samm-sammult formaliseerimise kaudu

Tarkvara verifitseerimineFormaalsete tõestustehnikate rakendamine kriitiliste tarkvarasüsteemide verifitseerimiseks

Algoritmiline uurimineAlgoritmide optimaalsuse avastamine ja tõestamine formaalsete meetodite abil

Quantum Zeitgeisti teadlased. märgitud,

DeepSeek-Prover-V2 on võimas tööriist teadusuuringute edendamine formaalses teoreemitõestuses ja matemaatilises arutluskäigus, pakkudes nii praktilist kui ka teoreetilist kasu

Järeldus

DeepSeek-Prover-V2 muudab tehisintellektil põhineva matemaatika mängu, purustades vanad barjäärid inimese intuitsiooni ja formaalse tõestuse vahel. Oma avatud lähtekoodiga versiooni, nutika alaeesmärkide jaotuse ja... rekordilisi võrdlusstatistikaid, see on nüüd igaühe peamine tööriistakomplekt, kes on huvitatud tehisintellektil põhinevast matemaatilisest kontrollimisest või haridusest.

Kui otsite järgmise taseme täpsust ja soovite näha AI siiralt "mõtlema"nagu üks matemaatik, DeepSeek-Prover-V2 on koht, kus tegevus toimub.

DeepSeek-Prover-V2

Loe rohkem

AI Isikliku tootlikkuse saavutamiseks: parimad automatiseerimisseadistused, mis tegelikult teie tunde kokku hoiavad

AI Isikliku tootlikkuse saavutamiseks: parimad automatiseerimisseadistused, mis tegelikult teie tunde kokku hoiavad

4 päeva tagasi

0 26

Kas kiirtehnika on hea karjäär aastal 2026? (Aus ja otsekohene vastus)

Kas kiirtehnika on hea karjäär aastal 2026? (Aus ja otsekohene vastus)

2 nädalat tagasi

0 50

Kuidas kirjutada AI Küsimused iga kasutusjuhtumi jaoks (50 reaalset näidet)

Kuidas kirjutada AI Küsimused iga kasutusjuhtumi jaoks (50 reaalset näidet)

2 nädalat tagasi

0 78

Jäta vastus Tühista vastus

Sellel saidil kasutatakse rämpsposti vähendamiseks Akismetit. Vaadake, kuidas teie kommentaaride andmeid töödeldakse.

Trendid AI TÖÖRIISTAD