
Tehisintellekt on teinud muljetavaldavaid edusamme keeruliste matemaatiliste probleemide lahendamisel, kuid intuitiivse arutluskäigu tõlkimine formaalseteks, masinkontrollitavateks tõestusteks on jäänud oluliseks väljakutseks – kuni tänaseni.

DeepSeek AI on hiljuti avalikustatud DeepSeek-Prover-V2, avatud lähtekoodiga suur keelemudel, mis kujutab endast läbimurret mitteametliku matemaatilise intuitsiooni ja formaalsete tõestussüsteemide nõutava range täpsuse ühendamisel.
DeepSeek AI on hiljuti avalikustatud DeepSeek-Prover-V2, avatud lähtekoodiga suur keelemudel mis kujutab endast läbimurret mitteametliku matemaatilise intuitsiooni ja formaalsete tõestussüsteemide nõutava range täpsuse ühendamisel.
Formaalse matemaatilise arutluskäigu väljakutse

Matemaatikud lahendavad probleeme tavaliselt intuitsiooni, heuristika ja kõrgetasemelise arutluskäigu abil – sageli võttes kognitiivseid otseteid, mis inimestele tunduvad ilmselged. See lähenemisviis on teravas vastuolus formaalse teoreemitõestamisega, mis nõuab täielikku täpsust, kus iga samm on selgesõnaliselt välja toodud ja loogiliselt põhjendatud.
Kuigi hiljuti suured keelemudelid Kuigi õigusteaduse magistrikraadiga (LLM) bakalaureuseõppe lõpetajad on näidanud üles märkimisväärset võimet lahendada keerulisi, võistlustasemel matemaatikaülesandeid loomuliku keele arutluskäigu abil, on neil olnud raskusi selle intuitiivse arutluskäigu teisendamisega formaalseteks tõestusteks, mida masinad saavad kontrollida. See lünk eksisteerib järgmistel põhjustel:
Kuidas DeepSeek-Prover-V2 töötab: mitteformaalse ja formaalse arutluskäigu ühendamine
DeepSeek-Prover-V2 kasutab uudset lähenemisviisi, mis ühendab nii mitteametliku arutluskäigu kui ka formaalse verifitseerimise tugevused oma rekursiivse teoreemitõestamise protsessi kaudu.
Innovatiivne koolitusarhitektuur
Mudel's Koolitusprotsess koosneb mitmest põhietapist:
See lähenemisviis loob ainulaadse raamistiku, mis ühendab kõrgetasemelise matemaatilise intuitsiooni täpsusega, mida nõuavad formaalsed verifitseerimissüsteemid nagu Lean.
Nagu hiljutises YouTube'i jaotuses selgitati: „Nad kasutavad alaeesmärkide lagundamiseks oma suurt keelemudelit DeepSeek-V3 ja seejärel kombineerivad selle…“ tugevdamise õppimine, luues ühtse mudeli, mis suudab käsitleda nii mitteformaalset arutluskäiku kui ka formaalset tõestuse genereerimist”.
Rekordimurdeline esitus
DeepSeek-Prover-V2's jõudlus näitab märkimisväärset edu närviteoreemi tõestamisel:

Mudel on saadaval kahes suuruses:
Mõlemad versioonid demonstreerivad muljetavaldavaid võimeid, kusjuures suurem 671B variant loob „miniF2F-testi võrdlusalusel uue tipptasemel jõudluse, saavutades CoT genereerimisstrateegiat kasutades enneolematu täpsuse vaid 32 valimiga“.
Inimese ja masina arutluskäigu vahelise lõhe vähendamine

DeepSeek-Prover-V2 eriti oluliseks teeb see, kuidas see käsitleb pikaajalist lõhet inimeste matemaatikale lähenemise ja formaalsete verifitseerimissüsteemide toimimise vahel.
See viitab sellele, et me liigume lähemale AI süsteemid, mis suudavad mitte ainult lahendada matemaatilisi probleeme, vaid ka luua kontrollitavaid tõestusi, mis vastavad formaalsetele matemaatilistele standarditele.
See areng kujutab endast olulist sammu edasi kahel olulisel moel:
Rakendused ja tulevased tagajärjed
DeepSeek-Prover-V2 avab uksed arvukatele rakendustele erinevates valdkondades:

Quantum Zeitgeisti teadlased. märgitud,
Järeldus
DeepSeek-Prover-V2 muudab tehisintellektil põhineva matemaatika mängu, purustades vanad barjäärid inimese intuitsiooni ja formaalse tõestuse vahel. Oma avatud lähtekoodiga versiooni, nutika alaeesmärkide jaotuse ja... rekordilisi võrdlusstatistikaid, see on nüüd igaühe peamine tööriistakomplekt, kes on huvitatud tehisintellektil põhinevast matemaatilisest kontrollimisest või haridusest.
Kui otsite järgmise taseme täpsust ja soovite näha AI siiralt "mõtlema"nagu üks matemaatik, DeepSeek-Prover-V2 on koht, kus tegevus toimub.

