DeepSeek-Prover-V2 ühendab mitteformaalse ja formaalse matemaatilise arutluskäigu

DeepSeek Prover V2

Tehisintellekt on teinud muljetavaldavaid edusamme keeruliste matemaatiliste probleemide lahendamisel, kuid intuitiivse arutluskäigu tõlkimine formaalseteks, masinkontrollitavateks tõestusteks on jäänud oluliseks väljakutseks – kuni tänaseni.

DeepSeek AI ikooni logo

DeepSeek AI on hiljuti avalikustatud DeepSeek-Prover-V2, avatud lähtekoodiga suur keelemudel mis kujutab endast läbimurret mitteametliku matemaatilise intuitsiooni ja formaalsete tõestussüsteemide nõutava range täpsuse ühendamisel.

Formaalse matemaatilise arutluskäigu väljakutse

Deepseek Prover V2 - Formaalne matemaatiline arutluskäik

Matemaatikud lahendavad probleeme tavaliselt intuitsiooni, heuristika ja kõrgetasemelise arutluskäigu abil – sageli võttes kognitiivseid otseteid, mis inimestele tunduvad ilmselged. See lähenemisviis on teravas vastuolus formaalse teoreemitõestamisega, mis nõuab täielikku täpsust, kus iga samm on selgesõnaliselt välja toodud ja loogiliselt põhjendatud.

Kuigi hiljuti suured keelemudelid Kuigi õigusteaduse magistrikraadiga (LLM) bakalaureuseõppe lõpetajad on näidanud üles märkimisväärset võimet lahendada keerulisi, võistlustasemel matemaatikaülesandeid loomuliku keele arutluskäigu abil, on neil olnud raskusi selle intuitiivse arutluskäigu teisendamisega formaalseteks tõestusteks, mida masinad saavad kontrollida. See lünk eksisteerib järgmistel põhjustel:

Mitteametlik arutluskäik sisaldab sageli otseteid ja varjatud samme.
Formaalsed süsteemid nõuavad iga loogilise sammu selget põhjendust.
Loomuliku keele ja formaalse tähistuse vaheline teisendamine lisab keerukust.
Matemaatilise tõestuse kontrollimine nõuab absoluutset täpsust.

Kuidas DeepSeek-Prover-V2 töötab: mitteformaalse ja formaalse arutluskäigu ühendamine

DeepSeek-Prover-V2 kasutab uudset lähenemisviisi, mis ühendab nii mitteametliku arutluskäigu kui ka formaalse verifitseerimise tugevused oma rekursiivse teoreemitõestamise protsessi kaudu.

Innovatiivne koolitusarhitektuur

Mudel's Koolitusprotsess koosneb mitmest põhietapist:

Probleemi lagunemineDeepSeek-V3 analüüsib matemaatilisi probleeme ja jagab need väiksemateks, hallatavamateks "alameesmärkideks" – jäljendades seda, kuidas inimmatemaatikud keerulisi probleeme lahendavad.
KülmkäivituskoolitusKui alaeesmärgid on edukalt lahendatud, ühendab süsteem need lahendused täielikeks formaalseteks tõestusteks koos DeepSeek-V3-ga.'s mõtteahelal põhinev arutluskäik.
TugevdusõpeMudel saab tagasisidet lahenduse õigsuse kohta ja sisaldab järjepidevuse preemiat, et vähendada struktuurilist ebakõla genereeritud tõestuste ja lemmadekompositsiooni vahel.

See lähenemisviis loob ainulaadse raamistiku, mis ühendab kõrgetasemelise matemaatilise intuitsiooni täpsusega, mida nõuavad formaalsed verifitseerimissüsteemid nagu Lean.

Nagu hiljutises YouTube'i jaotuses selgitati: „Nad kasutavad alaeesmärkide lagundamiseks oma suurt keelemudelit DeepSeek-V3 ja seejärel kombineerivad selle…“ tugevdamise õppimine, luues ühtse mudeli, mis suudab käsitleda nii mitteformaalset arutluskäiku kui ka formaalset tõestuse genereerimist”.

Rekordimurdeline esitus

DeepSeek-Prover-V2's jõudlus näitab märkimisväärset edu närviteoreemi tõestamisel:

88.9% läbimisprotsent MiniF2F-testi võrdlusalusel
Edukalt lahendatud 49 probleemi 658-st PutnamBenchilt
Saavutasime konkurentsivõimelisi tulemusi ProofNetis ja äsja kasutusele võetud ProverBenchis
Lahendatud 6 välja 15 Hiljutised AIME võistlusprobleemid (võrreldes DeepSeek-V3-ga, mis lahendas 8 enamushääletusega)

Mudel on saadaval kahes suuruses:

DeepSeek-Prover-V2-7B (7 miljardit parameetrit).
DeepSeek-Prover-V2-671B (671 miljardit parameetrit).

Mõlemad versioonid demonstreerivad muljetavaldavaid võimeid, kusjuures suurem 671B variant loob „miniF2F-testi võrdlusalusel uue tipptasemel jõudluse, saavutades CoT genereerimisstrateegiat kasutades enneolematu täpsuse vaid 32 valimiga“.

Inimese ja masina arutluskäigu vahelise lõhe vähendamine

DeepSeek-Prover-V2 eriti oluliseks teeb see, kuidas see käsitleb pikaajalist lõhet inimeste matemaatikale lähenemise ja formaalsete verifitseerimissüsteemide toimimise vahel.

Eksperimentaalsed tulemused näitavad, et formaalse ja mitteformaalse matemaatilise arutluskäigu vaheline lõhe suurtes keelemudelites väheneb oluliselt.
- võtab teadmiseks uurimistöö

See viitab sellele, et me liigume lähemale AI süsteemid, mis suudavad mitte ainult lahendada matemaatilisi probleeme, vaid ka luua kontrollitavaid tõestusi, mis vastavad formaalsetele matemaatilistele standarditele.

See areng kujutab endast olulist sammu edasi kahel olulisel moel:

Praktiline matemaatiline verifitseerimineKombineerides intuitiivse probleemide lahendamise formaalse tõestuse genereerimisega, muudab DeepSeek-Prover-V2 masinkontrollitud matemaatika kättesaadavamaks.
HariduspotentsiaalSüsteem's võime lahendada keerulisi probleeme hallatavateks alaeesmärkideks peegeldab tõhusaid õpetamismeetodeid, pakkudes rakendusi matemaatikaõpetuses.

Rakendused ja tulevased tagajärjed

DeepSeek-Prover-V2 avab uksed arvukatele rakendustele erinevates valdkondades:

Teadusuuringute edendamineMatemaatiliste avastuste kiirendamine formaalse kontrollimise automatiseerimise abil
Haridusvahendid: Õpilaste abistamine matemaatilise arutluskäigu õppimisel samm-sammult formaliseerimise kaudu
Tarkvara verifitseerimineFormaalsete tõestustehnikate rakendamine kriitiliste tarkvarasüsteemide verifitseerimiseks
Algoritmiline uurimineAlgoritmide optimaalsuse avastamine ja tõestamine formaalsete meetodite abil

Quantum Zeitgeisti teadlased. märgitud,

DeepSeek-Prover-V2 on võimas tööriist teadusuuringute edendamine formaalses teoreemitõestuses ja matemaatilises arutluskäigus, pakkudes nii praktilist kui ka teoreetilist kasu

Järeldus

DeepSeek-Prover-V2 muudab tehisintellektil põhineva matemaatika mängu, purustades vanad barjäärid inimese intuitsiooni ja formaalse tõestuse vahel. Oma avatud lähtekoodiga versiooni, nutika alaeesmärkide jaotuse ja... rekordilisi võrdlusstatistikaid, see on nüüd igaühe peamine tööriistakomplekt, kes on huvitatud tehisintellektil põhinevast matemaatilisest kontrollimisest või haridusest.

Kui otsite järgmise taseme täpsust ja soovite näha AI siiralt "mõtlema"nagu üks matemaatik, DeepSeek-Prover-V2 on koht, kus tegevus toimub.

Jäta vastus

Sinu e-postiaadressi ei avaldata. Kohustuslikud väljad on märgitud *

Sellel saidil kasutatakse rämpsposti vähendamiseks Akismetit. Vaadake, kuidas teie kommentaaride andmeid töödeldakse.

Liitu Aimojo Hõim!

Liituge 76,200 XNUMX+ liikmega, et saada igal nädalal siseringi nõuandeid! 
🎁 BONUS: Hankige meie 200 dollaritAI "Meisterlikkuse tööriistakomplekt" TASUTA registreerumisel!

Trendid AI TÖÖRIISTAD
AskCodi

Mitmemudel AI Kodeerimisplatvorm, mis välistab müüjaga seotuse Teie ühtne värav GPT, Claude'i, Gemini ja avatud lähtekoodiga LLM-ide juurde ühes tööruumis.

ScraperAPI

Muutke mis tahes veebileht struktureeritud andmeteks ühe API-kõnega Nutikas puhverserver ja CAPTCHA lahendaja, mis on loodud arendajatele, kes tegelevad suure hulga andmete kogumisega.

Trinka AI

Akadeemilise kirjutamise assistent, kes avaldab teie uurimistöö kiiremini AI Grammatikakontroll, mis on loodud akadeemiliseks ja tehniliseks kirjutamiseks

DiffusionHub

Käivita stabiilset difusiooni pilves ilma GPU-ta Teie nõudmisel AI Kunsti- ja videote genereerimise platvorm

kaiber

Muutke heli, tekst ja fotod vapustavaks AI Genereeritud video Lõputu lõuend muusikutele, kunstnikele ja visuaalsetele loojatele

© Autoriõigus 2023 - 2026 | Hakka AI Pro | Valmistatud ♥-ga