DeepSeek-Prover-V2 აერთიანებს არაფორმალურ და ფორმალურ მათემატიკურ აზროვნებას

DeepSeek Prover V2

ხელოვნურმა ინტელექტმა შთამბეჭდავი პროგრესი განიცადა რთული მათემატიკური ამოცანების გადაჭრის კუთხით, თუმცა ინტუიციური მსჯელობის ფორმალურ, მანქანით გადამოწმებად მტკიცებულებებად გარდაქმნა დღემდე მნიშვნელოვან გამოწვევად რჩება.

DeepSeek AI ხატულა ლოგო

DeepSeek AI ცოტა ხნის წინ გამოავლინა DeepSeek-Prover-V2, ღია კოდის დიდი ენის მოდელი ეს წარმოადგენს გარღვევას არაფორმალური მათემატიკური ინტუიციისა და ფორმალური მტკიცებულების სისტემებისთვის მოთხოვნილი მკაცრი სიზუსტის შერწყმაში.

ფორმალური მათემატიკური მსჯელობის გამოწვევა

Deepseek Prover V2 - ფორმალური მათემატიკური მსჯელობა

მათემატიკოსები, როგორც წესი, ამოცანებს ინტუიციის, ევრისტიკისა და მაღალი დონის მსჯელობის გამოყენებით წყვეტენ - ხშირად იყენებენ კოგნიტურ მალსახმობებს, რომლებიც ადამიანებისთვის აშკარაა. ეს მიდგომა მკვეთრად ეწინააღმდეგება ფორმალურ თეორემის დამტკიცებას, რომელიც მოითხოვს სრულ სიზუსტეს, თითოეული ნაბიჯით ნათლად ჩამოყალიბებული და ლოგიკურად გამართლებული.

მიუხედავად იმისა, რომ ბოლო დროს დიდი ენის მოდელები (LLM)-მა აჩვენა შესანიშნავი უნარი, გადაჭრას რთული, შეჯიბრებითი დონის მათემატიკური ამოცანები ბუნებრივი ენის მსჯელობის გამოყენებით, თუმცა მათ უჭირთ ამ ინტუიციური მსჯელობის ფორმალურ მტკიცებულებებად გარდაქმნა, რომელთა გადამოწმებაც მანქანებს შეუძლიათ. ეს ხარვეზი არსებობს შემდეგი მიზეზების გამო:

არაფორმალური მსჯელობა ხშირად შეიცავს მოკლე გზებსა და იმპლიციტურ ნაბიჯებს.
ფორმალური სისტემები მოითხოვს თითოეული ლოგიკური ნაბიჯის ცალსახა დასაბუთებას.
ბუნებრივ ენასა და ფორმალურ ნოტაციას შორის კონვერტაცია სირთულეს ზრდის.
მათემატიკური დადასტურება აბსოლუტურ სიზუსტეს მოითხოვს.

როგორ მუშაობს DeepSeek-Prover-V2: არაფორმალური და ფორმალური მსჯელობის დამაკავშირებელი

DeepSeek-Prover-V2 იყენებს ახალ მიდგომას, რომელიც აერთიანებს როგორც არაფორმალური მსჯელობის, ასევე ფორმალური შემოწმების ძლიერ მხარეებს რეკურსიული თეორემის დამადასტურებელი მილსადენის მეშვეობით.

ინოვაციური სასწავლო არქიტექტურა

მოდელი's ტრენინგის პროცესი რამდენიმე ძირითად ეტაპს მოიცავს:

პრობლემის დაშლაDeepSeek-V3 აანალიზებს მათემატიკურ ამოცანებს და ყოფს მათ უფრო მცირე, მართვად „ქვემიზნებად“ - რაც იმიტაციას უკეთებს, თუ როგორ უმკლავდებიან ადამიანი მათემატიკოსები რთულ ამოცანებს.
ცივი დაქოქვის ტრენინგიროდესაც ქვემიზნები წარმატებით გადაწყდება, სისტემა აერთიანებს ამ გადაწყვეტილებებს სრულ ფორმალურ მტკიცებულებებად, რომლებიც დაწყვილებულია DeepSeek-V3-თან.'s აზრების ჯაჭვური მსჯელობა.
გამაგრების სწავლამოდელი იღებს უკუკავშირს გადაწყვეტის სისწორეზე და მოიცავს თანმიმდევრულობის ჯილდოს, რათა შეამციროს სტრუქტურული შეუსაბამობა გენერირებულ მტკიცებულებებსა და ლემის დაშლას შორის.

ეს მიდგომა ქმნის უნიკალურ ჩარჩოს, რომელიც აერთიანებს მაღალი დონის მათემატიკურ ინტუიციას Lean-ის მსგავსი ფორმალური დამოწმების სისტემების მიერ მოთხოვნილ სიზუსტესთან.

როგორც YouTube-ზე ბოლოდროინდელ ანალიზშია ახსნილი: „ისინი იყენებენ DeepSeek-V3-ს, მათ დიდ ენობრივ მოდელს ქვემიზნების დაშლის სამართავად და შემდეგ აერთიანებენ მას გაძლიერების სწავლება, რომელიც ქმნის ერთ მოდელს, რომელსაც შეუძლია როგორც არაფორმალური მსჯელობის, ასევე ფორმალური მტკიცებულებების გენერირების დამუშავება“.

რეკორდსმენი შესრულება

DeepSeek-Prover-V2's შესრულება აჩვენებს მნიშვნელოვან პროგრესს ნეირონულ თეორემაში, რომელიც ადასტურებს:

88.9% გამსვლელი კოეფიციენტი MiniF2F-ტესტის ბენჩმარკზე
წარმატებით მოგვარდა 49 პრობლემიდან 658 PutnamBench-დან
მიღწეული კონკურენტუნარიანი შედეგები ProofNet-სა და ახლად დანერგილ ProverBench-ზე
გადაწყდება 6 15 გარეთ AIME-ის ბოლოდროინდელი შეჯიბრებით გამოწვეული პრობლემები (შედარებისთვის, DeepSeek-V3-მა 8 პრობლემა უმრავლესობის ხმებით გადაჭრა)

მოდელი ხელმისაწვდომია ორ ზომაში:

DeepSeek-Prover-V2-7B (7 მილიარდი პარამეტრი).
DeepSeek-Prover-V2-671B (671 მილიარდი პარამეტრი).

ორივე ვერსია შთამბეჭდავ შესაძლებლობებს აჩვენებს, ხოლო უფრო დიდი 671B ვარიანტი ამკვიდრებს „miniF2F ტესტის ახალ, უახლეს შესრულებას, CoT გენერაციის სტრატეგიის გამოყენებით მხოლოდ 32 ნიმუშით უპრეცედენტო სიზუსტის მიღწევას“.

ადამიანისა და მანქანური აზროვნების შორის არსებული უფსკრულის შევიწროება

DeepSeek-Prover-V2-ს განსაკუთრებით მნიშვნელოვანს ის ხდის, თუ როგორ აგვარებს ის დიდი ხნის განმავლობაში არსებულ განხეთქილებას ადამიანების მათემატიკისადმი მიდგომასა და ფორმალური ვერიფიკაციის სისტემების ფუნქციონირებას შორის.

ექსპერიმენტული შედეგები აჩვენებს, რომ დიდ ენობრივ მოდელებში ფორმალურ და არაფორმალურ მათემატიკურ აზროვნებას შორის არსებული უფსკრული მნიშვნელოვნად მცირდება.
- აღნიშნავს კვლევით ნაშრომს

ეს იმაზე მიუთითებს, რომ ჩვენ უფრო ახლოს ვართ AI სისტემები, რომლებსაც არა მხოლოდ მათემატიკური ამოცანების გადაჭრა შეუძლიათ, არამედ ფორმალურ მათემატიკურ სტანდარტებს დაცვით დადასტურებადი მტკიცებულებების შექმნაც შეუძლიათ.

ეს განვითარება ორი მნიშვნელოვანი მიმართულებით მნიშვნელოვან წინგადადგმულ ნაბიჯს წარმოადგენს:

პრაქტიკული მათემატიკური დადასტურებაინტუიციური პრობლემების გადაჭრისა და ფორმალური მტკიცებულებების გენერირების შერწყმით, DeepSeek-Prover-V2 მანქანური დამოწმების მათემატიკას უფრო ხელმისაწვდომს ხდის.
საგანმანათლებლო პოტენციალისისტემა's შესაძლებლობა რთული პრობლემების დაშლა მართვად ქვემიზნებად დაყოფა ასახავს ეფექტურ სწავლების მეთოდებს და გვთავაზობს მათემატიკურ განათლებაში გამოყენებას.

აპლიკაციები და მომავალი შედეგები

DeepSeek-Prover-V2 კარს უხსნის მრავალ აპლიკაციას სხვადასხვა სფეროში:

კვლევის წინსვლამათემატიკური აღმოჩენების დაჩქარება ფორმალური ვერიფიკაციის ავტომატიზაციით
საგანმანათლებლო ინსტრუმენტები: სტუდენტებისთვის მათემატიკური მსჯელობის სწავლაში დახმარება ეტაპობრივი ფორმალიზაციის გზით
პროგრამული უზრუნველყოფის ვერიფიკაციაფორმალური დამტკიცების ტექნიკის გამოყენება კრიტიკული პროგრამული სისტემების დასადასტურებლად
ალგორითმული კვლევაფორმალური მეთოდების გამოყენებით ალგორითმების ოპტიმალურობის აღმოჩენა და დამტკიცება

Quantum Zeitgeist-ის მკვლევარები. აღნიშნა,

DeepSeek-Prover-V2 წარმოადგენს ძლიერ ინსტრუმენტს კვლევის წინსვლა ფორმალურ თეორემების დამტკიცებასა და მათემატიკურ მსჯელობაში, რაც როგორც პრაქტიკულ, ასევე თეორიულ სარგებელს გვთავაზობს

დასკვნა

DeepSeek-Prover-V2 ხელოვნური ინტელექტით მართული მათემატიკის თამაშის წესების შემცვლელია, რომელიც არღვევს ძველ ბარიერებს ადამიანის ინტუიციასა და ფორმალურ მტკიცებულებას შორის. მისი ღია კოდის გამოშვებით, ჭკვიანი ქვემიზნების დაშლით და რეკორდული საორიენტაციო სტატისტიკა, ეს ახლა ყველაზე მნიშვნელოვანი ინსტრუმენტია ყველასთვის, ვისაც ხელოვნური ინტელექტით მართული მათემატიკური ვერიფიკაცია ან განათლება აინტერესებს.

თუ უფრო მაღალი დონის სიზუსტეს ეძებთ და გსურთ ნახოთ AI გულწრფელად „ვფიქრობ„როგორც ა მათემატიკოსიDeepSeek-Prover-V2-ში მოქმედებაა.

დატოვე პასუხი

თქვენი ელფოსტის მისამართი გამოქვეყნებული არ იყო. აუცილებელი ველები მონიშნულია *

ეს საიტი იყენებს Akismet- ს, რათა შეამციროს სპამი. შეიტყვეთ, როგორ მუშავდება თქვენი კომენტარების მონაცემები.

გაწევრიანდით Aimojo ტომი!

შემოუერთდით 76,200+ წევრს ინსაიდერული რჩევებისთვის ყოველ კვირას! 
🎁 BONUS: მიიღეთ ჩვენი 200 დოლარიAI „ოსტატობის ინსტრუმენტების ნაკრები“ უფასოა რეგისტრაციის შემდეგ!

Trending AI ინსტრუმენტები
Netlify

უფრო სწრაფად განლაგება, უფრო ჭკვიანურად მასშტაბირება: თანამედროვე ვებ პლატფორმა სერიოზული მშენებლებისთვის Git-ზე მომუშავე CI/CD, გლობალური CDN და სერვერის გარეშე — ყველაფერი ერთ ადგილას.

ჰოლო ხელოვნური ინტელექტი

გადააქციეთ თქვენი ვებსაიტი სრულმასშტაბიან მარკეტინგულ ძრავად — გუნდის გარეშე. ხელოვნური ინტელექტით მართული სარეკლამო, სოციალური და ელექტრონული ფოსტის კონტენტის გენერატორი, შექმნილი დამფუძნებლებისა და მარკეტოლოგებისთვის.

არტიკოსი

მტკიცებულებებით და არა ინტუიციით გაგზავნეთ — მომხმარებლის კვლევა Sprint Speed-ში ხელოვნური ინტელექტით მართული სინთეზური მომხმარებლის კვლევა, რომელიც აუდიტორიის დადასტურებულ ინფორმაციას 30 წუთში გვაწვდის

Palabra.ai

დაარღვიეთ ყველა ენობრივი კედელი რეალურ დროში — ხმის დაკარგვის გარეშე ხელოვნური ინტელექტით აღჭურვილი მეტყველების თარჯიმანი, რომელიც შექმნილია პირდაპირი ღონისძიებებისთვის, ზარებისთვის და სტრიმინგისთვის

სენტარო

თქვენი AI საფრთხის შესახებ ინფორმაციის აგენტი, რომელიც ელექტრონული ფოსტით შეტევებს აჩერებს, სანამ ვინმე დააწკაპუნებს Gmail-ისა და Outlook-ისთვის ხელოვნური ინტელექტით აღჭურვილი ელფოსტის უსაფრთხოება — არანაირი MX ცვლილებები, არანაირი სირთულე.

© საავტორო უფლებები 2023 - 2026 | გახდი AI პროფესიონალი | დამზადებულია ♥-ით