
გაინტერესებთ შექმნა, დახვეწა ან განლაგება დიდი ენის მოდელები?
თქვენ მარტო არ ხართ - LLM-ის ექსპერტიზა ერთ-ერთი ყველაზე პოპულარული უნარია AI დღეს. თან ღია კოდის პროექტები სწრაფად მზარდი GitHub გახდა მთავარი ცენტრი მაღალი დონის მომხმარებლებისთვის. LLM პროექტები, ჩარჩოები და კვლევა.
ეს სახელმძღვანელო 12 აუცილებელ საკითხს განიხილავს GitHub საცავი სავსეა საწყისი კოდით, პრაქტიკული სახელმძღვანელოებითა და მოდელის იმპლემენტაციებით.
დაამტკიცეთ LLM ცოდნა, დააჩქარეთ თქვენი სწავლა და შემოუერთდით გლობალურ საზოგადოებას, რომელიც აყალიბებს ხელოვნური ინტელექტის მომავალს — ეს ყველაფერი ამ აუცილებლად ცნობილი GitHub რეპოზიტორების დახმარებით.
რატომ GitHub აუცილებელია LLM განვითარებისთვის
GitHub გახდა LLM ეკოსისტემის მცოცავი გული, სადაც ინოვაციური კვლევა ხვდება პრაქტიკულ განხორციელებას. მიუხედავად იმისა, რომ აკადემიური ნაშრომები თეორიას გვაწვდის, GitHub გთავაზობთ რეალურ კოდს, რომელიც დღეს ძალას აძლევს.'s ყველაზე მოწინავე ენობრივი მოდელები.
პლატფორმა მასპინძლობს ყველაფერს Meta-დან's ლამას იმპლემენტაციები OpenAI-ში's კოდების ბაზების კვლევა, რაც მას დადასტურებულ ტექნიკებზე წვდომის უსწრაფეს გზად აქცევს და სწრაფ განვითარებას უსწრებს.
ძირითადი მიზეზები, რის გამოც GitHub დომინირებს LLM-ის განვითარებაში:
LLM-ის მოყვარულთათვის GitHub მხოლოდ რესურსი არ არის — ის's თქვენი პირდაპირი ხაზი მომავლისკენ AI განვითარება.
1. LLM-კურსი

მაქსიმ ლაბონი's LLM-კურსი ფანტასტიკური საწყისი წერტილი და ყოვლისმომცველი გზამკვლევია ყველასთვის, ვინც სერიოზულად არის დაინტერესებული... სამართლის მაგისტრის სწავლა. ეს's მეტი, ვიდრე უბრალოდ ფაილების კოლექცია; ეს's სტრუქტურირებული სასწავლო გზა, რომელიც სხვადასხვა კარიერულ მიზნებს ემსახურება. საცავმა უდიდესი პოპულარობა მოიპოვა და GitHub-ზე 51,500-ზე მეტი ვარსკვლავით გამოირჩევა.
რატომ's საუკეთესო არჩევანი
ეს საცავი გამოირჩევა იმით, რომ ის გთავაზობთ ორ განსხვავებულ გზამკვლევს, რაც საშუალებას გაძლევთ, თქვენი სასწავლო გზა მორგებული გქონდეთ:
კურსი მოიცავს ყველაფერს, საფუძვლებიდან დაწყებული სამართლის მაგისტრი მათემატიკა ისეთ მოწინავე თემებამდე, როგორიცაა კვანტიზაცია, დახვეწა და მოდელის განლაგება. ეს არის სრული პაკეტი ყველა დონის შემსწავლელებისთვის.
ძირითადი თვისებები

ვინ უნდა გამოიყენოს იგი?
ეს საცავი იდეალურია როგორც დამწყებთათვის, რომლებსაც სტრუქტურირებული შესავალი სჭირდებათ, ასევე გამოცდილი პროფესიონალებისთვის, რომლებიც ცდილობენ გააღრმავონ თავიანთი ექსპერტიზა LLM-ის განვითარების კონკრეტულ სფეროებში.
2. HandsOnLLM
HandsOnLLM/Hands-On-Large-Language-Models საცავი წარმოადგენს ოფიციალური თანმხლები... ო’რაილის წიგნი ამავე სახელწოდების. ეს's ვიზუალურად მდიდარი და პრაქტიკული სახელმძღვანელო, რომელიც განმარტავს, თუ როგორ მუშაობს LLM. თუ საუკეთესოდ სწავლობთ პრაქტიკით და აფასებთ კარგად დოკუმენტირებული კოდის მაგალითებს, ეს საცავი თქვენთვისაა.
რატომ's საუკეთესო არჩევანი
ის გთავაზობთ პრაქტიკულ, პროექტებზე დაფუძნებულ მიდგომას სწავლისადმი. წიგნის თითოეულ თავს თან ახლავს Jupyter-ის რვეულები, რაც საშუალებას გაძლევთ, თავად მიჰყვეთ პროცესს და ექსპერიმენტები ჩაატაროთ კოდთან. ის ფოკუსირებულია რეალურ პროექტებსა და მაგალითებზე, რომელთა ადაპტირებაც თქვენივე გამოყენების შემთხვევებისთვის შეგიძლიათ.

ძირითადი თვისებები
ვინ უნდა გამოიყენოს იგი?
დეველოპერები და მონაცემთა მეცნიერები, რომლებიც უპირატესობას ანიჭებენ პრაქტიკულ, პროექტზე დაფუძნებულ სწავლების სტილს, ამ საცავს წარმოუდგენლად ღირებულად მიიჩნევენ. ის ასევე შესანიშნავი რესურსია ყველასთვის, ვინც კითხულობს წიგნს „პრაქტიკული დიდი ენობრივი მოდელები“.
3. სწრაფი ინჟინერია
Brexhq/Prompt-Engineering სახელმძღვანელო ხელოვნებისა და მეცნიერების დაუფლების საგანძურია. სწრაფი ინჟინერიაLLM-ის სამყაროში თქვენი ნაშრომის ხარისხი ხშირად განისაზღვრება თქვენი შეყვანის ხარისხით, რაც ამ უნარს აბსოლუტურად აუცილებელს ხდის. ეს საცავი, თითქმის 9,000 ვარსკვლავით, გთავაზობთ პრაქტიკულ რჩევებსა და სტრატეგიებს GPT-4-ის მსგავს მოდელებთან მუშაობისთვის.
რატომ's საუკეთესო არჩევანი
ის აერთიანებს წარმოების გამოყენების შემთხვევებისთვის მინიშნებების შექმნიდან მიღებულ გაკვეთილებს, რაც მას ძალიან პრაქტიკულს ხდის. საცავი კარგად არის ორგანიზებული სახელმძღვანელოებად, რომლებიც მოიცავს ყველაფერს, ძირითადი პრინციპებიდან დაწყებული, მოწინავე ტექნიკებით დამთავრებული, როგორიცაა აზროვნების ჯაჭვის (CoT) სტიმულირება და თვითთანმიმდევრულობა.

ძირითადი თვისებები
ვინ უნდა გამოიყენოს იგი?
ამ საცავით ისარგებლებს ნებისმიერი ადამიანი, ვინც ურთიერთობს სამართლის მაგისტრებთან, დეველოპერებიდან და მკვლევარებიდან დაწყებული, კონტენტის შემქმნელებითა და მარკეტოლოგებით დამთავრებული. სწრაფი ინჟინერიის დაუფლება ნებისმიერი ენობრივი მოდელიდან მაქსიმალური სარგებლის მისაღებად აუცილებელი უნარია.
4. შესანიშნავი-LLM

Hannibal046/Awesome-LLM საცავი წარმოადგენს დიდი ენის მოდელებთან დაკავშირებული ყველაფრის შერჩეულ სიას. წარმოიდგინეთ ის, როგორც თქვენი ცენტრალური პანელი LLM ეკოსისტემის შესახებ უახლესი ინფორმაციის მისაღებად. ეს არის რესურსების ცოცხალი კოლექცია, რომელსაც საზოგადოება რეგულარულად აახლებს.
რატომ's საუკეთესო არჩევანი
ეს საცავი დაგიზოგავთ უამრავ საათს ძიების დროს, ერთ ადგილას აგროვებს რა აუცილებელ რესურსებს. ის მოიცავს საკვანძო სამეცნიერო ნაშრომებს, სასწავლო ჩარჩოებს, დანერგვის ინსტრუმენტებს და შეფასების ტესტებს. მას ასევე აქვს ლიდერბორდი სხვადასხვა სამართლის მაგისტრის შესრულების თვალყურის დევნებისთვის.
ძირითადი თვისებები
ვინ უნდა გამოიყენოს იგი?
ეს აუცილებელია მკვლევარებისთვის, სტუდენტებისა და პრაქტიკოსებისთვის, რომლებსაც სურთ მაღალი ხარისხის LLM რესურსების ერთიანი მაღაზია. ის იდეალურია ახალი ინსტრუმენტების აღმოსაჩენად და უახლესი კვლევების შესახებ ინფორმირებულობისთვის.
5. ხელსაწყოების მაგიდა

რადგან LLM-ები უფრო აგენტურები ხდებიან, მათი გარე ინსტრუმენტების გამოყენების უნარი სულ უფრო მნიშვნელოვანი ხდება. OpenBMB/ToolBench საცავი არის ღია პლატფორმა შექმნილია ინსტრუმენტების სწავლების სფეროში სამართლის მაგისტრების მომზადების, მომსახურებისა და შეფასებისთვის. ის უზრუნველყოფს ჩარჩოს და ფართომასშტაბიანი ინსტრუქციების რეგულირების მონაცემთა ნაკრებებს ამ შესაძლებლობების გასაძლიერებლად.
რატომ's საუკეთესო არჩევანი
ToolBench ფოკუსირებულია LLM-ის განვითარების კრიტიკულ და ტრენდულ სფეროზე: ინსტრუმენტების გამოყენებაზე. StableToolBench-ის გაფართოება კიდევ უფრო აძლიერებს ამ საკითხს ისეთი ფუნქციების დანერგვით, როგორიცაა MirrorAPI, რომელიც ათასობით რეალური API-ებიდა ვირტუალური API სისტემა შეფასების დროს სტაბილურობისა და თანმიმდევრულობის უზრუნველსაყოფად.

ძირითადი თვისებები
ვინ უნდა გამოიყენოს იგი?

მკვლევარები და დეველოპერები, რომლებიც დაინტერესებულნი არიან აგენტური სამართლის მაგისტრის შექმნით, რომელსაც შეუძლია ურთიერთქმედება გარე API-ები და ხელსაწყოები ToolBench-ს ფასდაუდებლად მიიჩნევენ. ის იდეალურია მათთვის, ვინც უფრო ქმედითი და ავტონომიური სისტემების შექმნაზე მუშაობს. AI აგენტები.
6. პითია
EleutherAI-ის მიერ შემუშავებული EleutherAI/pythia საცავი წარმოადგენს მოდელების კომპლექტს, რომელიც შექმნილია ინტერპრეტაციის, სწავლის დინამიკისა და ეთიკის კვლევის უზრუნველსაყოფად. სხვა მოდელების მრავალი გამოშვებისგან განსხვავებით, Pythia კომპლექტი შეიქმნა გამჭვირვალობისა და სამეცნიერო კვლევის მიზნებისთვის, როგორც მისი ძირითადი მიზნებისთვის.
რატომ's საუკეთესო არჩევანი
Pythia უზრუნველყოფს სრულად ღია კოდის წვდომას 16 სხვადასხვა მოდელის საკონტროლო წერტილზე, რაც მკვლევრებს საშუალებას აძლევს შეისწავლონ, თუ როგორ ვითარდება და ვითარდება LLM-ები ტრენინგის დროს. ეს გადამწყვეტია ამ მოდელების „შავი ყუთის“ ბუნების გასაგებად და ისეთი სფეროების კვლევისთვის, როგორიცაა მასშტაბირების კანონები და მოდელის ეთიკა.

ძირითადი თვისებები
ვინ უნდა გამოიყენოს იგი?
AI მოდელის ინტერპრეტაციაზე, უსაფრთხოებასა და LLM სწავლების ფუნდამენტურ პრინციპებზე ორიენტირებული მკვლევარები, ეთიკოსები და სტუდენტები ამ საცავიდან დიდ სარგებელს მიიღებენ.
7. LLM-აგენტის ნაშრომების სია

მათთვის, ვისაც სურს აკადემიურ სფეროში ღრმად ჩაუღრმავდეს AI აგენტები, WooooDyy/LLM-Agent-Paper-List წარმოადგენს აუცილებელ რესურსს. ეს საცავი წარმოადგენს კვლევითი ნაშრომების კურირებულ კრებულს, რომელიც სისტემატურად იკვლევს შემუშავებას, გამოყენებას და დანერგვას. LLM-ზე დაფუძნებული აგენტები.
რატომ's საუკეთესო არჩევანი
ის ცოდნის ფუნდამენტურ ბიბლიოთეკას წარმოადგენს ერთ-ერთი ყველაზე საინტერესო სფეროსთვის. AI დღეს. მხოლოდ კოდის ნაცვლად, ეს საცავი გთავაზობთ თეორიულ საფუძვლებს, რომლებიც გჭირდებათ შემდეგი თაობის გასაგებად და შესაქმნელად. AI აგენტები.
ძირითადი თვისებები

ვინ უნდა გამოიყენოს იგი?
ეს საცავი განკუთვნილია აკადემიური მკვლევრებისთვის, მაგისტრანტებისთვის და მოწინავე პრაქტიკოსებისთვის, რომლებსაც სურთ LLM-ზე დაფუძნებული აგენტების სფეროში უახლესი კვლევის საფუძველზე მუშაობა.
8. შესანიშნავი მულტიმოდალური დიდი ენობრივი მოდელები
LLM-ები აღარ შემოიფარგლებიან მხოლოდ ტექსტით. BradyFU/Awesome-Multimodal-Large-Language-Models საცავი წარმოადგენს მულტიმოდალური LLM-ების (MLLM) უახლეს მიღწევებზე ორიენტირებული რესურსების კურირებულ კრებულს, რომელსაც შეუძლია ინფორმაციის დამუშავება ტექსტიდან, სურათებიდან, აუდიოდან და ვიდეოდან.
რატომ's საუკეთესო არჩევანი
ეს საცავი თქვენი კარიბჭეა MLLM-ების სამყაროში. ის მოიცავს თემების ფართო სპექტრს, მულტიმოდალური ინსტრუქციის მორგებიდან დაწყებული, აზროვნების ჯაჭვური მსჯელობისა და ჰალუცინაციების შემცირების ტექნიკებით დამთავრებული. ის ასევე დაკავშირებულია VITA პროექტთან, ღია კოდის ინტერაქტიულ მულტიმოდალურ LLM პლატფორმასთან.

ძირითადი თვისებები
ვინ უნდა გამოიყენოს იგი?
დეველოპერები და მკვლევარები, რომლებიც დაინტერესებულნი არიან ტექსტზე მეტი სქემის მქონე აპლიკაციების შექმნით, როგორიცაა სურათების წარწერები, ვიდეო ანალიზი ან ხმოვანი ასისტენტები, ამ კოლექციას ძალიან სასარგებლოდ მიიჩნევენ.
9. DeepSpeed
Microsoft-ის მიერ შემუშავებული microsoft/DeepSpeed არის ღრმა სწავლების ოპტიმიზაციის ბიბლიოთეკა, რომელიც განაწილებულ ტრენინგსა და ინფერენციას მარტივს და ეფექტურს ხდის. ის შეუფერხებლად ინტეგრირდება პიტორჩი და მნიშვნელოვანი როლი ითამაშა მსოფლიოს ზოგიერთი წევრის მომზადებაში's უდიდესი მოდელები, მათ შორის 530 მილიარდი პარამეტრის მქონე მეგატრონ-ტურინგის მოდელი.

რატომ's საუკეთესო არჩევანი
DeepSpeed-ი მასშტაბირებასა და ეფექტურობაზეა ორიენტირებული. ის გთავაზობთ სისტემურ დონის ინოვაციებს, რომლებიც საშუალებას გაძლევთ, შეზღუდულ აპარატურაზე მილიარდობით პარამეტრით მოამზადოთ მასიური მოდელები. მისი ფუნქციები აუცილებელია ყველასთვის, ვინც სერიოზულად არის დაინტერესებული უახლესი LLM-ის ნულიდან მომზადებით ან დიდი მოდელების დახვეწით.
ძირითადი თვისებები
ვინ უნდა გამოიყენოს იგი?
ეს არის ინსტრუმენტი სერიოზული პრაქტიკოსებისთვის, მონაცემთა მეცნიერებისა და მკვლევარებისთვის, რომლებსაც ძალიან დიდი ენობრივი მოდელების მომზადება ან დახვეწა სჭირდებათ. თუ თქვენი ამჟამინდელი კონფიგურაციით მეხსიერების ლიმიტს აწყდებით, DeepSpeed გამოსავალია.
10. ზარი.cpp
ggml-org/llama.cpp საცავი რევოლუციურია მომხმარებლის აპარატურაზე LLM-ების გაშვებისთვის.'s მაღალი ხარისხის C/C++ ბიბლიოთეკა ინფერენციის გასაშვებად ლოკალურ მანქანებზე, მათ შორის დესკტოპ კომპიუტერებსა და მობილურ მოწყობილობებზეც კი.'s აგებულია GGML ტენსორულ ბიბლიოთეკაზე და ცნობილია თავისი ეფექტურობითა და მინიმალური დაყენებით.

რატომ's საუკეთესო არჩევანი
llama.cpp ძლიერ LLM-ებს ყველასთვის ხელმისაწვდომს ხდის. თქვენ არ გჭირდებათ მასიური ღრუბლოვანი GPU კლასტერი ისეთი მოდელების ექსპერიმენტებისთვის, როგორიცაა ლამა 3, Mistral ან GPT-2. CPU-სა და კიდის მოწყობილობების მუშაობაზე ფოკუსირებამ LLM-ის გამოყენება დემოკრატიულად აქცია. თქვენ შეგიძლიათ ლოკალური სერვერი მხოლოდ რამდენიმე ბრძანებით დააყენოთ და მოდელებთან ურთიერთქმედება დაიწყოთ.
ძირითადი თვისებები
ვინ უნდა გამოიყენოს იგი?
დეველოპერები, ჰობისტები და მკვლევარები, რომლებსაც სურთ LLM-ის ლოკალურად გამოყენება და ექსპერიმენტები ძვირადღირებული ღრუბლოვანი სერვისების გამოყენების გარეშე.'s ასევე იდეალურია მოწყობილობაზე ასაწყობად AI განაცხადების რომლებიც პრიორიტეტს ანიჭებენ კონფიდენციალურობას და დაბალ ლატენტობას.
11. PaLM-rlhf-pytorch
ChatGPT-ის მსგავსი მოდელების შთამბეჭდავი სასაუბრო შესაძლებლობების საიდუმლო ინგრედიენტი ადამიანური უკუკავშირით განმტკიცებული სწავლებაა (RLHF). lucidrains/PaLM-rlhf-pytorch საცავი გთავაზობთ RLHF-ის ღია კოდის იმპლემენტაციას, რომელიც Google-ში გამოიყენება.'s PaLM არქიტექტურა.
რატომ's საუკეთესო არჩევანი
ეს საცავი თანამედროვე LLM-ის შემუშავების ერთ-ერთ უმნიშვნელოვანეს ტექნიკას განმარტავს. მისი მიზანია ChatGPT-ის ფუნქციონალურობის რეპლიკაცია შემდეგი მეთოდის გამოყენებით: PaLM მოდელი, რომელიც კონკრეტულ მაგალითს იძლევა, თუ როგორ შეიძლება RLHF-ის განხორციელება. შეგიძლიათ ჩატვირთოთ წინასწარ მომზადებული მოდელები ან დააკონფიგურიროთ ისინი თქვენი საჭიროებების შესაბამისად.

ძირითადი თვისებები
ვინ უნდა გამოიყენოს იგი?
ეს საცავი განკუთვნილია მკვლევარებისა და დეველოპერებისთვის, რომლებიც დაინტერესებულნი არიან დახვეწის პროცესით, განსაკუთრებით მათთვის, ვისაც სურს RLHF-ის გაგება და დანერგვა, რათა LLM-ები ადამიანის პრეფერენციებთან შესაბამისობაში მოვიდეს.
12. ნანოGPT
ლეგენდარული ანდრეი კარპატის მიერ შექმნილი karpathy/nanoGPT საშუალო ზომის GPT-ების ტრენინგისა და დახვეწის უმარტივესი და სწრაფი საცავია. მისი კოდის ბაზა განზრახ ლაკონურია, ძირითადი ტრენინგის ციკლით train.py-ში და მოდელის განმარტებით model.py-ში.
რატომ's საუკეთესო არჩევანი
nanoGPT უპირატესობას ანიჭებს სიმარტივეს და საგანმანათლებლო ღირებულებას. ის აშორებს დიდი ბიბლიოთეკების ყველა სირთულეს, რაც საშუალებას გაძლევთ თავიდან ბოლომდე გაიგოთ ტრანსფორმატორის არქიტექტურა. სიმარტივის მიუხედავად, ის's საკმარისად მძლავრია GPT-2 დონის შედეგების რეპროდუცირებისთვის და შთააგონა სხვა მინიმალისტური პროექტები, როგორიცაა nanoVLM ხედვის ენის მოდელებისთვის.

ძირითადი თვისებები
ვინ უნდა გამოიყენოს იგი?
nanoGPT იდეალურია სტუდენტებისთვის, პედაგოგებისა და დეველოპერებისთვის, რომლებსაც სურთ GPT არქიტექტურის ღრმა, საფუძვლების გაგება. თუ დაიღალეთ შავი ყუთის ბიბლიოთეკები და გსურთ ნახოთ, როგორ მუშაობს ყველაფერი სინამდვილეში, ეს საცავი თქვენთვისაა.
თქვენი LLM მოგზაურობა იწყება ამ აუცილებელი GitHub საცავებით
რა განსხვავებაა LLM-ზე ოცნებასა და მის რეალურად აშენებას შორის? ეს 12 GitHub საცავი. სანამ სხვები თეორიაზე კამათობენ, თქვენ ახლა პირდაპირი წვდომა გაქვთ დღეს არსებულ კოდზე.'s ყველაზე მოწინავე ენის მოდელები.
თქვენი კონკურენტული უპირატესობა გელოდებათ:
- nanoGPT-ის კლონირება ტრანსფორმატორის საფუძვლების გაცნობა
- ჩანგლის ლამა.cpp ადგილობრივი მოდელის განლაგებისთვის
- Star LLM კურსი სტრუქტურირებული სასწავლო გზებისთვის
- წვლილი შეიტანეთ DeepSpeed-ში და შეუერთდით Microsoft-ს's ოპტიმიზაციის მცდელობები
LLM სფერო სწრაფად ვითარდება—დეველოპერები ვინც დღეს ამ საცავებს დაეუფლება, ხვალ გახდება's AI არქიტექტორები. აირჩიეთ თქვენთვის სასურველი 3 საცავი, შექმენით თქვენი განვითარების გარემო და დაიწყეთ ექსპერიმენტები. ყოველი დადასტურება, ყოველი მოთხოვნა, ყოველი მოდელი, რომელსაც ავარჯიშებთ, LLM-ის დაუფლებას უფრო აახლოებს.

