12 parimat GitHubi repositooriumi suurte keelemudelite valdamiseks

Parimad GitHubi repositooriumid suurte keelemudelite valdamiseks

Uudishimulik ehitamise, peenhäälestamise või juurutamise suhtes Suured keelemudelid?

Sa pole üksi – LLM-i oskused on üks kuumimaid oskusi AI täna. Koos avatud lähtekoodiga projektid GitHubist on kiiresti kasvades saanud tipptasemel lahenduste keskus LLM-projektid, raamistikud ja uuringud.

See juhend toob esile 12 olulist asja GitHubi hoidlad täis lähtekoodi, praktilisi õpetusi ja mudelite rakendamist.

Saage tõestatud LLM-teadmised, kiirenda oma õppimist ja liitu tehisintellekti tulevikku kujundava globaalse kogukonnaga – kõik see nende kohustuslike GitHubi repositooriumide abil.

Miks GitHub On LLM-i arendamiseks hädavajalik

GitHubist on saanud LLM-ökosüsteemi süda, kus läbimurdelised uuringud kohtuvad praktilise rakendamisega. Samal ajal kui akadeemilised tööd pakuvad teooriat, pakub GitHub tegelikku koodi, mis tänapäeval käima paneb.'s kõige arenenumad keelemudelid.

Platvorm majutab kõike alates Metast's Llama implementatsioonid OpenAI-sse's uurida koodibaase, mis teeb sellest kiireima viisi tõestatud tehnikatele juurdepääsuks ja kiirete arengutega sammu pidamiseks.

Peamised põhjused, miks GitHub domineerib LLM-i arenduses:

Reaalse maailma kood – Ligipääs tootmisvalmis rakendustele, mitte ainult uurimistöödele
Aktiivsed kogukonnad – Saa abi arendajatelt, kes loovad sarnaseid projekte
Viimased uuendused – Näe uusi tehnikaid ja mudeli täiustusi kohe, kui need ilmuvad
Eelkoolitatud mudelid – Laadige alla ja täpsustage olemasolevaid mudeleid, selle asemel et nullist alustada
Koostöövahendid – Panusta projektidesse ja ehita üles oma maine valdkonnas

LLM-i entusiastide jaoks pole GitHub lihtsalt ressurss – see's sinu otsene liin tulevikku AI arengut.

1. LLM-kursus

LLM kursuse Githubi hoidla

Maxime Labonne's LLM-kursus on suurepärane alguspunkt ja põhjalik tegevuskava kõigile, kes sellega tõsiselt tegelevad. LLM-ide õppimine. see's enamat kui lihtsalt failide kogu; see's struktureeritud õppetee, mis sobib erinevate karjäärieesmärkidega. Repositoorium on saavutanud tohutu populaarsuse, omades GitHubis üle 51,500 XNUMX tärni.

Miks See's parim valik

See repositoorium paistab silma selle poolest, et see pakub kahte erinevat teekaarti, mis võimaldavad teil oma õpiteekonda kohandada:

LLM-i teadlaneSee tee on mõeldud neile, kes soovivad süveneda parimate võimalike õigusteaduse magistrikraadide (LLM) loomisesse, keskendudes uusimatele koolitus- ja lihvimistehnikatele.
LLM-i insenerSee tee on suunatud LLM-idel põhinevate reaalmaailma rakenduste loomisele ja juurutamisele.

Kursus hõlmab kõike alates põhitõdedest LLM matemaatika edasijõudnutele mõeldud teemadele nagu kvantiseerimine, peenhäälestus ja mudeli juurutamine. See on terviklik pakett igale tasemele õppijatele.

Põhijooned

Struktureeritud õpePakub selget ja samm-sammult juhendit õigusteaduse magistriõppe (LLM) omandamiseks.
Praktiline lähenemineSisaldab Colabi märkmikke ja praktilisi harjutusi arusaamise kinnistamiseks.
Põhjalik sisuHõlmab laia teemaderingi, sh põhitõdesid, hoone mudelidja rakenduste juurutamine.

Kes peaks seda kasutama?

See repositoorium sobib ideaalselt nii algajatele, kes vajavad struktureeritud sissejuhatust, kui ka kogenud spetsialistidele, kes soovivad süvendada oma teadmisi LLM-i arendamise konkreetsetes valdkondades.

2. HandsOnLLM

Repositoorium HandsOnLLM/Hands-On-Large-Language-Models on ametlik kaaslane O'Reilly raamat samanimeline. See's Visuaalselt rikkalik ja praktiline juhend, mis selgitab õigusteaduse magistriõppe toimimist. Kui õpid kõige paremini tegutsedes ja hindad hästi dokumenteeritud koodinäiteid, siis see repositoorium on just sulle.

Miks See's parim valik

See pakub praktilist ja projektipõhist õppimisviisi. Iga raamatu peatükiga on kaasas Jupyteri märkmikud, mis võimaldavad teil koodiga ise kaasas käia ja seda katsetada. See keskendub reaalsetele projektidele ja näidetele, mida saate oma kasutusjuhtudeks kohandada.

HandsOnLLM GitHubi hoidla

Põhijooned

RaamatukaaslaneJärgib otseselt populaarse O'Reilly raamatu „Hands-on Large Language Models“ struktuuri.
Jupyteri sülearvutidPakub iga peatüki jaoks interaktiivseid märkmikke, mis hõlmavad selliseid teemasid nagu märgid, manustamised, transformeerivate arhitektuuride loomine ja peenhäälestamise tehnikad.
Praktilised näitedKood toetab mitut keelt ja käituskeskkonda, sealhulgas Python, Java ja .NET, mis muudab selle väga mitmekülgseks.

Kes peaks seda kasutama?

Arendajad ja andmeteadlased, kes eelistavad praktilist, projektipõhist õppestiili, leiavad, et see repositoorium on uskumatult väärtuslik. See on ka suurepärane ressurss kõigile, kes loevad raamatut „Hands-on Large Language Models”.

3. kiire-inseneritöö

Brexhq/prompt-engineering juhend on aaretelaegas inseneriteaduse kunsti ja teaduse omandamiseks. kiire inseneritööÕigusteaduste maailmas määrab teie väljundi kvaliteedi sageli teie sisendi kvaliteet, mistõttu on see oskus ülioluline. See ligi 9,000 tärniga repositoorium pakub praktilisi näpunäiteid ja strateegiaid selliste mudelitega nagu GPT-4 töötamiseks.

Miks See's parim valik

See koondab õppetunnid, mis on saadud tootmiskasutusjuhtude loomisel, muutes selle väga praktiliseks. Repositoorium on hästi korraldatud õpetusteks, mis hõlmavad kõike alates põhiprintsiipidest kuni edasijõudnute tehnikateni, näiteks Mõtteahela (CoT) suunamine ja isejärjepidevus.

Põhijooned

Põhjalik juhendHõlmab kiiret inseneritöö ajalugu, strateegiaid ja ohutusalaseid soovitusi.
Praktilised tehnikadKeskendub erinevate ülesannete, sh kokkuvõtete ja kodeerimise, jaoks ülesannete optimeerimisele.
Täiustatud kontseptsioonid: Uurib edasijõudnutele mõeldud teemasid, nagu rolliviipade loomine, ülesannete jagamine ja viipade turvalisus.

Kes peaks seda kasutama?

Sellest repositooriumist saavad kasu kõik, kes suhtlevad õigusteaduse magistrantidega, alates arendajatest ja teadlastest kuni sisuloojate ja turundajateni. Kiire inseneritöö valdamine on võtmeoskus mis tahes keelemudeli maksimaalseks ärakasutamiseks.

4. Äge-LLM

Hannibal046/Awesome-LLM repositoorium on kureeritud nimekiri kõigest suurte keelemudelitega seonduvast. Mõelge sellest kui oma kesksest juhtpaneelist, et olla kursis LLM-ökosüsteemiga. See on elav ressursside kogu, mida kogukond regulaarselt uuendab.

Miks See's parim valik

See repositoorium säästab teie otsingukulusid lugematul hulgal, koondades olulised ressursid ühte kohta. See sisaldab olulisi uurimistöid, koolitusraamistikke, juurutamisvahendeid ja hindamisnäitajaid. See sisaldab isegi edetabelit erinevate õigusteaduse eriala lõpetanute tulemuste jälgimiseks.

Põhijooned

Kureeritud ressursidPõhjalik nimekiri õigusteadust käsitlevatest dokumentidest, tööriistadest, õpetustest ja raamatutest.
Organiseeritud kategooriadRessursid on kenasti teemade kaupa liigitatud, näiteks avatud õigusteadused (LLM), õigusteaduse koolitus ja õigusteaduse rakendused.
Kogukonnakeskne: Uuendatakse regulaarselt, et see hõlmaks valdkonna uusimaid edusamme.

Kes peaks seda kasutama?

See on hädavajalik teadlastele, üliõpilastele ja praktikutele, kes soovivad leida kvaliteetseid õigusteaduse (LLM) ressursse ühest kohast. See sobib suurepäraselt uute tööriistade avastamiseks ja uusimate uuringutega kursis püsimiseks.

5. Tööriistapink

ToolBench - GitHubi hoidla

Kuna õigusteaduse magistrid muutuvad agentiivsemaks, muutub nende võime kasutada väliseid tööriistu üha olulisemaks. OpenBMB/ToolBenchi repositoorium on avatud lähtekoodiga platvorm loodud tööriistaõppega tegelevate õigusteaduse üliõpilaste koolitamiseks, teenindamiseks ja hindamiseks. See pakub raamistikku ja ulatuslikku käskude häälestamise andmekogumit nende võimete täiustamiseks.

Miks See's parim valik

ToolBench keskendub LLM-i arendamise kriitilisele ja trendikale valdkonnale: tööriistade kasutamisele. StableToolBenchi laiendus täiustab seda veelgi, lisades selliseid funktsioone nagu Peegel-API, mis simuleerib tuhandeid päris API-dJa Virtuaalne API-süsteem hindamise ajal stabiilsuse ja järjepidevuse tagamiseks.

Põhijooned

Tööriistade õppimise fookusSpetsiaalselt loodud õigusteaduse magistrantide tööriistakasutusoskuste parandamiseks.
Suuremahuline andmestikSisaldab tohutut käskude häälestamise andmekogumit mudelite tõhusaks treenimiseks.
Stabiilne hindamineStableToolBenchi versioon pakub robustset kahefaasilist hindamisprotsessi, mis kasutab GPT-4 hindajana, kasutades selliseid mõõdikuid nagu lahendatava läbimise määr (SoPR).

Kes peaks seda kasutama?

Teadlased ja arendajad, kes on huvitatud agentiivsete õigusteaduse magistriõppe (LLM) loomisest, mis suudavad suhelda välised API-d ja tööriistad leiavad, et ToolBench on hindamatu väärtusega. See on ideaalne neile, kes töötavad võimekamate ja autonoomsemate rakenduste loomise nimel. AI ained.

6. Pythia

EleutherAI poolt välja töötatud EleutherAI/pythia repositoorium on mudelite komplekt, mis on loodud tõlgendatavuse, õppimise dünaamika ja eetika uurimise võimaldamiseks. Erinevalt paljudest teistest mudeliversioonidest loodi Pythia komplekt läbipaistvuse ja teadusliku uurimistöö peamisteks eesmärkideks.

Miks See's parim valik

Pythia pakub täielikult avatud lähtekoodiga juurdepääsu 16 erinevale mudeli kontrollpunktile, võimaldades teadlastel uurida, kuidas õigusteaduse ained (LLM-id) treeningu ajal arenevad ja arenevad. See on ülioluline nende mudelite „musta kasti“ olemuse mõistmiseks ning selliste valdkondade uurimiseks nagu skaleerimisseadused ja mudelieetika.

Põhijooned

Tõlgendatavuse uuringEhitatud spetsiaalselt mudeli käitumise ja läbipaistvuse uurimise hõlbustamiseks.
Mitmed kontrollpunktidPakub juurdepääsu erinevatele mudeli suurustele ja treeninguetappidele, andes õppeprotsessist üksikasjaliku ülevaate.
Open SourceKood ja mudelid on avalikult kättesaadavad, mis soodustab kogukonna juhitud uurimistööd ja koostööd.

Kes peaks seda kasutama?

AI Teadlased, eetikud ja üliõpilased, kes keskenduvad mudeli tõlgendatavusele, ohutusele ja LLM-koolituse põhiprintsiipidele, saavad sellest hoidlast palju kasu.

7. LLM-agent-paberite nimekiri

Neile, kes soovivad süveneda akadeemilisse külge AI ained, WooooDyy/LLM-Agent-Paper-List on oluline ressurss. See repositoorium on kureeritud uurimistööde kogu, mis süstemaatiliselt uurib ... arendamist, rakendamist ja rakendamist. LLM-põhised agendid.

Miks See's parim valik

See toimib alusandmete koguna ühes põnevaimas valdkonnas AI täna. Lihtsalt koodi asemel pakub see repositoorium teoreetilisi aluseid, mida vajate järgmise põlvkonna mõistmiseks ja loomiseks AI esindajad.

Põhijooned

Kureeritud uuringudLLM-agentide kohta käivate oluliste dokumentide hoolikalt valitud nimekiri.
Süstemaatiline organisatsioonArtiklid on üles ehitatud nii, et need annaksid agentide arendusmaastikust tervikliku ülevaate.
PõhiressurssIdeaalne abivahend agentiivse tehisintellekti põhimõistete ja uusimate läbimurretega kurssi viimiseks.

Kes peaks seda kasutama?

See repositoorium on suunatud akadeemilistele teadlastele, magistrantidele ja edasijõudnutele praktikutele, kes soovivad tugineda tipptasemel uuringutele õigusteaduse (LLM) põhiste agentide valdkonnas.

8. Vinge-multimodaalsed-suured-keelemudelid

LLM-id ei piirdu enam ainult tekstiga. BradyFU/Awesome-Multimodal-Large-Language-Models repositoorium on kureeritud ressursside kogu, mis keskendub multimodaalsete LLM-ide (MLLM-ide) uusimatele edusammudele, mis suudavad töödelda teavet tekstist, piltidest, helist ja videost.

Miks See's parim valik

See repositoorium on teie värav MLLM-ide maailma. See hõlmab laia teemaderingi, alates multimodaalsest juhendamise häälestamisest kuni mõtteahela arutluskäigu ja hallutsinatsioonide leevendamise tehnikateni. See on seotud ka VITA projektiga, mis on avatud lähtekoodiga interaktiivne multimodaalne LLM-platvorm.

Põhijooned

Multimodaalne fookus: Pühendatud ressurssidele õigusteaduse magistrantidele, kes käsitlevad mitut andmetüüpi.
Lai valik teemasidSisaldab dokumente ja tööriistu juhiste häälestamise, arutluskäigu ja hallutsinatsioonide leevendamise kohta.
Esitletud VITA-sSeotud suurema interaktiivsete MLLM-ide loomise projektiga, lisades praktilise mõõtme.

Kes peaks seda kasutama?

Arendajad ja teadlased, kes on huvitatud tekstist kaugemale ulatuvate rakenduste (nt piltide subtiitrid, videoanalüüs või hääljuhtimisega assistendid) loomisest, leiavad, et see kogu on äärmiselt kasulik.

9. DeepSpeed

Microsofti poolt väljatöötatud microsoft/DeepSpeed ​​on süvaõppe optimeerimise teek, mis muudab hajutatud treenimise ja järelduste tegemise lihtsaks ja tõhusaks. See integreerub sujuvalt järgmistesse valdkondadesse: PyTorch ja on olnud oluline osa maailma inimeste koolitamisel's suurimad mudelid, sealhulgas 530 miljardi parameetriga Megatron-Turingi mudel.

DeepSpeed ​​Microsoft

Miks See's parim valik

DeepSpeed ​​keskendub mastaapsusele ja tõhususele. See pakub süsteemitasemel uuendusi, mis võimaldavad teil piiratud riistvaral treenida miljardite parameetritega massiivseid mudeleid. Selle funktsioonid on olulised kõigile, kes tõsiselt suhtuvad tipptasemel õigusteaduse juhtide nullist treenimisse või suurte mudelite peenhäälestamisse.

Põhijooned

Ulatuslik koolitusVõimaldab treenida mudeleid enam kui triljoni parameetriga, kasutades selliseid tehnikaid nagu ZeRO (Zero Redundancy Optimizer).
PyTorchi integreerimineTöötab sujuvalt PyTorchiga, mis on populaarne süvaõppe raamistik.
Tõestatud edukusKasutatakse arvukate suuremahuliste mudelite, sealhulgas YaLM (100B) ja Jurassic-1 (178B), treenimiseks.
Windowsi tugiteenusDeepSpeedi loomise ja installimise lihtsustamiseks Windowsi süsteemidesse on saadaval graafiline parandustööriist.

Kes peaks seda kasutama?

See on tööriist tõsistele praktikutele, andmeteadlastele ja uurijatele, kes peavad treenima või peenhäälestama väga suuri keelemudeleid. Kui teie praegune seadistus on mälu piirides, on DeepSpeed ​​lahendus.

10. call.cpp

ggml-org/llama.cpp repositoorium on tarbijariistvaral LLM-ide käitamises murranguline. See's suure jõudlusega C/C++ teek järelduste käitamiseks kohalikes masinates, sealhulgas lauaarvutites ja isegi mobiilseadmetes. See's ehitatud GGML tensorteegile ning on kuulus oma efektiivsuse ja minimaalse seadistuse poolest.

laama

Miks See's parim valik

llama.cpp teeb võimsad õigusteaduse magistriõppe programmid kõigile kättesaadavaks. Selliste mudelitega katsetamiseks pole vaja massiivset pilvepõhist GPU-klastrit Laama 3, Mistrali või GPT-2. Selle keskendumine protsessori ja servaseadmete jõudlusele on demokratiseerinud LLM-i kasutamise. Vaid mõne käsuga saate seadistada kohaliku serveri ja hakata mudelitega suhtlema.

Põhijooned

Suure jõudlusega järeldusedOptimeeritud LLM-ide käitamiseks protsessoritel ja laias valikus riistvaral.
Lai mudelitugiToetab paljusid populaarseid mudeleid, sealhulgas Llama perekonda, Mistralit ja BERTi.
KvantiseerimineToetab natiivselt mudeli kvantiseerimist, võimaldades suurtel mudelitel töötada piiratud mäluga seadmetes.
Minimaalne häälestus: Loodud lihtsaks kompileerimiseks ja kasutamiseks erinevatel platvormidel, sealhulgas macOS, Linux ja Windows.

Kes peaks seda kasutama?

Arendajad, harrastajad ja teadlased, kes soovivad LLM-e kohapeal läbi viia ja katsetada, ilma et nad peaksid toetuma kallitele pilveteenustele. See's sobib suurepäraselt ka seadmes ehitamiseks AI rakendused mis seavad esikohale privaatsuse ja madala latentsusaja.

11. PaLM-rlhf-pytorch

Inimese tagasisidega tugevdusõpe (RLHF) on salarelv selliste mudelite nagu ChatGPT muljetavaldavate vestlusoskuste taga. Repositoorium lucidrains/PaLM-rlhf-pytorch pakub Google'ile rakendatud avatud lähtekoodiga RLHF-i implementatsiooni.'s PaLM-i arhitektuur.

Miks See's parim valik

See repositoorium demüstifitseerib üht olulisemat tehnikat tänapäevases õigusteaduse arenduses. Selle eesmärk on korrata ChatGPT funktsionaalsust, kasutades PaLM-mudel, pakkudes konkreetset näidet RLHF-i rakendamisest. Saate laadida eelnevalt treenitud mudeleid või neid oma vajadustele vastavalt häälestada.

Põhijooned

RLHF-i rakendaminePakub selget ja avatud lähtekoodiga rakendust tugevdusõppele koos inimese tagasisidega.
PaLM-i põhjalRakendab tehnikat võimsale PaLM-arhitektuurile.
Hariv väärtusAitab kasutajatel mõista abivalmi ja ohutu koolituse taga olevaid mehhanisme. AI assistendid.

Kes peaks seda kasutama?

See repositoorium on mõeldud teadlastele ja arendajatele, kes on huvitatud peenhäälestusprotsessist, eriti neile, kes soovivad mõista ja rakendada RLHF-i, et viia LLM-id vastavusse inimeste eelistustega.

12. nanoGPT

Legendaarse Andrej Karpathy loodud karpathy/nanoGPT on lihtsaim ja kiireim repositoorium keskmise suurusega GPT-de treenimiseks ja peenhäälestamiseks. Selle koodibaas on tahtlikult kokkuvõtlik, kusjuures põhiline treeningtsükkel asub train.py failis ja mudeli definitsioon model.py failis.

Miks See's parim valik

nanoGPT seab esikohale lihtsuse ja haridusliku väärtuse. See eemaldab suurte teekide keerukuse, võimaldades teil trafo arhitektuuri algusest peale mõista. Vaatamata lihtsusele on see...'s piisavalt võimas, et taastoota GPT-2 taseme tulemusi ja on inspireerinud teisi minimalistlikke projekte, näiteks nanoVLM-i nägemiskeele mudelite jaoks.

nanoGPT

Põhijooned

Minimalistlik koodibaasTahtlikult lihtne ja loetav, mistõttu sobib see ideaalselt õppimiseks
High PerformanceKasutab tõhusaks treenimiseks PyTorch 2.0 funktsioone.
HaridusfookusSuurepärane tööriist GPT-mudelite loomise ja treenimise mõistmiseks.
ReprodutseeritavusSisaldab skripte tulemuste reprodutseerimiseks standardsetel andmekogumitel, näiteks OpenWebText.

Kes peaks seda kasutama?

nanoGPT sobib ideaalselt õpilastele, õpetajatele ja arendajatele, kes soovivad GPT arhitektuurist sügavat ja põhiteadmisi. Kui oled tüdinud... musta kasti raamatukogud ja tahad näha, kuidas asjad tegelikult toimivad, siis see on just sulle sobiv hoidla.

Sinu LLM teekond Alustab nende oluliste GitHubi hoidlatega

Mis vahe on LLM-idest unistamise ja nende tegeliku omandamise vahel? Need 12 GitHubi repositooriumi. Samal ajal kui teised vaidlevad teooria üle, on teil nüüd otsene juurdepääs tänapäevasele koodile.'s kõige arenenum keelemudelid.

Sinu konkurentsieelis ootab:

  • Kloon nanoGPT trafo põhitõdede mõistmiseks
  • Kahvel llama.cpp kohaliku mudeli juurutamiseks
  • Star LLM-kursus struktureeritud õpperadade jaoks
  • Panusta DeepSpeedile ja liitu Microsoftiga's optimeerimispüüdlused

LLM-i valdkond areneb kiiresti –Arendajad kes neid hoidlaid täna valdab, saab hommeks's AI arhitektid. Vali välja 3 parimat repositooriumi, seadista arenduskeskkond ja alusta katsetamist. Iga commit, iga pull request ja iga treenitav mudel viib sind lähemale õigusteaduse (LLM) valdamisele.

Kood on avatud. Kogukond on külalislahke. Sinu õigusteaduse (LLM) oskused algavad kohe.

Jäta vastus

Sinu e-postiaadressi ei avaldata. Kohustuslikud väljad on märgitud *

Sellel saidil kasutatakse rämpsposti vähendamiseks Akismetit. Vaadake, kuidas teie kommentaaride andmeid töödeldakse.

Liitu Aimojo Hõim!

Liituge 76,200 XNUMX+ liikmega, et saada igal nädalal siseringi nõuandeid! 
🎁 BONUS: Hankige meie 200 dollaritAI "Meisterlikkuse tööriistakomplekt" TASUTA registreerumisel!

Trendid AI TÖÖRIISTAD
Rong

Muutke ühe ekraanisalvestuse täielikuks kliendikoolitusprogrammiks Tehisintellektil põhinev SaaS-koolitusplatvorm, mis kõrvaldab korduvad sisseelamiskõned lõplikult

Vidu

Muutke tekst ja pildid kvaliteetseks AI Videod sekunditega Anime-esimene AI Videogeneraator natiivse heli ja mitme üksuse järjepidevusega

TicNote'i pilv

Muutke iga koosolek automaatselt valmis tulemuseks . AI Koosolekute tööruum, mis mõtleb, kirjutab ja teostab

BotPingviin

Ehitama AI Vestlusrobotid igas kanalis, mida teie kliendid kasutavad Koodivaba omnikanali vestlusrobot ja AI äriautomaatika agendiplatvorm

Manus AI

Saage keeruline töö tehtud sõrmegi liigutamata Üldotstarbeline AI Agent, kes planeerib, teostab ja annab tulemusi

© Autoriõigus 2023 - 2026 | Hakka AI Pro | Valmistatud ♥-ga