
Uudishimulik ehitamise, peenhäälestamise või juurutamise suhtes Suured keelemudelid?
Sa pole üksi – LLM-i oskused on üks kuumimaid oskusi AI täna. Koos avatud lähtekoodiga projektid GitHubist on kiiresti kasvades saanud tipptasemel lahenduste keskus LLM-projektid, raamistikud ja uuringud.
See juhend toob esile 12 olulist asja GitHubi hoidlad täis lähtekoodi, praktilisi õpetusi ja mudelite rakendamist.
Saage tõestatud LLM-teadmised, kiirenda oma õppimist ja liitu tehisintellekti tulevikku kujundava globaalse kogukonnaga – kõik see nende kohustuslike GitHubi repositooriumide abil.
Miks GitHub On LLM-i arendamiseks hädavajalik
GitHubist on saanud LLM-ökosüsteemi süda, kus läbimurdelised uuringud kohtuvad praktilise rakendamisega. Samal ajal kui akadeemilised tööd pakuvad teooriat, pakub GitHub tegelikku koodi, mis tänapäeval käima paneb.'s kõige arenenumad keelemudelid.
Platvorm majutab kõike alates Metast's Llama implementatsioonid OpenAI-sse's uurida koodibaase, mis teeb sellest kiireima viisi tõestatud tehnikatele juurdepääsuks ja kiirete arengutega sammu pidamiseks.
Peamised põhjused, miks GitHub domineerib LLM-i arenduses:
LLM-i entusiastide jaoks pole GitHub lihtsalt ressurss – see's sinu otsene liin tulevikku AI arengut.
1. LLM-kursus

Maxime Labonne's LLM-kursus on suurepärane alguspunkt ja põhjalik tegevuskava kõigile, kes sellega tõsiselt tegelevad. LLM-ide õppimine. see's enamat kui lihtsalt failide kogu; see's struktureeritud õppetee, mis sobib erinevate karjäärieesmärkidega. Repositoorium on saavutanud tohutu populaarsuse, omades GitHubis üle 51,500 XNUMX tärni.
Miks See's parim valik
See repositoorium paistab silma selle poolest, et see pakub kahte erinevat teekaarti, mis võimaldavad teil oma õpiteekonda kohandada:
Kursus hõlmab kõike alates põhitõdedest LLM matemaatika edasijõudnutele mõeldud teemadele nagu kvantiseerimine, peenhäälestus ja mudeli juurutamine. See on terviklik pakett igale tasemele õppijatele.
Põhijooned

Kes peaks seda kasutama?
See repositoorium sobib ideaalselt nii algajatele, kes vajavad struktureeritud sissejuhatust, kui ka kogenud spetsialistidele, kes soovivad süvendada oma teadmisi LLM-i arendamise konkreetsetes valdkondades.
2. HandsOnLLM
Repositoorium HandsOnLLM/Hands-On-Large-Language-Models on ametlik kaaslane O'Reilly raamat samanimeline. See's Visuaalselt rikkalik ja praktiline juhend, mis selgitab õigusteaduse magistriõppe toimimist. Kui õpid kõige paremini tegutsedes ja hindad hästi dokumenteeritud koodinäiteid, siis see repositoorium on just sulle.
Miks See's parim valik
See pakub praktilist ja projektipõhist õppimisviisi. Iga raamatu peatükiga on kaasas Jupyteri märkmikud, mis võimaldavad teil koodiga ise kaasas käia ja seda katsetada. See keskendub reaalsetele projektidele ja näidetele, mida saate oma kasutusjuhtudeks kohandada.

Põhijooned
Kes peaks seda kasutama?
Arendajad ja andmeteadlased, kes eelistavad praktilist, projektipõhist õppestiili, leiavad, et see repositoorium on uskumatult väärtuslik. See on ka suurepärane ressurss kõigile, kes loevad raamatut „Hands-on Large Language Models”.
3. kiire-inseneritöö
Brexhq/prompt-engineering juhend on aaretelaegas inseneriteaduse kunsti ja teaduse omandamiseks. kiire inseneritööÕigusteaduste maailmas määrab teie väljundi kvaliteedi sageli teie sisendi kvaliteet, mistõttu on see oskus ülioluline. See ligi 9,000 tärniga repositoorium pakub praktilisi näpunäiteid ja strateegiaid selliste mudelitega nagu GPT-4 töötamiseks.
Miks See's parim valik
See koondab õppetunnid, mis on saadud tootmiskasutusjuhtude loomisel, muutes selle väga praktiliseks. Repositoorium on hästi korraldatud õpetusteks, mis hõlmavad kõike alates põhiprintsiipidest kuni edasijõudnute tehnikateni, näiteks Mõtteahela (CoT) suunamine ja isejärjepidevus.

Põhijooned
Kes peaks seda kasutama?
Sellest repositooriumist saavad kasu kõik, kes suhtlevad õigusteaduse magistrantidega, alates arendajatest ja teadlastest kuni sisuloojate ja turundajateni. Kiire inseneritöö valdamine on võtmeoskus mis tahes keelemudeli maksimaalseks ärakasutamiseks.
4. Äge-LLM

Hannibal046/Awesome-LLM repositoorium on kureeritud nimekiri kõigest suurte keelemudelitega seonduvast. Mõelge sellest kui oma kesksest juhtpaneelist, et olla kursis LLM-ökosüsteemiga. See on elav ressursside kogu, mida kogukond regulaarselt uuendab.
Miks See's parim valik
See repositoorium säästab teie otsingukulusid lugematul hulgal, koondades olulised ressursid ühte kohta. See sisaldab olulisi uurimistöid, koolitusraamistikke, juurutamisvahendeid ja hindamisnäitajaid. See sisaldab isegi edetabelit erinevate õigusteaduse eriala lõpetanute tulemuste jälgimiseks.
Põhijooned
Kes peaks seda kasutama?
See on hädavajalik teadlastele, üliõpilastele ja praktikutele, kes soovivad leida kvaliteetseid õigusteaduse (LLM) ressursse ühest kohast. See sobib suurepäraselt uute tööriistade avastamiseks ja uusimate uuringutega kursis püsimiseks.
5. Tööriistapink

Kuna õigusteaduse magistrid muutuvad agentiivsemaks, muutub nende võime kasutada väliseid tööriistu üha olulisemaks. OpenBMB/ToolBenchi repositoorium on avatud lähtekoodiga platvorm loodud tööriistaõppega tegelevate õigusteaduse üliõpilaste koolitamiseks, teenindamiseks ja hindamiseks. See pakub raamistikku ja ulatuslikku käskude häälestamise andmekogumit nende võimete täiustamiseks.
Miks See's parim valik
ToolBench keskendub LLM-i arendamise kriitilisele ja trendikale valdkonnale: tööriistade kasutamisele. StableToolBenchi laiendus täiustab seda veelgi, lisades selliseid funktsioone nagu Peegel-API, mis simuleerib tuhandeid päris API-dJa Virtuaalne API-süsteem hindamise ajal stabiilsuse ja järjepidevuse tagamiseks.

Põhijooned
Kes peaks seda kasutama?

Teadlased ja arendajad, kes on huvitatud agentiivsete õigusteaduse magistriõppe (LLM) loomisest, mis suudavad suhelda välised API-d ja tööriistad leiavad, et ToolBench on hindamatu väärtusega. See on ideaalne neile, kes töötavad võimekamate ja autonoomsemate rakenduste loomise nimel. AI ained.
6. Pythia
EleutherAI poolt välja töötatud EleutherAI/pythia repositoorium on mudelite komplekt, mis on loodud tõlgendatavuse, õppimise dünaamika ja eetika uurimise võimaldamiseks. Erinevalt paljudest teistest mudeliversioonidest loodi Pythia komplekt läbipaistvuse ja teadusliku uurimistöö peamisteks eesmärkideks.
Miks See's parim valik
Pythia pakub täielikult avatud lähtekoodiga juurdepääsu 16 erinevale mudeli kontrollpunktile, võimaldades teadlastel uurida, kuidas õigusteaduse ained (LLM-id) treeningu ajal arenevad ja arenevad. See on ülioluline nende mudelite „musta kasti“ olemuse mõistmiseks ning selliste valdkondade uurimiseks nagu skaleerimisseadused ja mudelieetika.

Põhijooned
Kes peaks seda kasutama?
AI Teadlased, eetikud ja üliõpilased, kes keskenduvad mudeli tõlgendatavusele, ohutusele ja LLM-koolituse põhiprintsiipidele, saavad sellest hoidlast palju kasu.
7. LLM-agent-paberite nimekiri

Neile, kes soovivad süveneda akadeemilisse külge AI ained, WooooDyy/LLM-Agent-Paper-List on oluline ressurss. See repositoorium on kureeritud uurimistööde kogu, mis süstemaatiliselt uurib ... arendamist, rakendamist ja rakendamist. LLM-põhised agendid.
Miks See's parim valik
See toimib alusandmete koguna ühes põnevaimas valdkonnas AI täna. Lihtsalt koodi asemel pakub see repositoorium teoreetilisi aluseid, mida vajate järgmise põlvkonna mõistmiseks ja loomiseks AI esindajad.
Põhijooned

Kes peaks seda kasutama?
See repositoorium on suunatud akadeemilistele teadlastele, magistrantidele ja edasijõudnutele praktikutele, kes soovivad tugineda tipptasemel uuringutele õigusteaduse (LLM) põhiste agentide valdkonnas.
8. Vinge-multimodaalsed-suured-keelemudelid
LLM-id ei piirdu enam ainult tekstiga. BradyFU/Awesome-Multimodal-Large-Language-Models repositoorium on kureeritud ressursside kogu, mis keskendub multimodaalsete LLM-ide (MLLM-ide) uusimatele edusammudele, mis suudavad töödelda teavet tekstist, piltidest, helist ja videost.
Miks See's parim valik
See repositoorium on teie värav MLLM-ide maailma. See hõlmab laia teemaderingi, alates multimodaalsest juhendamise häälestamisest kuni mõtteahela arutluskäigu ja hallutsinatsioonide leevendamise tehnikateni. See on seotud ka VITA projektiga, mis on avatud lähtekoodiga interaktiivne multimodaalne LLM-platvorm.

Põhijooned
Kes peaks seda kasutama?
Arendajad ja teadlased, kes on huvitatud tekstist kaugemale ulatuvate rakenduste (nt piltide subtiitrid, videoanalüüs või hääljuhtimisega assistendid) loomisest, leiavad, et see kogu on äärmiselt kasulik.
9. DeepSpeed
Microsofti poolt väljatöötatud microsoft/DeepSpeed on süvaõppe optimeerimise teek, mis muudab hajutatud treenimise ja järelduste tegemise lihtsaks ja tõhusaks. See integreerub sujuvalt järgmistesse valdkondadesse: PyTorch ja on olnud oluline osa maailma inimeste koolitamisel's suurimad mudelid, sealhulgas 530 miljardi parameetriga Megatron-Turingi mudel.

Miks See's parim valik
DeepSpeed keskendub mastaapsusele ja tõhususele. See pakub süsteemitasemel uuendusi, mis võimaldavad teil piiratud riistvaral treenida miljardite parameetritega massiivseid mudeleid. Selle funktsioonid on olulised kõigile, kes tõsiselt suhtuvad tipptasemel õigusteaduse juhtide nullist treenimisse või suurte mudelite peenhäälestamisse.
Põhijooned
Kes peaks seda kasutama?
See on tööriist tõsistele praktikutele, andmeteadlastele ja uurijatele, kes peavad treenima või peenhäälestama väga suuri keelemudeleid. Kui teie praegune seadistus on mälu piirides, on DeepSpeed lahendus.
10. call.cpp
ggml-org/llama.cpp repositoorium on tarbijariistvaral LLM-ide käitamises murranguline. See's suure jõudlusega C/C++ teek järelduste käitamiseks kohalikes masinates, sealhulgas lauaarvutites ja isegi mobiilseadmetes. See's ehitatud GGML tensorteegile ning on kuulus oma efektiivsuse ja minimaalse seadistuse poolest.

Miks See's parim valik
llama.cpp teeb võimsad õigusteaduse magistriõppe programmid kõigile kättesaadavaks. Selliste mudelitega katsetamiseks pole vaja massiivset pilvepõhist GPU-klastrit Laama 3, Mistrali või GPT-2. Selle keskendumine protsessori ja servaseadmete jõudlusele on demokratiseerinud LLM-i kasutamise. Vaid mõne käsuga saate seadistada kohaliku serveri ja hakata mudelitega suhtlema.
Põhijooned
Kes peaks seda kasutama?
Arendajad, harrastajad ja teadlased, kes soovivad LLM-e kohapeal läbi viia ja katsetada, ilma et nad peaksid toetuma kallitele pilveteenustele. See's sobib suurepäraselt ka seadmes ehitamiseks AI rakendused mis seavad esikohale privaatsuse ja madala latentsusaja.
11. PaLM-rlhf-pytorch
Inimese tagasisidega tugevdusõpe (RLHF) on salarelv selliste mudelite nagu ChatGPT muljetavaldavate vestlusoskuste taga. Repositoorium lucidrains/PaLM-rlhf-pytorch pakub Google'ile rakendatud avatud lähtekoodiga RLHF-i implementatsiooni.'s PaLM-i arhitektuur.
Miks See's parim valik
See repositoorium demüstifitseerib üht olulisemat tehnikat tänapäevases õigusteaduse arenduses. Selle eesmärk on korrata ChatGPT funktsionaalsust, kasutades PaLM-mudel, pakkudes konkreetset näidet RLHF-i rakendamisest. Saate laadida eelnevalt treenitud mudeleid või neid oma vajadustele vastavalt häälestada.

Põhijooned
Kes peaks seda kasutama?
See repositoorium on mõeldud teadlastele ja arendajatele, kes on huvitatud peenhäälestusprotsessist, eriti neile, kes soovivad mõista ja rakendada RLHF-i, et viia LLM-id vastavusse inimeste eelistustega.
12. nanoGPT
Legendaarse Andrej Karpathy loodud karpathy/nanoGPT on lihtsaim ja kiireim repositoorium keskmise suurusega GPT-de treenimiseks ja peenhäälestamiseks. Selle koodibaas on tahtlikult kokkuvõtlik, kusjuures põhiline treeningtsükkel asub train.py failis ja mudeli definitsioon model.py failis.
Miks See's parim valik
nanoGPT seab esikohale lihtsuse ja haridusliku väärtuse. See eemaldab suurte teekide keerukuse, võimaldades teil trafo arhitektuuri algusest peale mõista. Vaatamata lihtsusele on see...'s piisavalt võimas, et taastoota GPT-2 taseme tulemusi ja on inspireerinud teisi minimalistlikke projekte, näiteks nanoVLM-i nägemiskeele mudelite jaoks.

Põhijooned
Kes peaks seda kasutama?
nanoGPT sobib ideaalselt õpilastele, õpetajatele ja arendajatele, kes soovivad GPT arhitektuurist sügavat ja põhiteadmisi. Kui oled tüdinud... musta kasti raamatukogud ja tahad näha, kuidas asjad tegelikult toimivad, siis see on just sulle sobiv hoidla.
Sinu LLM teekond Alustab nende oluliste GitHubi hoidlatega
Mis vahe on LLM-idest unistamise ja nende tegeliku omandamise vahel? Need 12 GitHubi repositooriumi. Samal ajal kui teised vaidlevad teooria üle, on teil nüüd otsene juurdepääs tänapäevasele koodile.'s kõige arenenum keelemudelid.
Sinu konkurentsieelis ootab:
- Kloon nanoGPT trafo põhitõdede mõistmiseks
- Kahvel llama.cpp kohaliku mudeli juurutamiseks
- Star LLM-kursus struktureeritud õpperadade jaoks
- Panusta DeepSpeedile ja liitu Microsoftiga's optimeerimispüüdlused
LLM-i valdkond areneb kiiresti –Arendajad kes neid hoidlaid täna valdab, saab hommeks's AI arhitektid. Vali välja 3 parimat repositooriumi, seadista arenduskeskkond ja alusta katsetamist. Iga commit, iga pull request ja iga treenitav mudel viib sind lähemale õigusteaduse (LLM) valdamisele.


