
Цікавитеся створенням, налаштуванням або розгортанням Великі мовні моделі?
Ви не самотні — знання права є однією з найпопулярніших навичок у AI сьогодні. с проекти з відкритим кодом GitHub швидко розвивається, став головним центром для топ-менеджерів Проєкти, фреймворки та дослідження LLM.
У цьому посібнику висвітлено 12 важливих Репозиторії GitHub містить вихідний код, практичні посібники та реалізації моделей.
Доведіть себе знання магістра права (LLM), пришвидшіть своє навчання та приєднайтеся до світової спільноти, яка формує майбутнє штучного інтелекту — і все це за допомогою цих обов’язкових репозиторіїв GitHub.
Чому GitHub Є важливим для розвитку LLM
GitHub став серцем екосистеми LLM, де проривні дослідження зустрічаються з практичним впровадженням. У той час як академічні статті пропонують теорію, GitHub надає фактичний код, який є основою сьогодення.'s найсучасніші мовні моделі.
Платформа містить усе, що стосується Meta's Реалізація Llama в OpenAI's досліджуйте кодові бази, що робить його найшвидшим способом доступу до перевірених методів та випередження стрімких розробок.
Основні причини, чому GitHub домінує в розробці LLM:
Для ентузіастів магістратури права (LLM) GitHub — це не просто ресурс, він's ваш прямий зв'язок з майбутнім AI розвитку.
1. курс магістра права (LLM)

Максим Лабон's Курс магістра права – це чудова відправна точка та комплексний план дій для всіх, хто серйозно ставиться до цього. навчання LLM. Це's більше, ніж просто набір файлів; це's структурований навчальний шлях, який враховує різні кар'єрні цілі. Репозиторій здобув величезну популярність, маючи понад 51,500 XNUMX зірок на GitHub.
Чому це's Найкращий вибір
Цей репозиторій вирізняється тим, що пропонує дві окремі дорожні карти, що дозволяють вам адаптувати свій навчальний шлях:
Курс охоплює все, починаючи від основ LLM математика до складних тем, таких як квантування, точне налаштування та розгортання моделей. Це повний пакет для учнів усіх рівнів.
Ключові особливості

Хто повинен його використовувати?
Цей репозиторій ідеально підходить як для початківців, яким потрібен структурований вступ, так і для досвідчених професіоналів, які бажають поглибити свої знання в певних галузях розробки LLM.
2. Практичний магістра права
Репозиторій HandsOnLLM/Hands-On-Large-Language-Models є офіційним доповненням до Книга О'Райлі з такою ж назвою. Це's візуально насичений та практичний посібник, який розкриває таємниці про роботу LLM. Якщо ви найкраще навчаєтесь на практиці та цінуєте добре задокументовані приклади коду, цей репозиторій для вас.
Чому це's Найкращий вибір
Вона пропонує практичний, проектний підхід до навчання. Кожен розділ книги супроводжується блокнотами Jupyter, що дозволяє вам самостійно стежити за кодом та експериментувати з ним. Книга зосереджена на реальних проектах та прикладах, які ви можете адаптувати для власного використання.

Ключові особливості
Хто повинен його використовувати?
Розробники та фахівці з обробки даних, які віддають перевагу практичному, проектному стилю навчання, вважатимуть цей репозиторій неймовірно цінним. Він також є чудовим ресурсом для всіх, хто читає книгу «Практичні моделі великих мов».
3. промпт-інжиніринг
Посібник brexhq/prompt-engineering – це справжня скарбниця для опанування мистецтва та науки оперативне проектуванняУ світі магістратури з права (LLM) якість вашої роботи часто визначається якістю вашого внеску, що робить цю навички абсолютно необхідною. Цей репозиторій, який має майже 9,000 зірок, пропонує практичні поради та стратегії роботи з такими моделями, як GPT-4.
Чому це's Найкращий вибір
Він об’єднує уроки, отримані під час створення підказок для сценаріїв використання у виробничому середовищі, що робить його дуже практичним. Репозиторій добре організований у навчальні посібники, що охоплюють усе: від базових принципів до просунутих методів, таких як Підказки до ланцюга думок (CoT) та самоузгодженість.

Ключові особливості
Хто повинен його використовувати?
Будь-хто, хто взаємодіє з LLM, від розробників і дослідників до творців контенту та маркетологів, отримає користь від цього репозиторію. Оволодіння інженерією швидких розмов є ключовою навичкою для отримання максимальної віддачі від будь-якої мовної моделі.
4. Awesome-LLM

Репозиторій Hannibal046/Awesome-LLM — це кураторський список усього, що пов’язано з моделями великих мов програмування. Уявіть собі його як свою центральну панель інструментів для оновлення екосистеми LLM. Це жива колекція ресурсів, яка регулярно оновлюється спільнотою.
Чому це's Найкращий вибір
Цей репозиторій заощаджує вам незліченну кількість годин пошуку, зібравши необхідні ресурси в одному місці. Він містить основоположні дослідницькі роботи, навчальні фреймворки, інструменти розгортання та контрольні показники оцінювання. Він навіть містить таблицю лідерів для відстеження ефективності різних програм магістратури з права (LLM).
Ключові особливості
Хто повинен його використовувати?
Це обов'язковий ресурс для дослідників, студентів та практиків, які хочуть мати універсальний доступ до високоякісних ресурсів з магістратури права (LLM). Він ідеально підходить для ознайомлення з новими інструментами та ознайомлення з останніми дослідженнями.
5. Інструментальний верстак

Оскільки LLM стають дедалі більш агентними, їхня здатність використовувати зовнішні інструменти стає дедалі важливішою. Репозиторій OpenBMB/ToolBench – це платформа з відкритим кодом розроблений для навчання, обслуговування та оцінки LLM для навчання інструментів. Він надає фреймворк та великомасштабний набір даних для налаштування інструкцій для покращення цих можливостей.
Чому це's Найкращий вибір
ToolBench зосереджується на критичній та трендовій галузі розробки LLM: використанні інструментів. Розширення StableToolBench ще більше покращує це, додаючи такі функції, як MirrorAPI, який імітує тисячі справжні API, А в Віртуальна система API щоб забезпечити стабільність та узгодженість під час оцінювання.

Ключові особливості
Хто повинен його використовувати?

Дослідники та розробники, зацікавлені у створенні агентних LLM, які можуть взаємодіяти з зовнішні API та інструменти вважатимуть ToolBench безцінним. Він ідеально підходить для тих, хто працює над створенням більш потужних та автономних AI агенти.
6. Піфія
Розроблений EleutherAI, репозиторій EleutherAI/pythia являє собою набір моделей, призначених для проведення досліджень інтерпретабельності, динаміки навчання та етики. На відміну від багатьох інших релізів моделей, набір Pythia був створений з метою забезпечення прозорості та наукових досліджень.
Чому це's Найкращий вибір
Pythia надає повністю відкритий доступ до 16 різних контрольних точок моделей, що дозволяє дослідникам вивчати, як LLM розвиваються та еволюціонують під час навчання. Це має вирішальне значення для розуміння природи цих моделей як «чорної скриньки» та для дослідження таких областей, як закони масштабування та етика моделей.

Ключові особливості
Хто повинен його використовувати?
AI Дослідники, етики та студенти, які зосереджені на інтерпретабельності моделей, безпеці та фундаментальних принципах навчання LLM, отримають багато користі з цього репозиторію.
7. Список документів агента LLM

Для тих, хто хоче глибоко зануритися в академічну сторону AI агентиСписок робіт агента WooooDyy/LLM-Agent є важливим ресурсом. Цей репозиторій являє собою кураторську колекцію дослідницьких робіт, які систематично досліджують розробку, застосування та впровадження Агенти на основі LLM.
Чому це's Найкращий вибір
Він служить фундаментальною бібліотекою знань для однієї з найцікавіших галузей AI сьогодні. Замість простого коду, цей репозиторій надає теоретичну основу, необхідну для розуміння та створення наступного покоління AI агенти.
Ключові особливості

Хто повинен його використовувати?
Цей репозиторій призначений для академічних дослідників, аспірантів та досвідчених практиків, які хочуть розвивати передові дослідження агентів на основі LLM.
8. Чудові мультимодальні моделі з великою кількістю мов
LLM більше не обмежуються лише текстом. Репозиторій BradyFU/Awesome-Multimodal-Large-Language-Models – це кураторська колекція ресурсів, зосереджених на останніх досягненнях у мультимодальних LLM (MLLM), які можуть обробляти інформацію з тексту, зображень, аудіо та відео.
Чому це's Найкращий вибір
Цей репозиторій – ваш шлях до світу MLLM. Він охоплює широкий спектр тем, від налаштування мультимодальних інструкцій до міркувань за ланцюжком думок та методів зменшення галюцинацій. Він також пов'язаний з проектом VITA, інтерактивною мультимодальною платформою LLM з відкритим кодом.

Ключові особливості
Хто повинен його використовувати?
Розробники та дослідники, зацікавлені у створенні застосунків, що виходять за рамки тексту, таких як субтитри до зображень, аналіз відео або голосові помічники, вважатимуть цю колекцію надзвичайно корисною.
9. DeepSpeed
Розроблена Microsoft, microsoft/DeepSpeed — це бібліотека оптимізації глибокого навчання, яка робить розподілене навчання та логічний висновок простим та ефективним. Вона бездоганно інтегрується з PyTorch і відіграв важливу роль у навчанні деяких країн світу's найбільші моделі, включаючи модель Мегатрона-Тюрінга з 530 мільярдами параметрів.

Чому це's Найкращий вибір
DeepSpeed — це про масштабування та ефективність. Він пропонує інновації на системному рівні, які дозволяють навчати масивні моделі з мільярдами параметрів на обмеженому обладнанні. Його функції є важливими для всіх, хто серйозно ставиться до навчання сучасних LLM з нуля або до точного налаштування великих моделей.
Ключові особливості
Хто повинен його використовувати?
Це інструмент для серйозних практиків, фахівців з обробки даних та дослідників, яким потрібно навчати або налаштовувати дуже великі мовні моделі. Якщо у вашій поточній конфігурації обмежений обсяг пам'яті, DeepSpeed — це рішення.
10. call.cpp
Репозиторій ggml-org/llama.cpp — це революційний варіант для запуску LLM на споживчому обладнанні.'s високопродуктивна бібліотека C/C++ для виконання логічних висновків на локальних машинах, включаючи настільні комп'ютери та навіть мобільні пристрої. Вона's побудований на тензорній бібліотеці GGML та відомий своєю ефективністю та мінімальним налаштуванням.

Чому це's Найкращий вибір
llama.cpp робить потужні LLM доступними для всіх. Вам не потрібен масивний хмарний кластер GPU, щоб експериментувати з такими моделями, як полум'я 3, Mistral або GPT-2. Його зосередженість на продуктивності процесора та периферійних пристроїв демократизувала використання LLM. Ви можете налаштувати локальний сервер за допомогою лише кількох команд і почати взаємодіяти з моделями.
Ключові особливості
Хто повинен його використовувати?
Розробники, аматори та дослідники, які хочуть запускати та експериментувати з LLM локально, не покладаючись на дорогі хмарні сервіси.'s також ідеально підходить для створення на пристрої AI застосування які надають пріоритет конфіденційності та низькій затримці.
11. PaLM-rlhf-pytorch
Навчання з підкріпленням та людським зворотним зв'язком (RLHF) – це секретний інгредієнт вражаючих розмовних здібностей моделей, таких як ChatGPT. Репозиторій lucidrains/PaLM-rlhf-pytorch пропонує реалізацію RLHF з відкритим кодом, застосовану до Google.'s Архітектура PaLM.
Чому це's Найкращий вибір
Цей репозиторій розвінчує один з найважливіших методів сучасної розробки LLM. Він має на меті відтворити функціональність ChatGPT за допомогою... Модель PaLM, що наводить конкретний приклад того, як можна реалізувати RLHF. Ви можете завантажувати попередньо навчені моделі або налаштовувати їх для власних потреб.

Ключові особливості
Хто повинен його використовувати?
Цей репозиторій призначений для дослідників та розробників, зацікавлених у процесі точного налаштування, особливо для тих, хто хоче зрозуміти та впровадити RLHF для узгодження LLM з уподобаннями людини.
12. nanoGPT
Створений легендарним Андрієм Карпатієм, karpathy/nanoGPT — це найпростіший і найшвидший репозиторій для навчання та налаштування GPT середнього розміру. Його кодова база навмисно лаконічна, з основним циклом навчання в train.py та визначенням моделі в model.py.
Чому це's Найкращий вибір
nanoGPT надає пріоритет простоті та освітній цінності. Він позбавляє вас усієї складності великих бібліотек, дозволяючи вам зрозуміти архітектуру трансформатора з нуля. Незважаючи на свою простоту, він's достатньо потужний, щоб відтворити результати рівня GPT-2, і надихнув інші мінімалістичні проекти, такі як nanoVLM для моделей мови зору.

Ключові особливості
Хто повинен його використовувати?
nanoGPT ідеально підходить для студентів, викладачів та розробників, які хочуть глибоко, фундаментально зрозуміти архітектуру GPT. Якщо ви втомилися від бібліотеки чорних скриньок і хочете побачити, як все працює насправді, то це репозиторій для вас.
вашу Подорож до магістра права Починається з цих основних репозиторіїв GitHub
Різниця між мрією про ступінь магістра права (LLM) та її реальним побудовою? Ці 12 репозиторіїв GitHub. Поки інші обговорюють теорію, у вас тепер є прямий доступ до коду, який забезпечує роботу сьогодення.'s найсучасніші мовні моделі.
Ваша конкурентна перевага чекає на вас:
- Клонувати nanoGPT зрозуміти основи трансформаторів
- Вилка llama.cpp для розгортання локальної моделі
- Зоряний курс LLM для структурованих навчальних шляхів
- Зробіть свій внесок у DeepSpeed та приєднайтеся до Microsoft's оптимізаційні зусилля
Галузь магістра права (LLM) швидко розвивається—розробників ті, хто сьогодні опанує ці сховища, стануть завтра's AI архітекторів. Оберіть 3 найкращі репозиторії, налаштуйте середовище розробки та почніть експериментувати. Кожен коміт, кожен пул-реквест, кожна модель, яку ви навчаєте, наближає вас до майстерності LLM.

