
빌드, 미세 조정 또는 배포에 대해 궁금한 점이 있으신가요? LLM 대규모 언어 모델 ?
당신은 혼자가 아닙니다. LLM 전문성은 가장 인기 있는 기술 중 하나입니다. AI 오늘. 와 함께 오픈 소스 프로젝트 빠르게 성장하는 GitHub은 최고 수준의 서비스를 제공하는 허브가 되었습니다. LLM 프로젝트, 프레임워크 및 연구.
이 가이드에서는 12가지 필수 사항을 강조합니다. GitHub 저장소 소스 코드, 실습 튜토리얼, 모델 구현이 포함되어 있습니다.
입증되다 LLM 지식학습 속도를 높이고 인공 지능의 미래를 형성하는 글로벌 커뮤니티에 참여하세요. 이 모든 것은 꼭 알아야 할 GitHub 저장소를 통해 가능합니다.
GitHub의 LLM 개발에 필수적입니다
GitHub는 획기적인 연구와 실제 구현이 만나는 LLM 생태계의 심장부로 자리 잡았습니다. 학술 논문이 이론을 제공하는 반면, GitHub은 오늘날의 LLM 생태계를 움직이는 실제 코드를 제공합니다.'s 가장 진보된 언어 모델.
이 플랫폼은 Meta의 모든 것을 호스팅합니다.'s OpenAI에 대한 Llama 구현's 연구 코드베이스를 사용하면 검증된 기술에 가장 빠르게 접근하고 급속한 개발에 앞서 나갈 수 있습니다.
GitHub이 LLM 개발을 주도하는 주요 이유:
LLM 애호가에게 GitHub은 단순한 리소스가 아닙니다.'s 미래에 대한 당신의 직통 전화 AI 개발.
1. LLM 과정

막심 라본느's llm-course는 진지하게 공부하려는 모든 사람을 위한 환상적인 시작점이며 포괄적인 로드맵입니다. LLM 학습. 그것's 단순한 파일 모음 이상입니다.'s 다양한 커리어 목표에 맞춰 체계적인 학습 경로를 제공합니다. 이 저장소는 GitHub에서 51,500개 이상의 별점을 받으며 엄청난 인기를 얻었습니다.
왜's 최고의 선택
이 저장소는 두 가지 뚜렷한 로드맵을 제공하여 학습 여정을 맞춤화할 수 있다는 점에서 돋보입니다.
이 과정은 기본부터 모든 것을 다룹니다. LLM 수학 양자화, 미세 조정, 모델 배포와 같은 고급 주제까지, 모든 수준의 학습자를 위한 완벽한 패키지입니다.
주요 특징

누가 사용해야합니까?
이 저장소는 체계적인 소개가 필요한 초보자와 LLM 개발의 특정 분야에 대한 전문 지식을 심화하고자 하는 숙련된 전문가 모두에게 적합합니다.
2. 핸즈온LLM
HandsOnLLM/Hands-On-Large-Language-Models 저장소는 다음의 공식 동반자입니다. 오라일리 책 같은 이름의.'s LLM의 작동 방식을 이해하기 쉽게 설명하는 시각적으로 풍부하고 실용적인 가이드입니다. 직접 해보면서 배우는 것이 가장 효과적이며, 잘 문서화된 코드 예제를 선호한다면 이 저장소가 바로 당신을 위한 것입니다.
왜's 최고의 선택
이 책은 실용적이고 프로젝트 기반의 학습 방식을 제공합니다. 각 장에는 Jupyter 노트북이 포함되어 있어 코드를 따라가며 직접 실험해 볼 수 있습니다. 실제 프로젝트와 예제에 중점을 두고 있으며, 이를 자신의 사용 사례에 맞게 수정할 수 있습니다.

주요 특징
누가 사용해야합니까?
실습 중심의 프로젝트 기반 학습 방식을 선호하는 개발자와 데이터 과학자라면 이 저장소가 매우 유용할 것입니다. 또한 "Hands-on Large Language Models" 책을 읽는 모든 사람에게 훌륭한 자료가 될 것입니다.
3. 프롬프트 엔지니어링
brexhq/prompt-engineering 가이드는 예술과 과학을 습득하기 위한 보물 창고입니다. 신속한 엔지니어링LLM 분야에서는 결과물의 질이 입력의 질에 따라 결정되는 경우가 많기 때문에 이 기술은 절대적으로 필수적입니다. 거의 9,000개의 별점을 받은 이 저장소는 GPT-4와 같은 모델을 다루는 데 유용한 실용적인 팁과 전략을 제공합니다.
왜's 최고의 선택
프로덕션 사용 사례에 대한 프롬프트를 만들면서 얻은 교훈을 통합하여 매우 실용적입니다. 저장소는 기본 원리부터 고급 기술까지 모든 것을 다루는 튜토리얼로 잘 구성되어 있습니다. 생각의 사슬(CoT) 프롬핑 그리고 자기 일관성.

주요 특징
누가 사용해야합니까?
개발자, 연구자, 콘텐츠 제작자, 마케터 등 LLM과 소통하는 모든 사람에게 이 저장소가 큰 도움이 될 것입니다. 프롬프트 엔지니어링을 완벽하게 숙달하는 것은 어떤 언어 모델이든 최대한 활용하는 데 필수적인 기술입니다.
4. 굉장-LLM

Hannibal046/Awesome-LLM 저장소는 대규모 언어 모델(LLM)과 관련된 모든 정보를 엄선하여 정리한 목록입니다. LLM 생태계의 최신 정보를 얻을 수 있는 중앙 대시보드라고 생각하면 됩니다. 커뮤니티에서 정기적으로 업데이트되는 생생한 자료 모음입니다.
왜's 최고의 선택
이 저장소는 필수 리소스를 한곳에 모아 검색에 소요되는 수많은 시간을 절약해 줍니다. 주요 연구 논문, 교육 프레임워크, 배포 도구, 평가 벤치마크가 포함되어 있으며, 다양한 LLM의 성과를 추적할 수 있는 리더보드 기능도 제공합니다.
주요 특징
누가 사용해야합니까?
고품질 LLM 자료를 원스톱으로 제공하는 서비스를 원하는 연구자, 학생, 실무자에게 꼭 필요한 자료입니다. 새로운 도구를 활용하고 최신 연구 동향을 파악하는 데 안성맞춤입니다.
5. 툴벤치

LLM이 더욱 에이전트화됨에 따라 외부 도구를 사용하는 능력이 점점 더 중요해지고 있습니다. OpenBMB/ToolBench 저장소는 오픈 소스 플랫폼 도구 학습을 위한 LLM의 훈련, 제공 및 평가를 위해 설계되었습니다. 이러한 기능을 향상시키기 위한 프레임워크와 대규모 교육 튜닝 데이터셋을 제공합니다.
왜's 최고의 선택
ToolBench는 LLM 개발의 중요하고 트렌드적인 영역인 도구 사용에 중점을 둡니다. StableToolBench 확장 프로그램은 다음과 같은 기능을 도입하여 이를 더욱 향상시킵니다. 미러API수천 개의 시뮬레이션을 수행하는 실제 API및 가상 API 시스템 평가 중 안정성과 일관성을 보장합니다.

주요 특징
누가 사용해야합니까?

상호작용이 가능한 에이전트 LLM 구축에 관심이 있는 연구원 및 개발자 외부 API 그리고 도구들은 ToolBench를 매우 소중하게 여길 것입니다. 더욱 유능하고 자율적인 도구를 만드는 데 이상적입니다. AI 자치령 대표.
6. 피 티아
EleutherAI에서 개발한 EleutherAI/pythia 저장소는 해석 가능성, 학습 역학, 윤리 연구를 지원하도록 설계된 모델 모음입니다. 다른 많은 모델 릴리스와 달리, Pythia 모음은 투명성과 과학적 연구를 주요 목표로 삼아 개발되었습니다.
왜's 최고의 선택
Pythia는 16개의 다양한 모델 체크포인트에 대한 완전한 오픈 소스 액세스를 제공하여 연구자들이 LLM이 학습 과정에서 어떻게 발전하고 진화하는지 연구할 수 있도록 지원합니다. 이는 이러한 모델의 "블랙박스" 특성을 이해하고 스케일링 법칙 및 모델 윤리와 같은 분야를 연구하는 데 매우 중요합니다.

주요 특징
누가 사용해야합니까?
AI 모델 해석 가능성, 안전성, LLM 교육의 기본 원칙에 중점을 둔 연구자, 윤리학자 및 학생은 이 저장소에서 많은 이점을 얻을 수 있을 것입니다.
7. LLM-에이전트-논문-목록

학문적인 측면을 깊이 파고들고 싶은 사람들을 위해 AI 자치령 대표WooooDyy/LLM-Agent-Paper-List는 필수 리소스입니다. 이 저장소는 개발, 응용 및 구현을 체계적으로 탐구하는 연구 논문들을 엄선하여 모아놓은 곳입니다. LLM 기반 에이전트.
왜's 최고의 선택
이는 가장 흥미로운 분야 중 하나에 대한 지식의 기초 라이브러리 역할을 합니다. AI 오늘. 단순한 코드 대신 이 저장소는 차세대를 이해하고 구축하는 데 필요한 이론적 토대를 제공합니다. AI 자치령 대표.
주요 특징

누가 사용해야합니까?
이 저장소는 LLM 기반 에이전트에 대한 최첨단 연구를 바탕으로 연구를 진행하고자 하는 학술 연구자, 대학원생, 고급 실무자를 대상으로 합니다.
8. 놀라운 멀티모달 대규모 언어 모델
LLM은 더 이상 텍스트에만 국한되지 않습니다. BradyFU/Awesome-Multimodal-Large-Language-Models 저장소는 텍스트, 이미지, 오디오 및 비디오의 정보를 처리할 수 있는 멀티모달 LLM(MLLM)의 최신 기술 발전에 초점을 맞춘 엄선된 리소스 모음입니다.
왜's 최고의 선택
이 저장소는 MLLM 세계로 향하는 관문입니다. 다중 모드 학습 튜닝부터 사고 연쇄 추론 및 환각 완화 기법까지 광범위한 주제를 다룹니다. 또한 오픈 소스 인터랙티브 다중 모드 LLM 플랫폼인 VITA 프로젝트와도 연결되어 있습니다.

주요 특징
누가 사용해야합니까?
텍스트 기반의 애플리케이션을 넘어 이미지 캡션, 비디오 분석, 음성 제어 지원 등 다양한 애플리케이션을 구축하는 데 관심이 있는 개발자와 연구자라면 이 컬렉션이 매우 유용할 것입니다.
9. 딥스피드
Microsoft에서 개발한 microsoft/DeepSpeed는 분산 학습 및 추론을 쉽고 효율적으로 만들어 주는 딥러닝 최적화 라이브러리입니다. 다음과 완벽하게 통합됩니다. 파이 토치 그리고 세계의 일부 사람들을 훈련하는 데 중요한 역할을 했습니다.'s 530억 개의 매개변수를 가진 메가트론-튜링 모델을 포함한 가장 큰 모델.

왜's 최고의 선택
DeepSpeed는 확장성과 효율성을 중시합니다. 제한된 하드웨어에서 수십억 개의 매개변수를 가진 대규모 모델을 학습할 수 있도록 시스템 수준의 혁신을 제공합니다. 최첨단 LLM을 처음부터 학습하거나 대규모 LLM을 미세 조정하려는 모든 사람에게 DeepSpeed의 기능은 필수적입니다.
주요 특징
누가 사용해야합니까?
이 도구는 매우 큰 규모의 언어 모델을 학습시키거나 미세 조정해야 하는 실무자, 데이터 과학자, 그리고 연구자들을 위한 도구입니다. 현재 설정에서 메모리 한계에 부딪히셨다면 DeepSpeed가 바로 해결책입니다.
10. 라마.cpp
ggml-org/llama.cpp 저장소는 소비자용 하드웨어에서 LLM을 실행하는 데 있어 획기적인 변화를 가져왔습니다.'s 데스크톱 및 모바일 기기를 포함한 로컬 머신에서 추론을 실행하기 위한 고성능 C/C++ 라이브러리입니다.'s GGML 텐서 라이브러리를 기반으로 구축되었으며 효율성과 최소한의 설정으로 유명합니다.

왜's 최고의 선택
llama.cpp는 누구나 강력한 LLM을 사용할 수 있도록 합니다. 다음과 같은 모델을 실험하기 위해 대규모 클라우드 GPU 클러스터가 필요하지 않습니다. 라마 3, Mistral 또는 GPT-2. CPU 및 엣지 기기 성능에 중점을 두어 LLM 사용이 보편화되었습니다. 몇 가지 명령만으로 로컬 서버를 설정하고 모델과 상호 작용할 수 있습니다.
주요 특징
누가 사용해야합니까?
값비싼 클라우드 서비스에 의존하지 않고 로컬에서 LLM을 실행하고 실험하고 싶은 개발자, 취미 개발자, 연구자.'s 또한 디바이스에서 빌드하는 데 적합합니다. AI 어플리케이션 개인정보 보호와 낮은 지연 시간을 우선시합니다.
11. PaLM-rlhf-pytorch
인간 피드백을 활용한 강화 학습(RLHF)은 ChatGPT와 같은 모델의 인상적인 대화 능력을 뒷받침하는 핵심 요소입니다. lucidrains/PaLM-rlhf-pytorch 저장소는 Google에 적용된 RLHF의 오픈 소스 구현을 제공합니다.'s PaLM 아키텍처.
왜's 최고의 선택
이 저장소는 현대 LLM 개발에서 가장 중요한 기술 중 하나를 명확하게 설명합니다. ChatGPT의 기능을 다음 기능을 사용하여 재현하는 것을 목표로 합니다. PaLM 모델RLHF 구현 방법에 대한 구체적인 예를 제공합니다. 사전 학습된 모델을 로드하거나 필요에 따라 미세 조정할 수 있습니다.

주요 특징
누가 사용해야합니까?
이 저장소는 미세 조정 프로세스에 관심이 있는 연구자와 개발자, 특히 LLM을 인간의 선호도에 맞게 조정하기 위해 RLHF를 이해하고 구현하고자 하는 연구자와 개발자를 위한 것입니다.
12. 나노GPT
전설적인 안드레이 카르파티가 만든 karpathy/nanoGPT는 중간 규모의 GPT 학습 및 미세 조정을 위한 가장 간단하고 빠른 저장소입니다. 코드베이스는 의도적으로 간결하게 구성되어 있으며, 핵심 학습 루프는 train.py에, 모델 정의는 model.py에 있습니다.
왜's 최고의 선택
nanoGPT는 단순성과 교육적 가치를 중시합니다. 대규모 라이브러리의 복잡성을 모두 제거하여 트랜스포머 아키텍처를 처음부터 이해할 수 있도록 합니다. 단순성에도 불구하고,'s GPT-2 수준의 결과를 재현할 만큼 강력하며 시각 언어 모델을 위한 nanoVLM과 같은 다른 미니멀리스트 프로젝트에 영감을 주었습니다.

주요 특징
누가 사용해야합니까?
nanoGPT는 GPT 아키텍처에 대한 심층적이고 기본적인 이해를 원하는 학생, 교육자, 개발자에게 이상적입니다. 블랙박스 라이브러리 그리고 사물이 실제로 어떻게 작동하는지 보고 싶다면, 이 저장소가 당신을 위한 것입니다.
너의 LLM 여정 필수 GitHub 저장소로 시작하세요
LLM에 대한 꿈을 꾸는 것과 실제로 그것을 이루는 것의 차이점은 무엇일까요? GitHub 저장소는 12개입니다. 다른 사람들이 이론에 대해 논쟁하는 동안, 이제 당신은 오늘날의 코드에 직접 접근할 수 있습니다.'s 가장 진보 된 언어 모델.
귀하의 경쟁 우위가 여러분을 기다리고 있습니다:
- nanoGPT 복제 변압기 기본을 이해하다
- 포크 라마.cpp 로컬 모델 배포를 위해
- 스타 LLM 과정 체계적인 학습 경로를 위해
- DeepSpeed에 기여하세요 그리고 Microsoft에 가입하세요's 최적화 노력
LLM 분야는 빠르게 발전합니다.개발자 오늘날 이러한 저장소를 마스터하는 사람이 내일이 됩니다.'s AI 건축가. 가장 유용한 저장소 3개를 선택하고 개발 환경을 설정한 후 실험을 시작하세요. 모든 커밋, 모든 풀 리퀘스트, 모든 모델 학습은 LLM 마스터에 한 걸음 더 가까워지는 데 도움이 됩니다.

