
สนใจเกี่ยวกับการสร้าง ปรับแต่ง หรือปรับใช้ โมเดลภาษาขนาดใหญ่?
คุณไม่ได้อยู่คนเดียว—ความเชี่ยวชาญ LLM เป็นหนึ่งในทักษะที่ได้รับความนิยมสูงสุดใน AI วันนี้. กับ โครงการโอเพ่นซอร์ส เติบโตอย่างรวดเร็ว GitHub ได้กลายเป็นศูนย์กลางสำหรับระดับชั้นนำ โครงการ LLM กรอบงาน และการวิจัย.
คู่มือนี้เน้นย้ำถึงสิ่งสำคัญ 12 ประการ ที่เก็บ GitHub เต็มไปด้วยโค้ดต้นฉบับ บทช่วยสอนเชิงปฏิบัติ และการนำโมเดลไปใช้งาน
ได้รับการพิสูจน์ ความรู้ LLMเร่งการเรียนรู้ของคุณ และเข้าร่วมชุมชนระดับโลกที่กำลังกำหนดอนาคตของปัญญาประดิษฐ์ ทั้งหมดนี้ด้วยคลังข้อมูล GitHub ที่ต้องรู้เหล่านี้
ทำไม GitHub เป็นสิ่งจำเป็นสำหรับการพัฒนา LLM
GitHub ได้กลายเป็นหัวใจสำคัญของระบบนิเวศ LLM ที่ซึ่งการวิจัยที่ก้าวล้ำมาบรรจบกับการนำไปปฏิบัติจริง ในขณะที่เอกสารทางวิชาการให้ทฤษฎี GitHub มอบโค้ดจริงที่ขับเคลื่อนปัจจุบัน's รูปแบบภาษาที่ก้าวหน้าที่สุด
แพลตฟอร์มนี้โฮสต์ทุกอย่างจาก Meta's การนำ Llama ไปใช้กับ OpenAI's ฐานรหัสการวิจัยทำให้เป็นวิธีที่เร็วที่สุดในการเข้าถึงเทคนิคที่ผ่านการพิสูจน์แล้วและก้าวล้ำหน้าการพัฒนาที่รวดเร็ว
เหตุผลหลักที่ GitHub ครองตลาดการพัฒนา LLM:
สำหรับผู้ที่ชื่นชอบ LLM GitHub ไม่ใช่แค่แหล่งข้อมูลเท่านั้น's สายตรงของคุณสู่อนาคตของ AI พัฒนาการ
1. หลักสูตร LL.M

มักซีม ลาบอนน์'s หลักสูตร llm เป็นจุดเริ่มต้นที่ยอดเยี่ยมและเป็นแผนงานที่ครอบคลุมสำหรับทุกคนที่จริงจังเกี่ยวกับ การเรียนรู้ LLM. มัน's มากกว่าแค่การรวบรวมไฟล์'s เส้นทางการเรียนรู้ที่มีโครงสร้างที่ตอบโจทย์เป้าหมายอาชีพที่หลากหลาย คลังข้อมูลนี้ได้รับความนิยมอย่างล้นหลาม โดยมีดาวบน GitHub มากกว่า 51,500 ดวง
ทำไมมัน's ตัวเลือกยอดนิยม
ที่เก็บข้อมูลนี้โดดเด่นเพราะมีแผนงานที่แตกต่างกันสองแบบ ช่วยให้คุณปรับแต่งเส้นทางการเรียนรู้ของคุณได้:
หลักสูตรครอบคลุมทุกอย่างตั้งแต่พื้นฐาน ปริญญาโทสาขาคณิตศาสตร์ ไปจนถึงหัวข้อขั้นสูง เช่น การหาปริมาณ การปรับแต่งอย่างละเอียด และการปรับใช้แบบจำลอง เป็นแพ็คเกจที่ครบครันสำหรับผู้เรียนทุกระดับ
Key Features

ใครควรใช้?
คลังข้อมูลนี้เหมาะสำหรับทั้งผู้เริ่มต้นที่ต้องการคำแนะนำที่มีโครงสร้าง และผู้เชี่ยวชาญที่มีประสบการณ์ที่ต้องการเจาะลึกความเชี่ยวชาญในพื้นที่เฉพาะของการพัฒนา LLM
2. แฮนด์สออนแอลแอลเอ็ม
คลังข้อมูล HandsOnLLM/Hands-On-Large-Language-Models เป็นคู่มืออย่างเป็นทางการของ หนังสือของโอไรลีย์ ที่มีชื่อเดียวกัน มัน's คู่มือที่ครบครันและใช้งานได้จริง อธิบายวิธีการทำงานของหลักสูตร LLM ได้อย่างเข้าใจง่าย หากคุณเรียนรู้ได้ดีที่สุดจากการลงมือทำและชื่นชอบตัวอย่างโค้ดที่มีเอกสารประกอบอย่างดี คลังข้อมูลนี้เหมาะสำหรับคุณ
ทำไมมัน's ตัวเลือกยอดนิยม
หนังสือเล่มนี้เสนอแนวทางการเรียนรู้แบบเน้นโครงการที่ใช้งานได้จริง แต่ละบทของหนังสือมาพร้อมกับสมุดบันทึก Jupyter ช่วยให้คุณติดตามและทดลองใช้โค้ดด้วยตัวเองได้ หนังสือเล่มนี้เน้นที่โครงการและตัวอย่างในโลกแห่งความเป็นจริงที่คุณสามารถนำไปปรับใช้กับกรณีการใช้งานของคุณเองได้

Key Features
ใครควรใช้?
นักพัฒนาและนักวิทยาศาสตร์ข้อมูลที่ชอบการเรียนรู้แบบลงมือปฏิบัติจริงตามโครงการจะพบว่าคลังข้อมูลนี้มีประโยชน์อย่างยิ่ง นอกจากนี้ยังเป็นแหล่งข้อมูลที่ยอดเยี่ยมสำหรับใครก็ตามที่อ่านหนังสือ “Hands-on Large Language Models”
3. วิศวกรรมแจ้งเตือน
คู่มือ brexhq/prompt-engineering ถือเป็นขุมทรัพย์สำหรับการเชี่ยวชาญศิลปะและวิทยาศาสตร์ของ วิศวกรรมพรอมต์ในโลกของ LLM คุณภาพของผลงานของคุณมักถูกกำหนดโดยคุณภาพของข้อมูลที่คุณป้อน ทำให้ทักษะนี้มีความจำเป็นอย่างยิ่ง คลังข้อมูลนี้มีดาวเกือบ 9,000 ดวง และนำเสนอเคล็ดลับและกลยุทธ์ที่เป็นประโยชน์สำหรับการทำงานกับโมเดลเช่น GPT-4
ทำไมมัน's ตัวเลือกยอดนิยม
รวบรวมบทเรียนที่เรียนรู้จากการสร้างคำแนะนำสำหรับกรณีการใช้งานการผลิต ทำให้ใช้งานได้จริงอย่างมาก คลังข้อมูลได้รับการจัดระเบียบอย่างดีเป็นบทช่วยสอนที่ครอบคลุมทุกอย่างตั้งแต่หลักการพื้นฐานไปจนถึงเทคนิคขั้นสูง เช่น การกระตุ้นความคิดแบบโซ่ (CoT) และความสอดคล้องของตัวเอง

Key Features
ใครควรใช้?
ทุกคนที่โต้ตอบกับ LLM ไม่ว่าจะเป็นนักพัฒนาและนักวิจัย ผู้สร้างเนื้อหาและนักการตลาด จะได้รับประโยชน์จากคลังข้อมูลนี้ การเรียนรู้วิศวกรรมคำสั่งเป็นทักษะสำคัญในการใช้ประโยชน์สูงสุดจากแบบจำลองภาษาใดๆ
4. สุดยอด-LLM

คลังข้อมูล Hannibal046/Awesome-LLM เป็นรายการรวบรวมสิ่งต่างๆ ที่เกี่ยวข้องกับ Large Language Models ไว้ทั้งหมด ถือเป็นแผงควบคุมส่วนกลางสำหรับอัปเดตข้อมูลล่าสุดเกี่ยวกับระบบนิเวศ LLM เป็นแหล่งรวบรวมทรัพยากรที่มีชีวิตซึ่งชุมชนจะอัปเดตเป็นประจำ
ทำไมมัน's ตัวเลือกยอดนิยม
คลังข้อมูลนี้ช่วยให้คุณประหยัดเวลาในการค้นหาได้หลายชั่วโมงด้วยการรวบรวมทรัพยากรที่จำเป็นไว้ในที่เดียว ซึ่งรวมถึงเอกสารวิจัยที่สำคัญ กรอบการฝึกอบรม เครื่องมือการปรับใช้ และเกณฑ์มาตรฐานการประเมิน นอกจากนี้ยังมีกระดานผู้นำเพื่อติดตามประสิทธิภาพของหลักสูตร LLM ต่างๆ
Key Features
ใครควรใช้?
หนังสือเล่มนี้เป็นหนังสือที่นักวิจัย นักศึกษา และผู้ประกอบวิชาชีพต้องมี หนังสือเล่มนี้เหมาะสำหรับผู้ที่ต้องการแหล่งข้อมูลด้าน LLM ที่มีคุณภาพสูง หนังสือเล่มนี้เหมาะสำหรับผู้ที่ต้องการค้นพบเครื่องมือใหม่ๆ และคอยติดตามข้อมูลเกี่ยวกับงานวิจัยล่าสุด
5. เครื่องมือม้านั่ง

เมื่อ LLM กลายเป็นตัวแทนมากขึ้น ความสามารถในการใช้เครื่องมือภายนอกก็มีความสำคัญเพิ่มมากขึ้น คลังข้อมูล OpenBMB/ToolBench คือ แพลตฟอร์มโอเพ่นซอร์ส ออกแบบมาเพื่อฝึกอบรม ให้บริการ และประเมินผลหลักสูตรปริญญาโทสาขาบริหารธุรกิจ (LLM) สำหรับการเรียนรู้เครื่องมือ มีกรอบการทำงานและชุดข้อมูลการปรับแต่งคำสั่งขนาดใหญ่เพื่อเสริมความสามารถเหล่านี้
ทำไมมัน's ตัวเลือกยอดนิยม
ToolBench มุ่งเน้นไปที่ประเด็นสำคัญและกำลังเป็นกระแสของการพัฒนา LLM นั่นคือ การใช้เครื่องมือ ส่วนขยาย StableToolBench ช่วยเพิ่มประสิทธิภาพในส่วนนี้ด้วยการแนะนำฟีเจอร์ต่างๆ เช่น มิเรอร์เอพีไอซึ่งจำลองเหตุการณ์หลายพันครั้ง API จริงและใน ระบบ API เสมือนจริง เพื่อให้มั่นใจถึงความเสถียรและความสอดคล้องระหว่างการประเมิน

Key Features
ใครควรใช้?

นักวิจัยและนักพัฒนาที่สนใจในการสร้าง LLM แบบตัวแทนที่สามารถโต้ตอบกับ API ภายนอก และเครื่องมือต่างๆ จะพบว่า ToolBench มีคุณค่าอย่างยิ่ง เหมาะอย่างยิ่งสำหรับผู้ที่กำลังดำเนินการสร้างเครื่องมือที่มีความสามารถและเป็นอิสระมากขึ้น AI ตัวแทน.
6. พีเธีย
คลังข้อมูล EleutherAI/pythia ได้รับการพัฒนาโดย EleutherAI โดยเป็นชุดโมเดลที่ออกแบบมาเพื่อให้สามารถทำการวิจัยเกี่ยวกับการตีความ การเรียนรู้แบบไดนามิก และจริยธรรมได้ ซึ่งแตกต่างจากรุ่นโมเดลอื่นๆ ชุด Pythia ถูกสร้างขึ้นโดยมีเป้าหมายหลักอยู่ที่ความโปร่งใสและการวิจัยทางวิทยาศาสตร์
ทำไมมัน's ตัวเลือกยอดนิยม
Pythia มอบการเข้าถึงโอเพนซอร์สอย่างเต็มรูปแบบสำหรับจุดตรวจสอบโมเดล 16 จุดที่แตกต่างกัน ช่วยให้นักวิจัยสามารถศึกษาว่า LLM พัฒนาและวิวัฒนาการอย่างไรในระหว่างการฝึกอบรม ซึ่งถือเป็นสิ่งสำคัญสำหรับการทำความเข้าใจลักษณะ "กล่องดำ" ของโมเดลเหล่านี้ และสำหรับการวิจัยด้านต่างๆ เช่น กฎการปรับขนาดและจริยธรรมของโมเดล

Key Features
ใครควรใช้?
AI นักวิจัย นักจริยธรรม และนักศึกษาที่มุ่งเน้นด้านการตีความแบบจำลอง ความปลอดภัย และหลักการพื้นฐานของการฝึกอบรม LLM จะได้รับประโยชน์มากมายจากคลังข้อมูลนี้
7. รายชื่อเอกสารตัวแทน LLM

สำหรับผู้ที่ต้องการเจาะลึกด้านวิชาการ AI ตัวแทนWooooDyy/LLM-Agent-Paper-List เป็นแหล่งข้อมูลที่สำคัญ คลังข้อมูลนี้เป็นการรวบรวมเอกสารวิจัยที่คัดสรรมาอย่างดี ซึ่งสำรวจการพัฒนา แอปพลิเคชัน และการนำเอกสารไปใช้อย่างเป็นระบบ ตัวแทนตาม LLM.
ทำไมมัน's ตัวเลือกยอดนิยม
ทำหน้าที่เป็นห้องสมุดความรู้พื้นฐานสำหรับหนึ่งในสาขาที่น่าตื่นเต้นที่สุดใน AI วันนี้ แทนที่จะมีเพียงโค้ด รีโพนี้ให้พื้นฐานทางทฤษฎีที่คุณต้องการเพื่อทำความเข้าใจและสร้างรุ่นต่อไป AI ตัวแทน
Key Features

ใครควรใช้?
ที่เก็บข้อมูลนี้มุ่งเป้าไปที่นักวิจัยในสถาบันการศึกษา นักศึกษาระดับปริญญาตรี และผู้ปฏิบัติงานขั้นสูงที่ต้องการสร้างงานวิจัยที่ล้ำสมัยในตัวแทนที่ใช้พื้นฐาน LLM
8. สุดยอดโมเดลภาษาขนาดใหญ่แบบมัลติโมดัล
LLMS ไม่ถูกจำกัดอยู่แค่ข้อความอีกต่อไป คลังข้อมูล BradyFU/Awesome-Multimodal-Large-Language-Models เป็นคอลเลกชันทรัพยากรที่คัดสรรมาอย่างดีซึ่งเน้นที่ความก้าวหน้าล่าสุดใน LLM แบบหลายรูปแบบ (MLLM) ซึ่งสามารถประมวลผลข้อมูลจากข้อความ รูปภาพ เสียง และวิดีโอ
ทำไมมัน's ตัวเลือกยอดนิยม
คลังข้อมูลนี้เป็นประตูสู่โลกของ MLLM ครอบคลุมหัวข้อต่างๆ มากมาย ตั้งแต่การปรับแต่งคำสั่งแบบหลายโหมดไปจนถึงการใช้เหตุผลแบบลำดับความคิดและเทคนิคการบรรเทาภาพหลอน นอกจากนี้ยังเชื่อมต่อกับโครงการ VITA ซึ่งเป็นแพลตฟอร์ม LLM แบบหลายโหมดโต้ตอบโอเพ่นซอร์สอีกด้วย

Key Features
ใครควรใช้?
นักพัฒนาและนักวิจัยที่สนใจในการสร้างแอปพลิเคชันที่เหนือกว่าข้อความ เช่น คำบรรยายภาพ การวิเคราะห์วิดีโอ หรือผู้ช่วยที่ควบคุมด้วยเสียง จะพบว่าคอลเลกชั่นนี้มีประโยชน์อย่างยิ่ง
9. ความเร็วลึก
microsoft/DeepSpeed พัฒนาโดย Microsoft เป็นไลบรารีเพิ่มประสิทธิภาพการเรียนรู้เชิงลึกที่ช่วยให้การฝึกอบรมและการอนุมานแบบกระจายเป็นเรื่องง่ายและมีประสิทธิภาพ สามารถผสานรวมเข้ากับ ไพทอร์ช และมีส่วนช่วยในการฝึกอบรมบางส่วนของโลก's แบบจำลองที่ใหญ่ที่สุด รวมถึงแบบจำลองเมกะทรอน-ทัวริงที่มีพารามิเตอร์ 530 พันล้าน

ทำไมมัน's ตัวเลือกยอดนิยม
DeepSpeed ให้ความสำคัญกับการปรับขนาดและประสิทธิภาพ โดยนำเสนอนวัตกรรมระดับระบบที่ช่วยให้คุณฝึกโมเดลขนาดใหญ่ที่มีพารามิเตอร์นับพันล้านบนฮาร์ดแวร์ที่มีข้อจำกัด คุณสมบัติต่างๆ ของ DeepSpeed ถือเป็นสิ่งสำคัญสำหรับทุกคนที่จริงจังกับการฝึก LLM ที่ทันสมัยตั้งแต่เริ่มต้นหรือปรับแต่ง LLM ขนาดใหญ่
Key Features
ใครควรใช้?
นี่คือเครื่องมือสำหรับผู้ปฏิบัติงานที่จริงจัง นักวิทยาศาสตร์ข้อมูล และนักวิจัยที่ต้องการฝึกอบรมหรือปรับแต่งโมเดลภาษาขนาดใหญ่ หากคุณกำลังประสบปัญหาหน่วยความจำไม่เพียงพอกับการตั้งค่าปัจจุบัน DeepSpeed คือโซลูชัน
10. ลามะ.cpp
ที่เก็บ ggml-org/llama.cpp เป็นตัวเปลี่ยนเกมสำหรับการรัน LLM บนฮาร์ดแวร์ของผู้บริโภค's ไลบรารี C/C++ ประสิทธิภาพสูงสำหรับการรันการอนุมานบนเครื่องท้องถิ่น รวมถึงเดสก์ท็อปและแม้แต่อุปกรณ์พกพา's สร้างขึ้นบนไลบรารีเทนเซอร์ GGML และมีชื่อเสียงในเรื่องประสิทธิภาพและการตั้งค่าขั้นต่ำ

ทำไมมัน's ตัวเลือกยอดนิยม
llama.cpp ทำให้ LLM ที่ทรงพลังเข้าถึงได้สำหรับทุกคน คุณไม่จำเป็นต้องมีคลัสเตอร์ GPU บนคลาวด์ขนาดใหญ่เพื่อทดลองใช้โมเดลเช่น ลามะ 3มิสทรัล หรือ GPT-2 การมุ่งเน้นที่ประสิทธิภาพของ CPU และอุปกรณ์เอดจ์ทำให้การใช้งาน LLM แพร่หลายมากขึ้น คุณสามารถตั้งค่าเซิร์ฟเวอร์ภายในเครื่องได้ด้วยคำสั่งเพียงไม่กี่คำสั่ง และเริ่มโต้ตอบกับโมเดลต่างๆ ได้
Key Features
ใครควรใช้?
นักพัฒนา ผู้ที่ชื่นชอบ และนักวิจัยที่ต้องการรันและทดลองใช้ LLM ในเครื่องโดยไม่ต้องพึ่งพาบริการคลาวด์ราคาแพง's ยังเหมาะสำหรับการสร้างบนอุปกรณ์อีกด้วย AI การใช้งาน ที่ให้ความสำคัญกับความเป็นส่วนตัวและความหน่วงต่ำ
11. PaLM-rlhf-ไพทอร์ช
การเรียนรู้แบบเสริมแรงด้วยคำติชมจากมนุษย์ (RLHF) ถือเป็นสูตรลับเบื้องหลังความสามารถในการสนทนาที่น่าประทับใจของโมเดลต่างๆ เช่น ChatGPT คลังข้อมูล lucidrains/PaLM-rlhf-pytorch นำเสนอการใช้งาน RLHF แบบโอเพนซอร์สที่นำไปใช้กับ Google's สถาปัตยกรรม PaLM
ทำไมมัน's ตัวเลือกยอดนิยม
ที่เก็บข้อมูลนี้ช่วยไขข้อข้องใจเกี่ยวกับเทคนิคที่สำคัญที่สุดอย่างหนึ่งในการพัฒนา LLM สมัยใหม่ โดยมีเป้าหมายเพื่อจำลองฟังก์ชันการทำงานของ ChatGPT โดยใช้ แบบจำลอง PaLMโดยให้ตัวอย่างที่เป็นรูปธรรมว่าสามารถนำ RLHF ไปใช้งานได้อย่างไร คุณสามารถโหลดโมเดลที่ฝึกอบรมไว้ล่วงหน้าหรือปรับแต่งให้เหมาะกับความต้องการของคุณเองได้

Key Features
ใครควรใช้?
คลังข้อมูลนี้มีไว้สำหรับนักวิจัยและนักพัฒนาที่สนใจในกระบวนการปรับแต่งโดยเฉพาะผู้ที่ต้องการทำความเข้าใจและนำ RLHF ไปใช้เพื่อให้ LLM สอดคล้องกับความต้องการของมนุษย์
12. นาโนจีพีที
karpathy/nanoGPT สร้างขึ้นโดย Andrej Karpathy ผู้เป็นตำนาน นับเป็นคลังข้อมูลที่เรียบง่ายและรวดเร็วที่สุดสำหรับการฝึกและปรับแต่ง GPT ขนาดกลาง ฐานโค้ดของ karpathy/nanoGPT ได้รับการออกแบบมาให้กระชับ โดยมีลูปการฝึกหลักอยู่ใน train.py และคำจำกัดความของโมเดลอยู่ใน model.py
ทำไมมัน's ตัวเลือกยอดนิยม
nanoGPT ให้ความสำคัญกับความเรียบง่ายและคุณค่าทางการศึกษา โดยขจัดความซับซ้อนทั้งหมดของไลบรารีขนาดใหญ่ ช่วยให้คุณเข้าใจสถาปัตยกรรมของทรานสฟอร์มเมอร์ตั้งแต่พื้นฐาน แม้ว่าจะเรียบง่าย แต่ก็'s มีประสิทธิภาพเพียงพอที่จะสร้างผลลัพธ์ระดับ GPT-2 ได้ และได้เป็นแรงบันดาลใจให้กับโครงการเรียบง่ายอื่นๆ เช่น nanoVLM สำหรับโมเดลภาษาวิสัยทัศน์

Key Features
ใครควรใช้?
nanoGPT เหมาะอย่างยิ่งสำหรับนักเรียน นักการศึกษา และนักพัฒนาที่ต้องการความเข้าใจพื้นฐานที่ลึกซึ้งเกี่ยวกับสถาปัตยกรรม GPT หากคุณเบื่อหน่ายกับ... ห้องสมุดกล่องดำ และต้องการดูว่าสิ่งต่างๆ ทำงานอย่างไรจริงๆ นี่คือที่เก็บข้อมูลสำหรับคุณ
ของคุณ การเดินทาง LLM เริ่มต้นด้วยคลังข้อมูล GitHub ที่จำเป็นเหล่านี้
ความแตกต่างระหว่างการฝันถึงปริญญา LLM กับการสร้างปริญญา LLM ขึ้นมาจริงๆ คืออะไร? ที่เก็บข้อมูล GitHub ทั้ง 12 นี้ ในขณะที่คนอื่นถกเถียงกันเรื่องทฤษฎี ตอนนี้คุณมีสิทธิ์เข้าถึงโค้ดที่ขับเคลื่อนในปัจจุบันโดยตรงแล้ว's ทันสมัยที่สุด โมเดลภาษา.
ข้อได้เปรียบในการแข่งขันของคุณกำลังรอคุณอยู่:
- โคลน nanoGPT เพื่อเข้าใจพื้นฐานของหม้อแปลง
- ฟอร์ก llama.cpp สำหรับการปรับใช้แบบจำลองในพื้นที่
- หลักสูตรสตาร์ ล.ม. สำหรับเส้นทางการเรียนรู้ที่มีโครงสร้าง
- ร่วมสนับสนุน DeepSpeed และเข้าร่วมกับ Microsoft's ความพยายามในการเพิ่มประสิทธิภาพ
สาขา LLM ก้าวหน้าอย่างรวดเร็ว—นักพัฒนา ใครเชี่ยวชาญคลังข้อมูลเหล่านี้วันนี้จะกลายเป็นพรุ่งนี้'s AI สถาปนิก เลือกคลังข้อมูล 3 อันดับแรกของคุณ ตั้งค่าสภาพแวดล้อมการพัฒนาของคุณ และเริ่มทดลองได้เลย ทุกการคอมมิต ทุกการดึงคำขอ และทุกโมเดลที่คุณฝึกฝน จะช่วยให้คุณเข้าใกล้ความเชี่ยวชาญ LLM มากขึ้น

