คลังข้อมูล GitHub 12 อันดับแรกสำหรับการเชี่ยวชาญโมเดลภาษาขนาดใหญ่

ที่ดีที่สุดของ

by Ali

10 เดือนที่ผ่านมา 0 828

คลังข้อมูล GitHub ชั้นนำสำหรับการเชี่ยวชาญโมเดลภาษาขนาดใหญ่

สนใจเกี่ยวกับการสร้าง ปรับแต่ง หรือปรับใช้ โมเดลภาษาขนาดใหญ่?

คุณไม่ได้อยู่คนเดียว—ความเชี่ยวชาญ LLM เป็นหนึ่งในทักษะที่ได้รับความนิยมสูงสุดใน AI วันนี้. กับ โครงการโอเพ่นซอร์ส เติบโตอย่างรวดเร็ว GitHub ได้กลายเป็นศูนย์กลางสำหรับระดับชั้นนำ โครงการ LLM กรอบงาน และการวิจัย.

คู่มือนี้เน้นย้ำถึงสิ่งสำคัญ 12 ประการ ที่เก็บ GitHub เต็มไปด้วยโค้ดต้นฉบับ บทช่วยสอนเชิงปฏิบัติ และการนำโมเดลไปใช้งาน

ได้รับการพิสูจน์ ความรู้ LLMเร่งการเรียนรู้ของคุณ และเข้าร่วมชุมชนระดับโลกที่กำลังกำหนดอนาคตของปัญญาประดิษฐ์ ทั้งหมดนี้ด้วยคลังข้อมูล GitHub ที่ต้องรู้เหล่านี้

ทำไม GitHub เป็นสิ่งจำเป็นสำหรับการพัฒนา LLM

GitHub ได้กลายเป็นหัวใจสำคัญของระบบนิเวศ LLM ที่ซึ่งการวิจัยที่ก้าวล้ำมาบรรจบกับการนำไปปฏิบัติจริง ในขณะที่เอกสารทางวิชาการให้ทฤษฎี GitHub มอบโค้ดจริงที่ขับเคลื่อนปัจจุบัน's รูปแบบภาษาที่ก้าวหน้าที่สุด

แพลตฟอร์มนี้โฮสต์ทุกอย่างจาก Meta's การนำ Llama ไปใช้กับ OpenAI's ฐานรหัสการวิจัยทำให้เป็นวิธีที่เร็วที่สุดในการเข้าถึงเทคนิคที่ผ่านการพิสูจน์แล้วและก้าวล้ำหน้าการพัฒนาที่รวดเร็ว

เหตุผลหลักที่ GitHub ครองตลาดการพัฒนา LLM:

โค้ดในโลกแห่งความเป็นจริง – เข้าถึงการใช้งานที่พร้อมสำหรับการผลิต ไม่ใช่แค่เอกสารวิจัยเท่านั้น

ชุมชนที่กระตือรือร้น – รับความช่วยเหลือจากนักพัฒนาที่สร้างโครงการที่คล้ายกัน

อัพเดทล่าสุด – ดูเทคนิคใหม่ๆ และการปรับปรุงโมเดลในขณะที่เกิดขึ้น

รุ่นก่อนการฝึกอบรม – ดาวน์โหลดและปรับแต่งโมเดลที่มีอยู่แทนที่จะเริ่มต้นใหม่ตั้งแต่ต้น

เครื่องมือการทำงานร่วมกัน – มีส่วนร่วมในโครงการและสร้างชื่อเสียงในสาขา

สำหรับผู้ที่ชื่นชอบ LLM GitHub ไม่ใช่แค่แหล่งข้อมูลเท่านั้น's สายตรงของคุณสู่อนาคตของ AI พัฒนาการ

1. หลักสูตร LL.M

คลังเก็บ Github ของหลักสูตร LLM

มักซีม ลาบอนน์'s หลักสูตร llm เป็นจุดเริ่มต้นที่ยอดเยี่ยมและเป็นแผนงานที่ครอบคลุมสำหรับทุกคนที่จริงจังเกี่ยวกับ การเรียนรู้ LLM. มัน's มากกว่าแค่การรวบรวมไฟล์'s เส้นทางการเรียนรู้ที่มีโครงสร้างที่ตอบโจทย์เป้าหมายอาชีพที่หลากหลาย คลังข้อมูลนี้ได้รับความนิยมอย่างล้นหลาม โดยมีดาวบน GitHub มากกว่า 51,500 ดวง

ทำไมมัน's ตัวเลือกยอดนิยม

ที่เก็บข้อมูลนี้โดดเด่นเพราะมีแผนงานที่แตกต่างกันสองแบบ ช่วยให้คุณปรับแต่งเส้นทางการเรียนรู้ของคุณได้:

นักวิทยาศาสตร์ LLM:เส้นทางนี้เหมาะสำหรับผู้ที่ต้องการเจาะลึกถึงแก่นแท้ของการสร้างหลักสูตร LLM ที่ดีที่สุด โดยเน้นที่การฝึกอบรมล่าสุดและเทคนิคการปรับแต่งอย่างละเอียด

วิศวกร LLM:เส้นทางนี้มุ่งเน้นไปที่การสร้างและใช้งานแอปพลิเคชันในโลกแห่งความเป็นจริงที่ขับเคลื่อนโดย LLM

หลักสูตรครอบคลุมทุกอย่างตั้งแต่พื้นฐาน ปริญญาโทสาขาคณิตศาสตร์ ไปจนถึงหัวข้อขั้นสูง เช่น การหาปริมาณ การปรับแต่งอย่างละเอียด และการปรับใช้แบบจำลอง เป็นแพ็คเกจที่ครบครันสำหรับผู้เรียนทุกระดับ

Key Features

การเรียนรู้แบบมีโครงสร้าง:ให้คำแนะนำแบบชัดเจนทีละขั้นตอนในการเชี่ยวชาญ LLM

แนวทางปฏิบัติจริง:รวมถึงสมุดบันทึก Colab และแบบฝึกหัดภาคปฏิบัติเพื่อเสริมสร้างความเข้าใจของคุณ

เนื้อหาที่ครอบคลุม:ครอบคลุมหัวข้อต่างๆ มากมาย รวมถึงพื้นฐาน แบบจำลองอาคารและการปรับใช้แอปพลิเคชัน

ใครควรใช้?

คลังข้อมูลนี้เหมาะสำหรับทั้งผู้เริ่มต้นที่ต้องการคำแนะนำที่มีโครงสร้าง และผู้เชี่ยวชาญที่มีประสบการณ์ที่ต้องการเจาะลึกความเชี่ยวชาญในพื้นที่เฉพาะของการพัฒนา LLM

2. แฮนด์สออนแอลแอลเอ็ม

คลังข้อมูล HandsOnLLM/Hands-On-Large-Language-Models เป็นคู่มืออย่างเป็นทางการของ หนังสือของโอไรลีย์ ที่มีชื่อเดียวกัน มัน's คู่มือที่ครบครันและใช้งานได้จริง อธิบายวิธีการทำงานของหลักสูตร LLM ได้อย่างเข้าใจง่าย หากคุณเรียนรู้ได้ดีที่สุดจากการลงมือทำและชื่นชอบตัวอย่างโค้ดที่มีเอกสารประกอบอย่างดี คลังข้อมูลนี้เหมาะสำหรับคุณ

ทำไมมัน's ตัวเลือกยอดนิยม

หนังสือเล่มนี้เสนอแนวทางการเรียนรู้แบบเน้นโครงการที่ใช้งานได้จริง แต่ละบทของหนังสือมาพร้อมกับสมุดบันทึก Jupyter ช่วยให้คุณติดตามและทดลองใช้โค้ดด้วยตัวเองได้ หนังสือเล่มนี้เน้นที่โครงการและตัวอย่างในโลกแห่งความเป็นจริงที่คุณสามารถนำไปปรับใช้กับกรณีการใช้งานของคุณเองได้

คลังเก็บ GitHub ของ HandsOnLLM

Key Features

คู่มือหนังสือ:ปฏิบัติตามโครงสร้างหนังสือยอดนิยมของ O'Reilly ชื่อว่า “Hands-on Large Language Models” โดยตรง

โน้ตบุ๊ค Jupyter:จัดทำสมุดบันทึกแบบโต้ตอบสำหรับทุกบท ครอบคลุมหัวข้อต่างๆ เช่น โทเค็น การฝังตัว สถาปัตยกรรมหม้อแปลง และเทคนิคการปรับแต่งอย่างละเอียด

ตัวอย่างการปฏิบัติ:โค้ดนี้รองรับหลายภาษาและรันไทม์ รวมถึง หลาม, Java และ .NET ทำให้มีความยืดหยุ่นสูง

ใครควรใช้?

นักพัฒนาและนักวิทยาศาสตร์ข้อมูลที่ชอบการเรียนรู้แบบลงมือปฏิบัติจริงตามโครงการจะพบว่าคลังข้อมูลนี้มีประโยชน์อย่างยิ่ง นอกจากนี้ยังเป็นแหล่งข้อมูลที่ยอดเยี่ยมสำหรับใครก็ตามที่อ่านหนังสือ “Hands-on Large Language Models”

3. วิศวกรรมแจ้งเตือน

คู่มือ brexhq/prompt-engineering ถือเป็นขุมทรัพย์สำหรับการเชี่ยวชาญศิลปะและวิทยาศาสตร์ของ วิศวกรรมพรอมต์ในโลกของ LLM คุณภาพของผลงานของคุณมักถูกกำหนดโดยคุณภาพของข้อมูลที่คุณป้อน ทำให้ทักษะนี้มีความจำเป็นอย่างยิ่ง คลังข้อมูลนี้มีดาวเกือบ 9,000 ดวง และนำเสนอเคล็ดลับและกลยุทธ์ที่เป็นประโยชน์สำหรับการทำงานกับโมเดลเช่น GPT-4

ทำไมมัน's ตัวเลือกยอดนิยม

รวบรวมบทเรียนที่เรียนรู้จากการสร้างคำแนะนำสำหรับกรณีการใช้งานการผลิต ทำให้ใช้งานได้จริงอย่างมาก คลังข้อมูลได้รับการจัดระเบียบอย่างดีเป็นบทช่วยสอนที่ครอบคลุมทุกอย่างตั้งแต่หลักการพื้นฐานไปจนถึงเทคนิคขั้นสูง เช่น การกระตุ้นความคิดแบบโซ่ (CoT) และความสอดคล้องของตัวเอง

Key Features

คู่มือฉบับสมบูรณ์:ครอบคลุมประวัติศาสตร์วิศวกรรม กลยุทธ์ และคำแนะนำด้านความปลอดภัย

เทคนิคการปฏิบัติ:มุ่งเน้นที่การเพิ่มประสิทธิภาพคำเตือนสำหรับงานต่างๆ รวมถึงการสรุปและการเข้ารหัส

แนวคิดขั้นสูง:สำรวจหัวข้อขั้นสูง เช่น การกระตุ้นบทบาท การแยกย่อยงาน และความปลอดภัยในการกระตุ้น

ใครควรใช้?

ทุกคนที่โต้ตอบกับ LLM ไม่ว่าจะเป็นนักพัฒนาและนักวิจัย ผู้สร้างเนื้อหาและนักการตลาด จะได้รับประโยชน์จากคลังข้อมูลนี้ การเรียนรู้วิศวกรรมคำสั่งเป็นทักษะสำคัญในการใช้ประโยชน์สูงสุดจากแบบจำลองภาษาใดๆ

4. สุดยอด-LLM

ที่มาของภาพ: คลังข้อมูล Hannibal046/Awesome-LLM

คลังข้อมูล Hannibal046/Awesome-LLM เป็นรายการรวบรวมสิ่งต่างๆ ที่เกี่ยวข้องกับ Large Language Models ไว้ทั้งหมด ถือเป็นแผงควบคุมส่วนกลางสำหรับอัปเดตข้อมูลล่าสุดเกี่ยวกับระบบนิเวศ LLM เป็นแหล่งรวบรวมทรัพยากรที่มีชีวิตซึ่งชุมชนจะอัปเดตเป็นประจำ

ทำไมมัน's ตัวเลือกยอดนิยม

คลังข้อมูลนี้ช่วยให้คุณประหยัดเวลาในการค้นหาได้หลายชั่วโมงด้วยการรวบรวมทรัพยากรที่จำเป็นไว้ในที่เดียว ซึ่งรวมถึงเอกสารวิจัยที่สำคัญ กรอบการฝึกอบรม เครื่องมือการปรับใช้ และเกณฑ์มาตรฐานการประเมิน นอกจากนี้ยังมีกระดานผู้นำเพื่อติดตามประสิทธิภาพของหลักสูตร LLM ต่างๆ

Key Features

ทรัพยากรที่คัดสรรแล้ว:รายการเอกสาร เครื่องมือ บทช่วยสอน และหนังสือเกี่ยวกับ LLM อย่างครบถ้วน

หมวดหมู่ที่จัด:ทรัพยากรได้รับการจัดหมวดหมู่อย่างเรียบร้อยเป็นหัวข้อต่างๆ เช่น LLM แบบเปิด การฝึกอบรม LLM และแอปพลิเคชัน LLM

ขับเคลื่อนโดยชุมชน:อัปเดตเป็นประจำเพื่อรวมความก้าวหน้าล่าสุดในสาขา

ใครควรใช้?

หนังสือเล่มนี้เป็นหนังสือที่นักวิจัย นักศึกษา และผู้ประกอบวิชาชีพต้องมี หนังสือเล่มนี้เหมาะสำหรับผู้ที่ต้องการแหล่งข้อมูลด้าน LLM ที่มีคุณภาพสูง หนังสือเล่มนี้เหมาะสำหรับผู้ที่ต้องการค้นพบเครื่องมือใหม่ๆ และคอยติดตามข้อมูลเกี่ยวกับงานวิจัยล่าสุด

5. เครื่องมือม้านั่ง

ToolBench - ที่เก็บ GitHub

เมื่อ LLM กลายเป็นตัวแทนมากขึ้น ความสามารถในการใช้เครื่องมือภายนอกก็มีความสำคัญเพิ่มมากขึ้น คลังข้อมูล OpenBMB/ToolBench คือ แพลตฟอร์มโอเพ่นซอร์ส ออกแบบมาเพื่อฝึกอบรม ให้บริการ และประเมินผลหลักสูตรปริญญาโทสาขาบริหารธุรกิจ (LLM) สำหรับการเรียนรู้เครื่องมือ มีกรอบการทำงานและชุดข้อมูลการปรับแต่งคำสั่งขนาดใหญ่เพื่อเสริมความสามารถเหล่านี้

ทำไมมัน's ตัวเลือกยอดนิยม

ToolBench มุ่งเน้นไปที่ประเด็นสำคัญและกำลังเป็นกระแสของการพัฒนา LLM นั่นคือ การใช้เครื่องมือ ส่วนขยาย StableToolBench ช่วยเพิ่มประสิทธิภาพในส่วนนี้ด้วยการแนะนำฟีเจอร์ต่างๆ เช่น มิเรอร์เอพีไอซึ่งจำลองเหตุการณ์หลายพันครั้ง API จริงและใน ระบบ API เสมือนจริง เพื่อให้มั่นใจถึงความเสถียรและความสอดคล้องระหว่างการประเมิน

Key Features

โฟกัสการเรียนรู้เครื่องมือ:ได้รับการออกแบบมาโดยเฉพาะเพื่อเพิ่มความสามารถในการใช้เครื่องมือของ LLM

ชุดข้อมูลขนาดใหญ่:ประกอบด้วยชุดข้อมูลการปรับแต่งคำสั่งขนาดใหญ่เพื่อฝึกโมเดลอย่างมีประสิทธิภาพ

การประเมินผลที่มั่นคง:เวอร์ชัน StableToolBench นำเสนอกระบวนการประเมินสองขั้นตอนที่แข็งแกร่งโดยใช้ จีพีที-4 ในฐานะผู้ประเมินโดยใช้ตัวชี้วัดเช่นอัตราการผ่านที่สามารถแก้ไขได้ (SoPR)

ใครควรใช้?

นักวิจัยและนักพัฒนาที่สนใจในการสร้าง LLM แบบตัวแทนที่สามารถโต้ตอบกับ API ภายนอก และเครื่องมือต่างๆ จะพบว่า ToolBench มีคุณค่าอย่างยิ่ง เหมาะอย่างยิ่งสำหรับผู้ที่กำลังดำเนินการสร้างเครื่องมือที่มีความสามารถและเป็นอิสระมากขึ้น AI ตัวแทน.

6. พีเธีย

คลังข้อมูล EleutherAI/pythia ได้รับการพัฒนาโดย EleutherAI โดยเป็นชุดโมเดลที่ออกแบบมาเพื่อให้สามารถทำการวิจัยเกี่ยวกับการตีความ การเรียนรู้แบบไดนามิก และจริยธรรมได้ ซึ่งแตกต่างจากรุ่นโมเดลอื่นๆ ชุด Pythia ถูกสร้างขึ้นโดยมีเป้าหมายหลักอยู่ที่ความโปร่งใสและการวิจัยทางวิทยาศาสตร์

ทำไมมัน's ตัวเลือกยอดนิยม

Pythia มอบการเข้าถึงโอเพนซอร์สอย่างเต็มรูปแบบสำหรับจุดตรวจสอบโมเดล 16 จุดที่แตกต่างกัน ช่วยให้นักวิจัยสามารถศึกษาว่า LLM พัฒนาและวิวัฒนาการอย่างไรในระหว่างการฝึกอบรม ซึ่งถือเป็นสิ่งสำคัญสำหรับการทำความเข้าใจลักษณะ "กล่องดำ" ของโมเดลเหล่านี้ และสำหรับการวิจัยด้านต่างๆ เช่น กฎการปรับขนาดและจริยธรรมของโมเดล

Key Features

การวิจัยความสามารถในการตีความ:สร้างขึ้นโดยเฉพาะเพื่ออำนวยความสะดวกในการวิจัยพฤติกรรมและความโปร่งใสของโมเดล

จุดตรวจหลายจุด:ให้การเข้าถึงขนาดโมเดลและขั้นตอนการฝึกอบรมที่หลากหลาย พร้อมให้มุมมองรายละเอียดของกระบวนการเรียนรู้

โอเพนซอร์ส:โค้ดและโมเดลเปิดเผยต่อสาธารณะ ส่งเสริมการวิจัยและการทำงานร่วมกันที่ขับเคลื่อนโดยชุมชน

ใครควรใช้?

AI นักวิจัย นักจริยธรรม และนักศึกษาที่มุ่งเน้นด้านการตีความแบบจำลอง ความปลอดภัย และหลักการพื้นฐานของการฝึกอบรม LLM จะได้รับประโยชน์มากมายจากคลังข้อมูลนี้

7. รายชื่อเอกสารตัวแทน LLM

สำหรับผู้ที่ต้องการเจาะลึกด้านวิชาการ AI ตัวแทนWooooDyy/LLM-Agent-Paper-List เป็นแหล่งข้อมูลที่สำคัญ คลังข้อมูลนี้เป็นการรวบรวมเอกสารวิจัยที่คัดสรรมาอย่างดี ซึ่งสำรวจการพัฒนา แอปพลิเคชัน และการนำเอกสารไปใช้อย่างเป็นระบบ ตัวแทนตาม LLM.

ทำไมมัน's ตัวเลือกยอดนิยม

ทำหน้าที่เป็นห้องสมุดความรู้พื้นฐานสำหรับหนึ่งในสาขาที่น่าตื่นเต้นที่สุดใน AI วันนี้ แทนที่จะมีเพียงโค้ด รีโพนี้ให้พื้นฐานทางทฤษฎีที่คุณต้องการเพื่อทำความเข้าใจและสร้างรุ่นต่อไป AI ตัวแทน

Key Features

การวิจัยที่คัดสรรมา:รายการเอกสารสำคัญที่คัดสรรมาเป็นพิเศษเกี่ยวกับตัวแทน LLM

การจัดองค์กรอย่างเป็นระบบ:เอกสารเหล่านี้มีโครงสร้างเพื่อให้ภาพรวมที่ครอบคลุมของภูมิทัศน์การพัฒนาตัวแทน

ทรัพยากรพื้นฐาน:เหมาะอย่างยิ่งสำหรับการเรียนรู้แนวคิดสำคัญและความก้าวหน้าล่าสุดใน AI เชิงตัวแทน

ใครควรใช้?

ที่เก็บข้อมูลนี้มุ่งเป้าไปที่นักวิจัยในสถาบันการศึกษา นักศึกษาระดับปริญญาตรี และผู้ปฏิบัติงานขั้นสูงที่ต้องการสร้างงานวิจัยที่ล้ำสมัยในตัวแทนที่ใช้พื้นฐาน LLM

8. สุดยอดโมเดลภาษาขนาดใหญ่แบบมัลติโมดัล

LLMS ไม่ถูกจำกัดอยู่แค่ข้อความอีกต่อไป คลังข้อมูล BradyFU/Awesome-Multimodal-Large-Language-Models เป็นคอลเลกชันทรัพยากรที่คัดสรรมาอย่างดีซึ่งเน้นที่ความก้าวหน้าล่าสุดใน LLM แบบหลายรูปแบบ (MLLM) ซึ่งสามารถประมวลผลข้อมูลจากข้อความ รูปภาพ เสียง และวิดีโอ

ทำไมมัน's ตัวเลือกยอดนิยม

คลังข้อมูลนี้เป็นประตูสู่โลกของ MLLM ครอบคลุมหัวข้อต่างๆ มากมาย ตั้งแต่การปรับแต่งคำสั่งแบบหลายโหมดไปจนถึงการใช้เหตุผลแบบลำดับความคิดและเทคนิคการบรรเทาภาพหลอน นอกจากนี้ยังเชื่อมต่อกับโครงการ VITA ซึ่งเป็นแพลตฟอร์ม LLM แบบหลายโหมดโต้ตอบโอเพ่นซอร์สอีกด้วย

Key Features

โฟกัสแบบหลายโหมด:อุทิศให้กับทรัพยากรสำหรับ LLM ที่ต้องจัดการประเภทข้อมูลหลายประเภท

หลากหลายหัวข้อ:รวมถึงเอกสารและเครื่องมือเกี่ยวกับการปรับแต่งคำสั่ง การใช้เหตุผล และการบรรเทาภาพหลอน

นำเสนอใน VITA:เชื่อมโยงกับโครงการขนาดใหญ่เพื่อสร้าง MLLM แบบโต้ตอบ เพิ่มมิติเชิงปฏิบัติ

ใครควรใช้?

นักพัฒนาและนักวิจัยที่สนใจในการสร้างแอปพลิเคชันที่เหนือกว่าข้อความ เช่น คำบรรยายภาพ การวิเคราะห์วิดีโอ หรือผู้ช่วยที่ควบคุมด้วยเสียง จะพบว่าคอลเลกชั่นนี้มีประโยชน์อย่างยิ่ง

9. ความเร็วลึก

microsoft/DeepSpeed พัฒนาโดย Microsoft เป็นไลบรารีเพิ่มประสิทธิภาพการเรียนรู้เชิงลึกที่ช่วยให้การฝึกอบรมและการอนุมานแบบกระจายเป็นเรื่องง่ายและมีประสิทธิภาพ สามารถผสานรวมเข้ากับ ไพทอร์ช และมีส่วนช่วยในการฝึกอบรมบางส่วนของโลก's แบบจำลองที่ใหญ่ที่สุด รวมถึงแบบจำลองเมกะทรอน-ทัวริงที่มีพารามิเตอร์ 530 พันล้าน

ดีพสปีด ไมโครซอฟต์

ทำไมมัน's ตัวเลือกยอดนิยม

DeepSpeed ให้ความสำคัญกับการปรับขนาดและประสิทธิภาพ โดยนำเสนอนวัตกรรมระดับระบบที่ช่วยให้คุณฝึกโมเดลขนาดใหญ่ที่มีพารามิเตอร์นับพันล้านบนฮาร์ดแวร์ที่มีข้อจำกัด คุณสมบัติต่างๆ ของ DeepSpeed ถือเป็นสิ่งสำคัญสำหรับทุกคนที่จริงจังกับการฝึก LLM ที่ทันสมัยตั้งแต่เริ่มต้นหรือปรับแต่ง LLM ขนาดใหญ่

Key Features

การฝึกอบรมขนาดใหญ่:ช่วยให้สามารถฝึกอบรมโมเดลที่มีพารามิเตอร์มากกว่าหนึ่งล้านล้านรายการได้ด้วยเทคนิคต่างๆ เช่น ZeRO (Zero Redundancy Optimizer)

การรวม PyTorch:ทำงานได้อย่างราบรื่นกับ PyTorch ซึ่งเป็นเฟรมเวิร์กการเรียนรู้เชิงลึกที่ได้รับความนิยม

บันทึกการติดตามที่พิสูจน์แล้ว:ใช้เพื่อฝึกโมเดลขนาดใหญ่จำนวนมาก รวมถึง YaLM (100B) และ Jurassic-1 (178B)

การสนับสนุนของ Windows:มีเครื่องมือแก้ไขกราฟิกที่ช่วยลดความยุ่งยากในการสร้างและติดตั้ง DeepSpeed บนระบบ Windows

ใครควรใช้?

นี่คือเครื่องมือสำหรับผู้ปฏิบัติงานที่จริงจัง นักวิทยาศาสตร์ข้อมูล และนักวิจัยที่ต้องการฝึกอบรมหรือปรับแต่งโมเดลภาษาขนาดใหญ่ หากคุณกำลังประสบปัญหาหน่วยความจำไม่เพียงพอกับการตั้งค่าปัจจุบัน DeepSpeed คือโซลูชัน

10. ลามะ.cpp

ที่เก็บ ggml-org/llama.cpp เป็นตัวเปลี่ยนเกมสำหรับการรัน LLM บนฮาร์ดแวร์ของผู้บริโภค's ไลบรารี C/C++ ประสิทธิภาพสูงสำหรับการรันการอนุมานบนเครื่องท้องถิ่น รวมถึงเดสก์ท็อปและแม้แต่อุปกรณ์พกพา's สร้างขึ้นบนไลบรารีเทนเซอร์ GGML และมีชื่อเสียงในเรื่องประสิทธิภาพและการตั้งค่าขั้นต่ำ

สัตว์สี่เท้าชนิดหนึ่ง

ทำไมมัน's ตัวเลือกยอดนิยม

llama.cpp ทำให้ LLM ที่ทรงพลังเข้าถึงได้สำหรับทุกคน คุณไม่จำเป็นต้องมีคลัสเตอร์ GPU บนคลาวด์ขนาดใหญ่เพื่อทดลองใช้โมเดลเช่น ลามะ 3มิสทรัล หรือ GPT-2 การมุ่งเน้นที่ประสิทธิภาพของ CPU และอุปกรณ์เอดจ์ทำให้การใช้งาน LLM แพร่หลายมากขึ้น คุณสามารถตั้งค่าเซิร์ฟเวอร์ภายในเครื่องได้ด้วยคำสั่งเพียงไม่กี่คำสั่ง และเริ่มโต้ตอบกับโมเดลต่างๆ ได้

Key Features

การอนุมานประสิทธิภาพสูง:ได้รับการปรับให้เหมาะสมสำหรับการรัน LLM บน CPU และฮาร์ดแวร์หลากหลายประเภท

การรองรับโมเดลกว้าง:รองรับโมเดลยอดนิยมมากมาย รวมถึงตระกูล Llama, Mistral และ BERT

ปริมาณ:รองรับการวัดปริมาณโมเดลโดยธรรมชาติ ช่วยให้สามารถรันโมเดลขนาดใหญ่บนอุปกรณ์ที่มีหน่วยความจำจำกัดได้

การติดตั้งน้อยที่สุด:ได้รับการออกแบบมาให้คอมไพล์และใช้งานได้ง่ายบนแพลตฟอร์มต่างๆ รวมถึง macOS, Linux และ Windows

ใครควรใช้?

นักพัฒนา ผู้ที่ชื่นชอบ และนักวิจัยที่ต้องการรันและทดลองใช้ LLM ในเครื่องโดยไม่ต้องพึ่งพาบริการคลาวด์ราคาแพง's ยังเหมาะสำหรับการสร้างบนอุปกรณ์อีกด้วย AI การใช้งาน ที่ให้ความสำคัญกับความเป็นส่วนตัวและความหน่วงต่ำ

11. PaLM-rlhf-ไพทอร์ช

การเรียนรู้แบบเสริมแรงด้วยคำติชมจากมนุษย์ (RLHF) ถือเป็นสูตรลับเบื้องหลังความสามารถในการสนทนาที่น่าประทับใจของโมเดลต่างๆ เช่น ChatGPT คลังข้อมูล lucidrains/PaLM-rlhf-pytorch นำเสนอการใช้งาน RLHF แบบโอเพนซอร์สที่นำไปใช้กับ Google's สถาปัตยกรรม PaLM

ทำไมมัน's ตัวเลือกยอดนิยม

ที่เก็บข้อมูลนี้ช่วยไขข้อข้องใจเกี่ยวกับเทคนิคที่สำคัญที่สุดอย่างหนึ่งในการพัฒนา LLM สมัยใหม่ โดยมีเป้าหมายเพื่อจำลองฟังก์ชันการทำงานของ ChatGPT โดยใช้ แบบจำลอง PaLMโดยให้ตัวอย่างที่เป็นรูปธรรมว่าสามารถนำ RLHF ไปใช้งานได้อย่างไร คุณสามารถโหลดโมเดลที่ฝึกอบรมไว้ล่วงหน้าหรือปรับแต่งให้เหมาะกับความต้องการของคุณเองได้

Key Features

การนำ RLHF ไปใช้งาน:มอบการใช้งาน Reinforcement Learning ด้วยข้อเสนอแนะของมนุษย์แบบโอเพ่นซอร์สที่ชัดเจน

อ้างอิงจาก PaLM:นำเทคนิคนี้ไปใช้กับสถาปัตยกรรม PaLM อันทรงพลัง

คุณค่าทางการศึกษา:ช่วยให้ผู้ใช้เข้าใจกลไกเบื้องหลังการฝึกอบรมที่เป็นประโยชน์และไม่เป็นอันตราย AI ผู้ช่วย

ใครควรใช้?

คลังข้อมูลนี้มีไว้สำหรับนักวิจัยและนักพัฒนาที่สนใจในกระบวนการปรับแต่งโดยเฉพาะผู้ที่ต้องการทำความเข้าใจและนำ RLHF ไปใช้เพื่อให้ LLM สอดคล้องกับความต้องการของมนุษย์

12. นาโนจีพีที

karpathy/nanoGPT สร้างขึ้นโดย Andrej Karpathy ผู้เป็นตำนาน นับเป็นคลังข้อมูลที่เรียบง่ายและรวดเร็วที่สุดสำหรับการฝึกและปรับแต่ง GPT ขนาดกลาง ฐานโค้ดของ karpathy/nanoGPT ได้รับการออกแบบมาให้กระชับ โดยมีลูปการฝึกหลักอยู่ใน train.py และคำจำกัดความของโมเดลอยู่ใน model.py

ทำไมมัน's ตัวเลือกยอดนิยม

nanoGPT ให้ความสำคัญกับความเรียบง่ายและคุณค่าทางการศึกษา โดยขจัดความซับซ้อนทั้งหมดของไลบรารีขนาดใหญ่ ช่วยให้คุณเข้าใจสถาปัตยกรรมของทรานสฟอร์มเมอร์ตั้งแต่พื้นฐาน แม้ว่าจะเรียบง่าย แต่ก็'s มีประสิทธิภาพเพียงพอที่จะสร้างผลลัพธ์ระดับ GPT-2 ได้ และได้เป็นแรงบันดาลใจให้กับโครงการเรียบง่ายอื่นๆ เช่น nanoVLM สำหรับโมเดลภาษาวิสัยทัศน์

นาโนจีพีที

Key Features

โค้ดเบสแบบมินิมอล:ตั้งใจให้เรียบง่ายและอ่านง่าย จึงเหมาะสำหรับการเรียนรู้

มีประสิทธิภาพสูง :ใช้ประโยชน์จากคุณลักษณะ PyTorch 2.0 เพื่อการฝึกอบรมที่มีประสิทธิภาพ

มุ่งเน้นการศึกษา:เครื่องมือที่ยอดเยี่ยมสำหรับการทำความเข้าใจว่าโมเดล GPT ถูกสร้างและฝึกอบรมอย่างไร

การทำสำเนาได้:รวมถึงสคริปต์เพื่อสร้างผลลัพธ์บนชุดข้อมูลมาตรฐานเช่น OpenWebText

ใครควรใช้?

nanoGPT เหมาะอย่างยิ่งสำหรับนักเรียน นักการศึกษา และนักพัฒนาที่ต้องการความเข้าใจพื้นฐานที่ลึกซึ้งเกี่ยวกับสถาปัตยกรรม GPT หากคุณเบื่อหน่ายกับ... ห้องสมุดกล่องดำ และต้องการดูว่าสิ่งต่างๆ ทำงานอย่างไรจริงๆ นี่คือที่เก็บข้อมูลสำหรับคุณ

ของคุณ การเดินทาง LLM เริ่มต้นด้วยคลังข้อมูล GitHub ที่จำเป็นเหล่านี้

ความแตกต่างระหว่างการฝันถึงปริญญา LLM กับการสร้างปริญญา LLM ขึ้นมาจริงๆ คืออะไร? ที่เก็บข้อมูล GitHub ทั้ง 12 นี้ ในขณะที่คนอื่นถกเถียงกันเรื่องทฤษฎี ตอนนี้คุณมีสิทธิ์เข้าถึงโค้ดที่ขับเคลื่อนในปัจจุบันโดยตรงแล้ว's ทันสมัยที่สุด โมเดลภาษา.

ข้อได้เปรียบในการแข่งขันของคุณกำลังรอคุณอยู่:

โคลน nanoGPT เพื่อเข้าใจพื้นฐานของหม้อแปลง
ฟอร์ก llama.cpp สำหรับการปรับใช้แบบจำลองในพื้นที่
หลักสูตรสตาร์ ล.ม. สำหรับเส้นทางการเรียนรู้ที่มีโครงสร้าง
ร่วมสนับสนุน DeepSpeed และเข้าร่วมกับ Microsoft's ความพยายามในการเพิ่มประสิทธิภาพ

สาขา LLM ก้าวหน้าอย่างรวดเร็ว—นักพัฒนา ใครเชี่ยวชาญคลังข้อมูลเหล่านี้วันนี้จะกลายเป็นพรุ่งนี้'s AI สถาปนิก เลือกคลังข้อมูล 3 อันดับแรกของคุณ ตั้งค่าสภาพแวดล้อมการพัฒนาของคุณ และเริ่มทดลองได้เลย ทุกการคอมมิต ทุกการดึงคำขอ และทุกโมเดลที่คุณฝึกฝน จะช่วยให้คุณเข้าใกล้ความเชี่ยวชาญ LLM มากขึ้น

รหัสเปิดแล้ว ชุมชนยินดีต้อนรับ ความเชี่ยวชาญด้าน LLM ของคุณเริ่มต้นได้แล้ววันนี้

ที่เก็บ GitHub, คลังข้อมูล LLM

อ่านเพิ่มเติม

โฆษณาคลิกเพื่อเข้าชม 6 อันดับแรก AI แพลตฟอร์ม: วางลิงก์ รับโฆษณา

ที่ดีที่สุดของ

โฆษณาคลิกเพื่อเข้าชม 6 อันดับแรก AI แพลตฟอร์ม: วางลิงก์ รับโฆษณา

1 สัปดาห์ที่ผ่านมา

0 34

7 เครื่องมือสร้างวิดีโอคุณภาพระดับภาพยนตร์ที่ดีที่สุด: กล้อง, การเคลื่อนไหว, AI

ที่ดีที่สุดของ

7 เครื่องมือสร้างวิดีโอคุณภาพระดับภาพยนตร์ที่ดีที่สุด: กล้อง, การเคลื่อนไหว, AI

1 สัปดาห์ที่ผ่านมา

0 37

สูงสุด 6 AI เครื่องมือ VFX สำหรับเทคนิคพิเศษด้านภาพยุคใหม่ (2026)

ที่ดีที่สุดของ

สูงสุด 6 AI เครื่องมือ VFX สำหรับเทคนิคพิเศษด้านภาพยุคใหม่ (2026)

1 สัปดาห์ที่ผ่านมา

0 32

เขียนความเห็น ยกเลิกการตอบ

ไซต์นี้ใช้ Akismet เพื่อลดสแปม เรียนรู้วิธีการประมวลผลข้อมูลความคิดเห็นของคุณ

ได้รับความนิยม AI เครื่องมือ

แชทจานิเตอร์

หันของคุณ AI ความหลงใหลในการเล่นบทบาทสมมติเพื่อรับรางวัล USDT จริง ๆ ขณะสนทนากับตัวละครที่สม่ำเสมอที่สุด AI บนเว็บ ภารโรง AI เพิ่งได้รับการปรับโฉมใหม่ พบกับ Chat Janitor ได้เลย

สวอปซี่ AI

สร้างวิดีโอสลับภาพสไตล์ดีพเฟคได้ในไม่กี่นาที โดยไม่จำเป็นต้องมีทักษะการตัดต่อ AI การสลับใบหน้าสำหรับวิดีโอที่มีความละเอียดสูงสุด 4K

ชาแรกซ์ไอ

แพลตฟอร์มเดียวสำหรับทุกสิ่งของคุณ AI แชทกับแฟนสาว, สวมบทบาทแบบ NSFW และจินตนาการเกี่ยวกับเพื่อนเสมือนจริง เครื่องออลอินวัน AI แชทเรื่องเพศและ AI เกมจำลองแฟนสาวที่เล่นได้จริง

รวดเร็วUndressสุทธิ.

หมดปัญหาเรื่องการคาดเดา อัปโหลด คลิก เสร็จเรียบร้อย ที่เร็วที่สุด AI undress และมีโปรแกรมสร้างภาพที่ไม่เหมาะสม (NSFW) ในเกมตอนนี้ด้วย