minimind,可以自己训练的大模型】3小时完全从0训练一个仅有26M的小参数GPT,最低仅需2G显卡即可推理训练!
• 本开源项目旨在完全从0开始,最快仅用3小时!即可训练出仅为26M大小的微型语言模型MiniMind。
• MiniMind极其轻量,体积约是 GPT3 的 1/7000,力求做到最普通的个人GPU也可快速推理甚至训练。
•MiniMind改进自DeepSeek-V2、Llama3结构,项目包含整个数据处理、pretrain、sft、dpo的全部阶段,包含混合专家(MoE)模型。
• 这是一个既是开源项目,又是入门LLM教程,同时也是一个初具雏形的开源模型,希望能起到抛砖引玉的作用。
项目地址:github.com/jingyaogong/minimind
Prev Chapter:ChatGPT流量骤降是谣言,但OpenAI确实危险了
Next Chapter:追了2年,为何中美AI还有3代差距?院士重申:日本俄罗斯连影儿都找不着
Beastmaster of the Ages Chapter 1592 - World of Sorrow
2024-11-19Spirit Vessel Chapter 179: Pagodas Hundreds List
2024-11-21Versatile Mage Chapter 725 - The Avengers!
2024-11-19