排序
Happy-LLM:从零开始的大语言模型原理与实践教程(Datawhale开源项目)
Datawhale 推出的《Happy-LLM》是一个旨在帮助学习者深入理解大语言模型(LLM)原理和训练过程的开源教程项目。该教程从 NLP 的基础概念出发,逐步深入到 LLM 的架构基础和训练过程,并结合主流...
MiniMax M1:百万Token上下文、混合注意力,新一代大语言模型横空出世!
各位小伙伴,今天给大家介绍一款超强的大语言模型——MiniMax M1!它可是全球首个开放权重的大规模混合注意力推理模型哦!是不是听起来就很厉害?别急,更厉害的还在后面呢! **M1的强大之处:...