MiniCPM
- AIGCLINK
- 2024-09-08 08:27:36
面壁智能开源了其面壁小钢炮3.0(MiniCPM 3.0)!性能超GPT-3.5,无限长文本超Kimi
特点:
1、MiniCPM 3.0,4B 参数,在自然语言理解、知识、代码、数学等能力上赶超GPT-3.5,在 Qwen2-7B、 Phi-3.5、GLM4-9B、LLaMa3-8B 等一众中外知名模型脱颖而出
2、与1.0/2.0比,MiniCPM3-4B 有更强大、更通用的技能集,可以实现更广泛的应用,支持函数调用和代码解释器
3、32k上下文窗口, 配备 LLMxMapReduce,理论上可以处理无限的上下文,而无需占用大量内存
长文本方向:无限长文本,榜单性能超Kimi,超长文本也不崩
Function Calling方向:性能比肩 GPT-4o ,端侧最强
RAG 方向:超强 RAG 外挂三件套,中文检索第一、生成超Llama3-8B
github:LLMMiniCPM
特点:
1、MiniCPM 3.0,4B 参数,在自然语言理解、知识、代码、数学等能力上赶超GPT-3.5,在 Qwen2-7B、 Phi-3.5、GLM4-9B、LLaMa3-8B 等一众中外知名模型脱颖而出
2、与1.0/2.0比,MiniCPM3-4B 有更强大、更通用的技能集,可以实现更广泛的应用,支持函数调用和代码解释器
3、32k上下文窗口, 配备 LLMxMapReduce,理论上可以处理无限的上下文,而无需占用大量内存
长文本方向:无限长文本,榜单性能超Kimi,超长文本也不崩
Function Calling方向:性能比肩 GPT-4o ,端侧最强
RAG 方向:超强 RAG 外挂三件套,中文检索第一、生成超Llama3-8B
github:LLMMiniCPM