面壁智能发布新一代端侧大模型 MiniCPM 3.0

面壁智能推出开源 MiniCPM3 – 4B AI 模型。MiniCPM3 – 4B 是 MiniCPM 系列第三代产品,性能超过 Phi – 3.5 – mini – Instruct 和 GPT – 3.5 – Turbo – 0125,媲美多款 70 亿 – 90 亿参数的 AI 模型。相比前两代,MiniCPM3 – 4B 有更强大、更多用途的技能集,支持函数调用和代码解释器。

文中介绍了 MiniCPM1.0/2.0/3.0 三个版本在词表大小、模型层数、隐藏层节点、最大长度、系统提示词、工具调用和代码解释器等方面的区别。MiniCPM3 – 4B 有 32k 上下文窗口,借助 LLMxMapReduce 可处理理论上的无限上下文。面壁智能还发布了 RAG 套件 MiniCPM – Embedding 模型、MiniCPM – Reranker 模型以及针对 RAG 场景的微调版 MiniCPM3 – RAG – LoRA 模型。

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
有新私信 私信列表
搜索

亲爱的同学, AISCK不支持网页右键喔!

你可以鼠标左键选择内容后,按Ctrl+C复制

嗨! 我是AI助手Ceres