Mistral Small 4 是 Mistral AI 的新__混合模型__,融合了 Magistral 的__推理__、Pixtral 的__多模态__和 Devstral 的__代码代理__能力。__专家混合__架构有 128 个专家,每个 token 4 个活跃,总共 119 亿参数,活跃 60 亿。根据__Apache 2.0 许可证__分发,可通过 Mistral API、La Plateforme 和 Le Chat 集成,为对话助手和__自主开发者代理__供能。
什么是 Mistral Small 4?
Mistral Small 4 是由 Mistral AI 设计的开源混合语言模型。其架构基于具有 128 个专家的专家混合,每个 token 激活 4 个,总共 119 亿参数,但推理时只有 60 亿是活跃的。这种方法在不牺牲模型深度的情况下带来了重大的能源效率和经济效率。该模型原生接受文本和图像输入,支持可配置的推理努力,在代理和代码任务上特别出色。Apache 2.0 许可证授权下载、修改和部署,包括商业使用。
主要功能
Mistral Small 4 结合了几项技术进步。其专家混合架构允许扩展总参数数量而不惩罚推理成本,使模型可以在合理大小的基础设施上部署。原生多模态能力消除了对额外视觉模型的需求来同时处理文本和图像。可配置的推理努力允许根据用例在速度和分析深度之间权衡。代码代理任务的专业化,继承自 Devstral,使其成为开发者副驾驶和自主代理的卓越引擎。该模型可通过 Mistral 的 Le Chat、La Plateforme 和官方 API 获得,但也可下载用于本地部署。Mistral AI 作为创始成员加入了 NVIDIA Nemotron Coalition,这保护了围绕模型的 GPU 优化生态系统。
使用案例
Mistral Small 4 的用途涵盖广泛的范围。开发者将其集成到代码副驾驶和能够执行复杂技术任务的自主代理中。数据科学团队将其用于结构化推理、文档分析和大型语料库上的信息提取。客户服务部署对话助手,能够由于多模态理解而理解截图或扫描文档。主权国家,特别是在公共、金融或医疗卫生部门,采用它以受益于开放许可证下可本地部署的 AI。初创公司在 Mistral API 层上构建其产品,以结合受控成本和模型质量。研究人员欣赏模型的可访问性,以评估新的对齐、微调和量化方法。
优势
Mistral Small 4 的主要优势在于将三个模型系列融合为一个。这种统一简化了 AI 应用的架构,���除了在专业模型之间路由的需求。Apache 2.0 许可证为不想依赖专有 API 的组织带来了重大的战略独立性。MoE 架构的效率允许考虑受控成本的部署,同时获得高质量。Mistral 生态系统的成熟性,包括其 Plateforme、API 和 Le Chat,根据技术水平为团队提供多个入口点。最后,模型的欧洲来源对关心 GDPR 合规性和数字主权的参与者构成决定性论证。
定价
Mistral Small 4 根据 Apache 2.0 许可证免费提供下载,这允许本地部署而无需许可成本。通过 Mistral API 的访问根据消费的 token 数量按使用情况计费,价格有竞争力,与模型效率战略一致。Mistral 的 Le Chat 提供免费访问和配额来测试模型能力,以及用于密集使用的付费计划。La Plateforme 为专业团队集成监控和微调工具。总的来说,Mistral Small 4 提供了极好的定价灵活性,从免费本地部署到无服务器 API 使用,再到企业组织高容量计划。
结论
Mistral Small 4 确认了 Mistral AI 提出开源、高效和技术上差异化的模型的能力。其多模态多功能性和可配置的推理努力使其成为许多用例的相关选择,从开发者副驾驶到多模态助手。Apache 2.0 许可证和本地部署能力将特别吸引欧洲参与者和主权组织。对于寻求灵活、高效和独立于美国巨头的模型的技术团队来说,Mistral Small 4 是开源 AI 景观中的主要参考。