SUSE 改进并发布开源 LLM 以促进社区协作
2025年6月24日 | Douglas DeMaio | CC-BY-SA-3.0
今天,SUSE 发布了经过微调的新版本语言模型,Cavil-Qwen3-4B,并以开源形式在 openSUSE 的 Hugging Face 上发布,旨在使法律合规自动化更容易为开源生态系统中的开发者所用。
该版本基于优秀的 Qwen3-4B 基础模型,并使用 LoRA 适配器(低秩适应)来检测代码和文档中的法律相关文本,例如许可声明。该模型源自 openSUSE 的合规工具 Cavil,它提供透明且协作的开源法律工具。
4B 参数的模型大小在性能和可部署性之间提供了很好的平衡,因为它提供了强大的语言理解能力,并且与消费级 GPU 兼容。所有 Qwen3 变体均使用 OSI 批准的 Apache 2.0 许可,只要满足许可要求,即可允许商业用途和重新分发。
“该模型将企业级的法律分类带给更广泛的开发者社区,”项目贡献者 Sebastian Riedel 说道。“它是任何希望在不使用大型基础设施的情况下领先于合规风险的项目的一个实用工具。”
该项目的方法使用 15 万个样本的数据集和 Alpaca 指令格式来训练模型,以识别许可标头和类似的法律文本。在多个开源模型上进行评估后,Cavil-Qwen3-4B 表现出高精度,并具有量化选项,可在较小的设备上高效使用。
用于创建该模型的数据集和验证工具也将通过 Hugging Face 提供,以便研究人员和开发者可以重现和扩展这项工作。
团队欢迎持续的反馈和贡献。鼓励开发者使用该模型和 Hugging Face 分享见解、建议的改进或参与其中。 huggingface.co/openSUSE。开发者也可以在 openSUSE Factory 邮件列表 上找到我们。