Agent Skills Small Language Models Industrial Applications Task Accuracy Context Engineering
摘要

Agent技能框架目前已由GitHub Copilot、LangChain和OpenAI等主流平台广泛支持,在提升上下文工程、减少幻觉和提高任务准确性方面表现优异。本文研究该框架是否对小型语言模型(SLMs)具有类似优势,尤其关注工业场景中因数据安全和预算限制而难以依赖公共API的情况。研究引入了Agent技能过程的数学定义,并通过多个使用案例系统评估了不同规模的语言模型。结果表明,微型模型在技能选择上存在困难,而中等规模的SLMs(约12B-30B参数)能显著受益于Agent技能方法;80B参数的代码专用模型则表现出与封闭源基线相当的性能,同时提升了GPU效率。这些发现为Agent技能框架的能力与限制提供了全面且细致的描述,并为在以SLM为中心的环境中有效部署Agent技能提供了实用见解。

AI 推荐理由

论文聚焦于Agent Skill框架,探讨其在小语言模型中的应用与效果,直接涉及技能学习与工具调用的核心内容。

论文信息
作者 Yangjie Xu, Lujun Li, Lama Sleem, Niccolo Gentile, Yewei Song et al.
发布日期 2026-02-18
arXiv ID 2602.16653
相关性评分 9/10 (高度相关)