
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Harness Engineering(驾驭工程) | 菜鸟教程Harness Enginnering翻译过来就是【驾驭工程。我们可以把大模型比作一匹马,那如果我们要更好的去驾驭,就需要通过“马具”来进行约束。Harness Engineering(驾驭工程)是围绕 AI 智能体设计和构建约束机制、反馈回路、工作流控制和持续改进循环的系统工程实践。它不优化模型本身,而是优化模型运行的环境。人类掌舵

Harness Engineering(驾驭工程) | 菜鸟教程Harness Enginnering翻译过来就是【驾驭工程。我们可以把大模型比作一匹马,那如果我们要更好的去驾驭,就需要通过“马具”来进行约束。Harness Engineering(驾驭工程)是围绕 AI 智能体设计和构建约束机制、反馈回路、工作流控制和持续改进循环的系统工程实践。它不优化模型本身,而是优化模型运行的环境。人类掌舵

本文主要介绍dify和Ollama进行关联,之后通过dify结合Deepseek做一些任务执行。

模型量化是工业界最成熟、最通用的模型压缩技术,尤其 INT8 推理已成为边缘部署的首选标准。

OpenCompass简介评估数据指标是书生·浦语的生态链中用于数据评估的工具,目前适合做一些“客观评估”。主流方向是一个为了评估大语言模型(Large Language Models, LLMs)以及视觉语言模型(Vision-Language Models, VLMs)的性能而设计的开源平台研发团队OpenCompass 是上海人工智能实验室(Shanghai AI Laboratory)主导

知识蒸馏将大模型的智慧精华高效提炼至轻量化小模型,实现成本降低20倍、推理提速3倍、边缘端无损部署,推动AI民主化与产业普惠落地。

知识蒸馏技术为AI模型的实际部署开辟了新道路。通过本文的实战演示,我们实现了:将1.5B Qwen模型的知识有效迁移到0.5B模型保持小模型效率的同时获得接近大模型的性能提供完整的PyTorch实现方案知识蒸馏的本质是智慧的传承——它让大模型的深邃思考能被小模型理解和吸收,最终实现"小身材,大智慧"的完美平衡。"好的老师不是灌输知识,而是点燃火焰。" —— 苏格拉底在AI领域,知识蒸馏正是点燃小模

微调量化与导出量化,是LLM生命周期中不同阶段的“瘦身术”。前者是训练时的智慧妥协,让大模型在有限资源下也能“学有所成”;后者是部署前的必要精简,让模型能以高效、经济的姿态服务用户。理解两者本质区别——参数是否动态学习——是驾驭量化技术、最大化模型价值的关键。在资源受限的世界里,善用量化,方能释放大模型的真正潜力。

欠拟合是学得太少,模型理解不了规律;过拟合是学得太死,模型无法泛化;正常拟合是我们追求的目标——学习到通用规律,适用于未知数据。机器学习建模的真正挑战,不是模型越强越好,而是找到那个既能学到知识、又不过度记忆的平衡点。

在严重类别不平衡下,准确率高 ≠ 模型好。我们需要真正让模型“看到”少数类,并能有效识别它们,才能解决实际问题。








