logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大语言模型的训练技巧

批量大小指的是在每个训练步骤(epoch)中同时处理的样本数量。在大语言模型中,由于模型规模庞大,批量大小通常会较大。

文章图片
#语言模型#人工智能#自然语言处理 +1
大模型瘦身秘籍:量化与蒸馏技术详解,助你降低90%部署成本

文章介绍了大模型压缩的两大主流技术:量化(降低参数精度减少存储空间)和蒸馏(训练小模型模仿大模型行为)。量化技术实施简单、压缩效果明显,而蒸馏能获得全新小模型、灵活性更高。这些技术能在保持模型性能的同时显著降低部署成本,让AI技术更加平民化,对开发者部署和设计AI应用具有重要意义。

文章图片
#人工智能
大模型瘦身秘籍:量化与蒸馏技术详解,助你降低90%部署成本

文章介绍了大模型压缩的两大主流技术:量化(降低参数精度减少存储空间)和蒸馏(训练小模型模仿大模型行为)。量化技术实施简单、压缩效果明显,而蒸馏能获得全新小模型、灵活性更高。这些技术能在保持模型性能的同时显著降低部署成本,让AI技术更加平民化,对开发者部署和设计AI应用具有重要意义。

文章图片
#人工智能
大模型Agent开发教程:收藏级指南助你快速上手,从工作流到自主智能体全面解析

本文介绍了大模型Agent开发的演变过程,包括通过提示词使大模型输出格式化内容融入程序,工作流的基本概念,MCP协议如何扩展模型能力,以及Dify、Coze等工作流平台。重点阐述了Agent的核心特点——自主性,包含Profile、Memory、Planning、Action四个组成部分,能够主动思考并调用工具解决问题,实现了类似人类的任务处理流程。

文章图片
#人工智能#RAG
大模型Agent开发教程:收藏级指南助你快速上手,从工作流到自主智能体全面解析

本文介绍了大模型Agent开发的演变过程,包括通过提示词使大模型输出格式化内容融入程序,工作流的基本概念,MCP协议如何扩展模型能力,以及Dify、Coze等工作流平台。重点阐述了Agent的核心特点——自主性,包含Profile、Memory、Planning、Action四个组成部分,能够主动思考并调用工具解决问题,实现了类似人类的任务处理流程。

文章图片
#人工智能#RAG
终于弄懂了!人工智能、深度学习、大模型的概念及联系

人工智能是指通过模拟、延伸人类智能的机制,使机器能够执行需要智力的任务。这包括理解语言、学习、推理、问题解决等能力。人工智能系统通过算法和模型从大量数据中学习,并能够做出智能决策。人工智能的核心在于算法和模型,这些算法和模型能够处理、分析和解释数据,以模拟人类的智能行为。通过不断的学习和优化,人工智能系统能够逐渐提升其性能,以更好地完成各种任务。概念:机器学习是人工智能的一个重要分支,其核心思想是

文章图片
#人工智能#深度学习#语言模型 +3
从零开始实战:基于Dify平台的目标检测模型训练与业务落地全流程解析

本文基于Dify智能体开发平台,详细介绍了目标检测小模型从训练到业务落地的全流程。通过配置数据录入、上传样本、标注目标位置、训练模型等步骤,开发出能够识别"黄鹤楼"和"万宝路"盒子的智能体。文章展示了如何搭建HTTP节点调用模型,并通过LLM节点汇总检测结果,最终实现了图片中目标物品的自动识别与计数,验证了目标检测技术在实际业务中的应用价值。

文章图片
#人工智能
从零开始实战:基于Dify平台的目标检测模型训练与业务落地全流程解析

本文基于Dify智能体开发平台,详细介绍了目标检测小模型从训练到业务落地的全流程。通过配置数据录入、上传样本、标注目标位置、训练模型等步骤,开发出能够识别"黄鹤楼"和"万宝路"盒子的智能体。文章展示了如何搭建HTTP节点调用模型,并通过LLM节点汇总检测结果,最终实现了图片中目标物品的自动识别与计数,验证了目标检测技术在实际业务中的应用价值。

文章图片
#人工智能
程序员必备:本地大模型部署与调用实战教程

文章介绍了在本地环境部署大语言模型的解决方案,重点讲解了Ollama工具的使用方法,包括命令行调用、HTTP API调用和SDK调用三种方式。作者通过测试多个本地模型在JSON输出方面的表现,发现deepseek-r1:14b表现最佳。文章指出,本地部署可根据硬件条件选择不同参数量的模型,8B参数量模型已能实现不错的业务功能,为数据敏感场景提供了可行方案。

文章图片
#人工智能
程序员必备:本地大模型部署与调用实战教程

文章介绍了在本地环境部署大语言模型的解决方案,重点讲解了Ollama工具的使用方法,包括命令行调用、HTTP API调用和SDK调用三种方式。作者通过测试多个本地模型在JSON输出方面的表现,发现deepseek-r1:14b表现最佳。文章指出,本地部署可根据硬件条件选择不同参数量的模型,8B参数量模型已能实现不错的业务功能,为数据敏感场景提供了可行方案。

文章图片
#人工智能
    共 833 条
  • 1
  • 2
  • 3
  • 84
  • 请选择