logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

模型优化与部署:量化、蒸馏与 ONNX

深度学习模型部署与优化核心技术摘要 将训练好的模型部署到生产环境面临三大挑战:模型体积大、推理速度慢、框架不兼容。本文系统介绍了三种关键技术: 量化:将模型从FP32转为INT8,体积缩小4倍,推理速度提升2-4倍,精度损失通常低于1%。 知识蒸馏:通过大模型(Teacher)指导小模型(Student),在参数量减少的情况下保持较高准确率。 ONNX导出:作为跨框架中间格式,支持PyTorch/

#深度学习#人工智能#开发语言 +1
06 - MCP 模型上下文协议:统一 AI 工具的“Type-C 接口“

本文介绍了MCP(模型上下文协议)作为解决AI工具接入标准不统一问题的方案。MCP由Anthropic提出,旨在建立类似Type-C接口的统一标准,使开发者只需编写一次工具即可跨平台使用。协议采用Host-Client-Server三层架构,支持stdio和HTTP两种通信方式。目前MCP生态正在快速发展,已有多个平台和社区工具支持,但仍面临协议迭代、安全隐患和平台兼容性等挑战。MCP通过标准化工

#人工智能#开发语言
AI 聊天机器人完全进阶:从能用到好用

这是一份QQ 聊天机器人进阶教程,面向已经跑通基础机器人的读者,讲解如何让机器人从"能回消息"进化到"真正好用"。核心内容包括:接入 AI 大模型:对比 DeepSeek、GPT-4o、Claude、Ollama 等模型,提供 NoneBot2 插件代码示例和 AstrBot 一键配置方案。搭建知识库(RAG):用 AstrBot 内置功能或自建流程,让机器人基于你的文档资料回答问题。MCP 工具

#人工智能
AI Agent 入门:从单 Agent 到多 Agent 协作

2026年成为AIAgent从概念验证迈向生产落地的关键节点,MCP协议月下载量突破9700万,A2A协议获150+组织支持。本文系统阐述了AIAgent的核心特征(从被动应答转向自主执行)、四种推理模式(ReAct/CoT/ToT/GoT)及协议体系(MCP实现工具调用,A2A支持Agent协作)。重点解析多Agent系统的三种架构(编排/群组/混合模式),并通过销售分析案例展示其协同工作流程。

#人工智能#开发语言#python
07 - Agent 智能体:能自主干活儿的 AI

本文介绍了AI智能体(Agent)的核心概念与工作机制。Agent是一种能够自主规划、决策、调用工具并持续迭代完成复杂任务的AI系统,其核心公式为Agent=LLM+工具+循环。文章详细阐述了Agent的"思考-行动-观察"工作循环,并通过"查天气找雨伞店"的实例展示了Agent的多步骤执行过程。与普通LLM相比,Agent能处理更复杂的多步骤任务,自主调用

#人工智能#开发语言
08 - Agent Skill:给 Agent 写一份“说明书“

本文介绍了AgentSkill的概念与应用。AgentSkill是为AI智能体编写的场景化说明书,包含元数据层和指令层,能够针对特定任务提供详细步骤、规则约束和输出格式要求。与全局性的SystemPrompt不同,AgentSkill采用渐进式披露机制,只在相关场景下加载具体指令,大幅节省Token消耗。文章通过"出门清单"实例展示了Skill的编写方式,并对比了其与传统Pro

#人工智能#开发语言
线性回归:从零理解“预测“

《线性回归:从基础到实践》摘要 线性回归作为机器学习的基石,通过拟合直线或超平面建立特征与连续目标值的关系。文章系统讲解了其核心要点:1) 数学形式分为一元和多元线性回归;2) 通过最小二乘法或梯度下降求解最优参数;3) 使用R²、MSE等指标评估模型性能;4) 针对过拟合问题,介绍岭回归和Lasso两种正则化方法。文章通过Python代码示例演示完整建模流程,并指出线性回归与深度学习的继承关系。

#人工智能#机器学习#开发语言
LSTM 文本情感分析:从词嵌入到分类实战

本文是一篇完整的NLP实战教程,使用LSTM模型对IMDb电影评论进行情感分析(正面/负面分类)。主要内容包括: 数据处理:从文本清洗、分词到构建词表和序列填充 模型构建:使用PyTorch实现Embedding+LSTM+全连接层的分类模型 训练评估:完整训练流程和结果分析,测试准确率达85.87% 推理应用:实现单条评论的情感预测功能 进阶方向:提出使用预训练词嵌入、双向LSTM和Transf

#深度学习#人工智能#开发语言 +1
迁移学习实战:用预训练模型做图像分类

本文介绍了迁移学习在图像分类任务中的应用。通过使用预训练模型(如ResNet-18),只需少量数据微调就能显著提升模型性能,在CIFAR-10数据集上准确率从84%提升至95%。文章详细解析了迁移学习有效的原理(预训练模型已学习通用特征),对比了特征提取和微调两种策略的适用场景,并提供了完整的PyTorch实现代码。关键点包括:1)预训练模型已学习层次化特征,低层特征通用;2)少量数据适合冻结特征

#机器学习#人工智能#深度学习 +1
生成模型入门:从 VAE 到扩散模型

生成模型的目标就是学习数据的分布,然后从中采样。VAE 显式地建模分布(编码器→分布参数→解码器)GAN 隐式地逼近分布(通过对抗,让生成分布接近真实分布)扩散模型通过逐步去噪来采样(从噪声分布→数据分布)

#人工智能#深度学习#机器学习 +1
    共 27 条
  • 1
  • 2
  • 3
  • 请选择