2301_82070640 个人主页

@2301_82070640

2301_82070640

2024-02-19 11:32:14 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

模型优化与部署：量化、蒸馏与 ONNX

深度学习模型部署与优化核心技术摘要将训练好的模型部署到生产环境面临三大挑战：模型体积大、推理速度慢、框架不兼容。本文系统介绍了三种关键技术：量化：将模型从FP32转为INT8，体积缩小4倍，推理速度提升2-4倍，精度损失通常低于1%。知识蒸馏：通过大模型（Teacher）指导小模型（Student），在参数量减少的情况下保持较高准确率。 ONNX导出：作为跨框架中间格式，支持PyTorch/

#深度学习 #人工智能 #开发语言 +1

AI Agent 入门：从单 Agent 到多 Agent 协作

2026年成为AIAgent从概念验证迈向生产落地的关键节点，MCP协议月下载量突破9700万，A2A协议获150+组织支持。本文系统阐述了AIAgent的核心特征（从被动应答转向自主执行）、四种推理模式（ReAct/CoT/ToT/GoT）及协议体系（MCP实现工具调用，A2A支持Agent协作）。重点解析多Agent系统的三种架构（编排/群组/混合模式），并通过销售分析案例展示其协同工作流程。

#人工智能 #开发语言 #python

提示工程：与大模型对话的“语法“

《提示工程核心技术解析：从零样本到思维链》摘要本文系统介绍了大模型提示工程的核心技术。研究表明，提示词质量对模型输出的影响甚至超过模型本身，优质提示可带来30-50%的性能提升。文章基于本地Qwen3模型，详细讲解了五种关键技术：零样本提示（直接任务描述）、少样本提示（提供示例）、思维链（分步推理）、结构化模板（角色-任务-格式）和系统提示（角色设定）。其中，"让我们一步步思考&quo

#人工智能

DQN 与 PPO：深度强化学习

DQN = Q-Learning + 神经网络 + 经验回放 + 目标网络——它让 RL 能处理图像等高维输入PPO = 策略梯度 + "每次不要改太多"的约束——它用 3 行核心代码解决了 RL 训练不稳定的根本问题PPO 是 2026 年最通用的 RL 算法——从 Atari 游戏到机器人控制到 ChatGPT 的 RLHF，都是它

摘要：关联规则挖掘（如经典的“啤酒与尿布”案例）通过分析事务数据（如购物篮）发现“A→B”的强关联模式，核心指标包括支持度（规则普遍性）、置信度（规则可靠性）和提升度（排除畅销偏差，衡量真实关联）。Apriori算法通过剪枝策略高效挖掘频繁项集，但其需多次扫描数据，FP-Growth算法通过构建FP-Tree优化性能。实际应用中，需结合业务目标筛选规则（如高提升度+置信度），适用于电商推荐、商品

#人工智能 #大数据 #python +1

模型优化与部署：量化、蒸馏与 ONNX

#深度学习 #人工智能 #开发语言 +1

06 - MCP 模型上下文协议：统一 AI 工具的“Type-C 接口“

本文介绍了MCP（模型上下文协议）作为解决AI工具接入标准不统一问题的方案。MCP由Anthropic提出，旨在建立类似Type-C接口的统一标准，使开发者只需编写一次工具即可跨平台使用。协议采用Host-Client-Server三层架构，支持stdio和HTTP两种通信方式。目前MCP生态正在快速发展，已有多个平台和社区工具支持，但仍面临协议迭代、安全隐患和平台兼容性等挑战。MCP通过标准化工

#人工智能 #开发语言

共 35 条

请选择