qq_21103417 个人主页

@qq_21103417

qq_21103417

2025-06-13 22:12:31 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

揭秘Agent核心技能：MCP skills全解析

MCP技能是指通过模型上下文协议(MCP)为智能体提供的外部工具能力集合。MCP作为统一标准协议，允许智能体安全访问各类资源：包括数据源(数据库/搜索引擎)、应用(GitHub/Jira)和工具(代码执行/支付接口)。这些通过MCP暴露的工具能力构成了智能体的"技能包"，包括基础能力(代码执行/搜索)、云服务集成(GCP)、第三方SaaS工具(GitHub/Stripe)以及自

#人工智能 #MCP

大模型实战：基于 DeepSeek 搭建企业知识库问答（RAG）应用案例

本文介绍了一个基于DeepSeek推理模型和本地向量检索的企业知识库问答系统实现方案。针对大模型应用中常见的无法回答内部知识和幻觉问题，采用RAG（检索增强生成）架构，通过本地向量检索找到相关文档片段，再结合DeepSeek生成答案。文章详细讲解了从知识库准备、向量索引构建到核心代码实现的完整流程，并提供了可运行的Python代码示例。重点分析了文档切分粒度、向量模型选择、降低幻觉等实战细节，同时

#人工智能 #RAG

2026年AI进化：从聊天到实干

2025-2026年AI发展呈现三大趋势：技术层面，AI将从聊天模型转向具备任务执行能力的智能体系统，融合世界模型和NSP范式；算力发展更注重效率与绿色化，推理算力占比超60%，边缘计算和低能耗模型受重视；应用落地聚焦可量化价值，企业级AI将经历"幻灭低谷"后迎来V型反转，制造业、医疗等领域深度融合。同时，数据治理转向高质量与合成数据应用，安全伦理问题需前置设计。人机协作将重构

#人工智能

多Agent框架选型指南：按需求精准匹配

本文系统分析了当前主流开源AI智能体框架的特点和适用场景。针对不同需求场景提供选型建议：1）代码工程场景首选微软AutoGen；2）复杂流程编排推荐LangGraph；3）企业落地建议Google ADK；4）快速原型开发推荐CrewAI；5）低代码可视化平台可选Dify或LangFlow；6）轻量级嵌入推荐smolagents。文章详细比较了AutoGen、CrewAI、LangGraph等框架

#人工智能

开源工具轻松实现高清视频修复

开源视频高清处理工具推荐本文介绍了四类高清视频处理需求的开源解决方案：分辨率提升：推荐Real-ESRGAN（实拍）和Real-CUGAN（动漫）画质增强：使用Real-ESRGAN去除噪点和伪影补帧处理：RIFE算法实现流畅运动效果一键处理：Video2X和Waifu2x-Extension-GUI提供图形界面重点推荐组合：动漫处理：Real-CUGAN+RIFE 实拍视频：Rea

#人工智能

开源AI模型终极导航：从LLM到多模态，一文教你如何选型与落地

本文系统梳理了当前主流的开源AI模型与平台，助您快速选型。在文本领域，可根据需求选择：中文场景首选Qwen系列，追求推理与代码能力推荐DeepSeek，国际生态和多模态任务可考虑Llama 4，轻量本地部署则关注Phi-3或Gemma。图像生成方面，Stable Diffusion生态成熟，FLUX系列画质出众，GLM-Image则擅长中文图文。语音模型推荐Fish Speech和Whisper。

#人工智能 #算法

AI模型调参指南：核心参数全解析

文章摘要：本文系统介绍了大语言模型生成文本时的核心调参方法。首先详细解析了控制随机性的关键参数：温度（temperature）影响输出保守程度，top_p和top_k控制候选词范围，min_p过滤低概率词。其次介绍了减少重复的参数：频率惩罚、存在惩罚和重复惩罚等。此外还涵盖了输出长度控制、多样性策略、结构化输出等参数设置。文章提供了针对不同场景的调参建议：严谨任务应降低温度、增大top_p；创意写

#人工智能

大模型参数揭秘：从7B到70B的关键解析

大模型参数是深度学习的核心知识载体，包括权重和偏置，决定了模型的能力上限。关键参数包括总量、隐藏维度、层数、注意力头数、FFN维度等，这些因素共同影响模型性能和计算成本。实际应用中，7B-13B规模的模型通常能平衡效果与资源消耗，而更大的70B模型收益有限但成本剧增。选择模型时应综合考虑任务需求、硬件配置和成本效益，避免盲目追求参数量。优化架构、训练策略和微调方法往往比单纯增加参数更能提升实际效果

#人工智能

AI模型部署指南：硬件选型与性能优化

摘要：本文分析了不同规模AI模型（2B-70B参数）在CPU/GPU上的部署需求，重点介绍了4bit量化后显存占用情况（如7B模型需8-12GB显存）。针对不同场景给出硬件建议：个人开发推荐7B+8-12GB显卡；小团队建议13B+24GB显卡；SaaS服务需多张A100。文章提供了并发估算公式（24GB显卡约支持6-10个短对话并发），并建议根据显存、并发需求选择模型规模或云端API方案。核心结

#人工智能

开源还是商用？大模型选型终极指南与实战搭配

本文深入解析了开源与商用大模型的根本差异，并为您提供了清晰的选型路线图。开源模型（如Llama、Qwen）权重开放、可私有部署、成本可控，但需自行维护；商用模型（如GPT-4、Claude）开箱即用、性能顶尖，但需按量付费且数据需出境。

#人工智能

共 15 条

请选择