
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
MCP技能是指通过模型上下文协议(MCP)为智能体提供的外部工具能力集合。MCP作为统一标准协议,允许智能体安全访问各类资源:包括数据源(数据库/搜索引擎)、应用(GitHub/Jira)和工具(代码执行/支付接口)。这些通过MCP暴露的工具能力构成了智能体的"技能包",包括基础能力(代码执行/搜索)、云服务集成(GCP)、第三方SaaS工具(GitHub/Stripe)以及自
本文介绍了一个基于DeepSeek推理模型和本地向量检索的企业知识库问答系统实现方案。针对大模型应用中常见的无法回答内部知识和幻觉问题,采用RAG(检索增强生成)架构,通过本地向量检索找到相关文档片段,再结合DeepSeek生成答案。文章详细讲解了从知识库准备、向量索引构建到核心代码实现的完整流程,并提供了可运行的Python代码示例。重点分析了文档切分粒度、向量模型选择、降低幻觉等实战细节,同时
2025-2026年AI发展呈现三大趋势:技术层面,AI将从聊天模型转向具备任务执行能力的智能体系统,融合世界模型和NSP范式;算力发展更注重效率与绿色化,推理算力占比超60%,边缘计算和低能耗模型受重视;应用落地聚焦可量化价值,企业级AI将经历"幻灭低谷"后迎来V型反转,制造业、医疗等领域深度融合。同时,数据治理转向高质量与合成数据应用,安全伦理问题需前置设计。人机协作将重构
本文系统分析了当前主流开源AI智能体框架的特点和适用场景。针对不同需求场景提供选型建议:1)代码工程场景首选微软AutoGen;2)复杂流程编排推荐LangGraph;3)企业落地建议Google ADK;4)快速原型开发推荐CrewAI;5)低代码可视化平台可选Dify或LangFlow;6)轻量级嵌入推荐smolagents。文章详细比较了AutoGen、CrewAI、LangGraph等框架
开源视频高清处理工具推荐 本文介绍了四类高清视频处理需求的开源解决方案: 分辨率提升:推荐Real-ESRGAN(实拍)和Real-CUGAN(动漫) 画质增强:使用Real-ESRGAN去除噪点和伪影 补帧处理:RIFE算法实现流畅运动效果 一键处理:Video2X和Waifu2x-Extension-GUI提供图形界面 重点推荐组合: 动漫处理:Real-CUGAN+RIFE 实拍视频:Rea
本文系统梳理了当前主流的开源AI模型与平台,助您快速选型。在文本领域,可根据需求选择:中文场景首选Qwen系列,追求推理与代码能力推荐DeepSeek,国际生态和多模态任务可考虑Llama 4,轻量本地部署则关注Phi-3或Gemma。图像生成方面,Stable Diffusion生态成熟,FLUX系列画质出众,GLM-Image则擅长中文图文。语音模型推荐Fish Speech和Whisper。
文章摘要:本文系统介绍了大语言模型生成文本时的核心调参方法。首先详细解析了控制随机性的关键参数:温度(temperature)影响输出保守程度,top_p和top_k控制候选词范围,min_p过滤低概率词。其次介绍了减少重复的参数:频率惩罚、存在惩罚和重复惩罚等。此外还涵盖了输出长度控制、多样性策略、结构化输出等参数设置。文章提供了针对不同场景的调参建议:严谨任务应降低温度、增大top_p;创意写
大模型参数是深度学习的核心知识载体,包括权重和偏置,决定了模型的能力上限。关键参数包括总量、隐藏维度、层数、注意力头数、FFN维度等,这些因素共同影响模型性能和计算成本。实际应用中,7B-13B规模的模型通常能平衡效果与资源消耗,而更大的70B模型收益有限但成本剧增。选择模型时应综合考虑任务需求、硬件配置和成本效益,避免盲目追求参数量。优化架构、训练策略和微调方法往往比单纯增加参数更能提升实际效果
摘要:本文分析了不同规模AI模型(2B-70B参数)在CPU/GPU上的部署需求,重点介绍了4bit量化后显存占用情况(如7B模型需8-12GB显存)。针对不同场景给出硬件建议:个人开发推荐7B+8-12GB显卡;小团队建议13B+24GB显卡;SaaS服务需多张A100。文章提供了并发估算公式(24GB显卡约支持6-10个短对话并发),并建议根据显存、并发需求选择模型规模或云端API方案。核心结
本文深入解析了开源与商用大模型的根本差异,并为您提供了清晰的选型路线图。开源模型(如Llama、Qwen)权重开放、可私有部署、成本可控,但需自行维护;商用模型(如GPT-4、Claude)开箱即用、性能顶尖,但需按量付费且数据需出境。







