登录社区云,与社区用户共同成长
邀请您加入社区
发现和探索最受欢迎的社区&标签
🎯 从"能用"到"好用"——引入 LangChain 生态,提升检索质量; RAG 技术升级,更高效,更准确的检索效率
在前面的章节中,我们学习了如何使用现有的 MCP 服务。并且也了解到了不同协议的特点。现在,让我们学习如何构建自己的 MCP 服务器。10.5.1 创建你的第一个 MCP 服务器(1)为什么要构建自定义 MCP 服务器?虽然可以直接使用公开的 MCP 服务,但在许多实际应用场景中,需要构建自定义的 MCP 服务器以满足特定需求。主要动机包括以下几点:封装业务逻辑:将企业内部特有的业务流程或复杂操作
设计师的工作重心会更靠近创意与决策,用设计 Agent 快速试错与持续迭代,大部分精力都可以用在最值得打磨的一版上。出图的质感很能打,默认模型的设计质量完全可以媲美 Nano Banana Pro,特别是对国风的理解。比如,我们手动拖入一张图片,它就能自动完美贴合物体的曲面和轮廓,样品的应用效果立马就出来了。同一个主题,风格和文案完全不一样,妥妥的设计生产力啊,再也不用担心老板让多出几版的要求了。
AI绘画变现90天实操指南:零基础月入2000+ 本文提供一套完整的AI绘画变现方案,适合零基础人群通过头像、壁纸等设计服务创收。核心采用"AI生成+人工微调"模式,使用必应AI绘图等免费工具,重点掌握提示词公式(主体+风格+细节+参数+背景)。90天计划分四阶段:1)7天掌握工具并整理作品集;2)30天通过低价策略积累10+好评案例;3)优化效率,建立提示词模板库;4)多渠道
本文提出了一种名为 Fast-ThinkAct 的框架,通过将复杂的思维过程压缩成紧凑的“潜意识”向量,让机器人既能像人类一样思考规划,又能像本能反应一样快速执行动作。
GPT系列模型的技术演进与行业影响分析 摘要:OpenAI开发的GPT系列模型自2018年问世以来,已从GPT-1发展到2025年末的GPT-5.2,实现了参数规模从百万级到万亿级的跨越,上下文窗口扩展至400K tokens。最新GPT-5系列具备多模态处理、深度推理和智能路由能力,在编程、医疗等44个专业领域展现专家级性能,同时幻觉生成率显著降低。该系列已广泛应用于教育、医疗等行业,ChatG
本文详细介绍如何通过MCP协议将Dify工作流转为可复用工具。首先说明MCP的价值:提升复用性、标准化和智能化。然后分三步指导实践:1)在Dify发布工作流为工具;2)安装配置MCP服务器插件;3)获取MCP链接并调用。文中通过"天气邮件"案例展示跨场景复用效果,并分享技术进阶技巧和常见问题解决方案。最终强调MCP协议能将工作流转化为"AI积木",构建高效协
在数字化转型背景下,传统业务流程如通知公告管理和文档处理仍依赖人工操作,导致效率低、成本高且易出错。以企业通知公告为例,从撰写到分发,耗费大量人力与时间,且存在格式不规范和信息遗漏等风险。随着市场竞争加剧和业务规模扩大,传统模式已难以满足企业对高效、精准、灵活的业务需求。通过引入AI大模型,企业可实现自动化内容生成、智能摘要提取、多模态交互、标准化与合规性以及资源优化等核心价值。以通知公告应用为例
摘要:文章探讨了n8n工作流工具与FastGPT RAG智能知识处理系统的协同应用,并分析了MCP Server的关键作用。n8n擅长自动化流程但缺乏语义处理能力,而FastGPT RAG具备知识检索与生成优势,两者结合可实现智能工作流。MCP Server作为中间件负责数据预处理和请求协调,确保系统高效运作。文中详细说明了工作流调用流程,包括触发条件设置、参数传递、知识库调用及结果处理,并提供了
AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。感兴趣的小伙伴,赠送
Token和分词器是LLM的“幕后英雄”。Token是AI处理文字的基本单位,分词器则是把文字变成Token的魔法师。从早期的WordPiece、BPE,到SentencePiece与Tiktoken,我们可以看到:分词器并不是一件小事。它影响的不只是文本编码效率,更深刻地决定了模型理解语言的方式、训练成本以及推理表现。希望这篇文章让你对Token和分词器有了清晰的认识!只有真正理解了 Token
Lora(Low-RankAdaptation)是微软研究人员开发的一项技术,主要用于降低大语言模型(如GPT系列)和生成模型(如StableDiffusion)微调的成本。Lora通过在预训练模型的基础上注入可训练的低秩矩阵,实现了对模型的快速且高效的微调,同时保持了与全模型微调相当的微调质量。StableDiffusion是一种基于潜空间扩散模型的文本到图像的生成模型。
看到一些的图片,就是手部出现一系列的问题;有教程在使用复杂的方法来修复手,但在我看来,如果你遵循下面分享的方法,你生成的人物图像不会出现严重的手部问题,就算要修复也是较为省事的;下面我将要样式用提示词、Embeddings、高分辨率修复方式演示怎么生成高质量手部的人物图像,这些方法不仅适合生成真实人物图片,也适用 二次元 风格人物插图;这里以真实系大模型beautifulRealistic来演示这
这次暑假没有太多事情,在Datawhale上看到夏令营的线上活动,觉得很有意思,想参与一下。简单来说就是电商直播、短视频带货已经很火了。每条视频下面都有一堆评论,这些评论就像“消费者的心声”——他们告诉你喜欢不喜欢、有没有疑问、有哪些建议等等。但评论很多、很杂,靠人去看是不现实的,所以需要用AI/NLP模型来自动分析这些评论,提炼出有用的信息。
引言还记得上一篇文章中,我们一起探索了如何用 Ollama 打造自己的私人 AI 助手吗?今天,让我们掀开 Ollama 的神秘面纱,一起深入了解它的"大脑"是如何运作的。就像解剖一台精密的机器,我们将逐层剖析 Ollama 的核心原理,看看它是如何让 AI 模型在你的电脑上高效运转的。系统架构想象一下,Ollama 就像一座精心设计的现代化工厂,每个部门都各司其职,又紧密配合。这座"AI工厂"采
AI 通话逻辑的核心在于通过语音识别、自然语言处理和语音合成技术,实现人机之间的高效语音交互。其应用场景广泛,包括客服中心、智能助手、医疗健康等领域。随着深度学习技术的进步,AI 通话系统的准确性和自然度不断提升,未来有望在更多领域发挥重要作用。"调用订单查询接口"
Anthropic经济指数发布:36%的职业已被AI渗透!你的工作安全吗?
Stability AI核心团队离职后成立Black Forest Labs,推出文生图模型FLUX.1,被视为Stable Diffusion 3的"精神续作"。FLUX.1在Stable Diffusion 3架构基础上改进,采用旋转式位置编码和并行注意力层,并提供三个版本:高性能API版、高效蒸馏版和极速本地版。模型沿用开源传统,已公开源代码和权重。技术改进包括优化的图块
嘿,大家知道吗?在小红书上,那些温暖又治愈的插图特别受欢迎,轻轻松松就能收获成千上万的点赞。这些插图不光能让咱心情变好,还藏着不少赚钱的机会呢!今天,咱们就来看看怎么用 AI 工具,快速做出这些受欢迎的作品,再聊聊怎么把它们变成钱。
你是否想过将自己或朋友的照片转化为一个逼真的PVC手办人物?随着人工智能和图像生成技术的飞速发展,这样的想法已经不再是梦想。通过ComfyUI,一个基于Stable Diffusion (SD) 的强大工具,你可以轻松地创建个性化的手办人物画。本篇文章将为你揭示如何利用ComfyUI的工作流,将一张普通的照片变成精美的PVC人物画。ComfyUI简介ComfyUI 是一个模块化的用户界面,专为那些
RAG(Retrieval-Augmented Generation,检索增强生成)技术通过检索增强生成,显著提升了知识问答的准确性和时效性。在构建知识库时,RAG通过向量数据库和动态更新机制,实现了高效的知识检索与生成;在构建知识图谱时,RAG通过GraphRAG和Graphusion等框架,实现了实体关系的精准抽取与图谱融合。
由于提示词膨胀和选择复杂性,大语言模型(LLMs)难以有效利用越来越多的外部工具,比如由模型上下文协议(MCP)[1]定义的那些工具。我们引入了RAG-MCP,这是一种检索增强生成框架,它通过将工具发现任务卸载来克服这一挑战。RAG-MCP在调用大语言模型之前,使用语义检索从外部索引中为给定查询识别最相关的MCP。只有选定的工具描述会被传递给模型,这大幅减少了提示词的大小并简化了决策过程。
通用大模型(如DeepSeek、Qwen)虽具备广泛的知识覆盖和基础推理能力,但仍存在以下局限性:(1)知识短板:难以覆盖细粒度、动态更新的事实(如罕见病治疗方案、最新指南);(2)逻辑薄弱:在复杂推理链、反常识逻辑或伦理判断中表现不足;(3)领域偏科:在医疗、金融等专业领域,需垂直模型辅助才能满足高精度需求。
数据分析与商业智能(BI)在中大型企业的日常运营中的重要性毋庸置疑,无论是简单的财务数据分析,还是复杂的客户与运营数据洞察,都需要借助专业的工具。理想中的AI Agent是在丢给他一个工具包与一些知识以后,借助于大模型的理解、推理能力,完全自主的规划与分解任务,设计任务步骤,并智能的使用各种工具,检索知识,输出内容,完成任务。在实际测试中我们发现不同的大模型在这方面的能力是有较大的差异的,而且即使
Nacos 与 Dify 的结合,为生成式 AI 应用的开发效率与架构灵活性提供了新的解决方案。
Ollama 是一个开源项目,旨在简化大型语言模型(LLM)在本地计算机上的运行和管理。它提供了一个命令行工具,让用户能够轻松下载、运行和交互式使用各种开源语言模型(如 LLaMA、Mistral、Gemma 等),而无需复杂的配置或依赖云服务。此外还用到chatBox软件
Embedding可以理解为一堆提示词的集合。它将很多的提示词汇总到一个文件里,我们需要的时候,只需要调用这个Embedding文件,就等同于输入了很多的提示词,对用户来说非常方便。
想让大语言模型(LLM)变得更聪明、更贴合你的需求?那就得靠微调(fine-tuning)!而微调的关键在于一个精心准备的数据集。本文将带你一步步了解如何创建和准备一个适合LLM微调的数据集,特别聚焦于如何使用Unsloth来简化这个过程。无论你是想让模型学会写代码、做总结,还是扮演某个角色,这篇指南都能帮你理清思路,少走弯路。
检索增强生成(RAG)技术通过赋予生成式AI模型检索和整合外部信息的能力,显著提升了其性能。自2020年正式提出以来,RAG经历了快速发展,从最初的基础框架演变为如今包含多种高级和模块化架构的复杂技术。与微调和长上下文窗口模型相比,RAG在处理动态数据、需要最新信息以及降低计算成本方面展现出独特的优势。尽管如此,RAG也面临着检索质量、上下文整合、可扩展性、数据质量、透明度等诸多挑战,但研究人员和
尽管 Nvidia 拥有丰富的资源,数据集的大小适中,答案也相对简短,但研究者们还是通过一种新的 RAG 方法,发送 48K 的文本片段并连同用户查询一起,打破了之前的最先进水平,实现了 47.25 的 F1 score(如果发送的内容更少,F1 score 会更低)基于同义词的搜索确实能够找到关键字搜索遗漏的产品,但这是有代价的。这意味着,当搜索关于“国王”的信息时,系统会优先展示关于“王后”的
ComfyUI是一款用于AI绘画的工具,其工作界面由多个功能组件(节点)组成,用户可以通过鼠标操作进行场景平移和缩放。与StableDiffusion webUI相比,ComfyUI的工作流程更加灵活,用户可以通过手动搭建工作流来实现复杂的AI绘画功能。工作流包括模型加载、提示词编码、采样、图像生成等步骤,每个步骤通过节点连接,最终生成AI图像。ComfyUI的节点在运行时高亮显示,用户可以清晰地
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net