登录社区云,与社区用户共同成长
邀请您加入社区
这是我的第一个完整RAG系统Demo。用一周时间从零开始,搭建了一个房产推荐AI系统。系统涉及向量表示学习、检索增强生成(RAG)、提示工程、对话管理、LCEL编程范式等核心知识。核心流程:用户提问 → 向量化 → 检索相关房源 → LLM生成答案 → 保存对话历史。技术栈:LangChain + Chroma + DashScope + FastAPI + Streamlit。
本文分享了基于LangChain Deep Agents框架的智能体评估体系,详细介绍了单步、完整周期和多轮交互三种评估模式,以及工具调用轨迹、最终输出和中间状态四个评估维度。通过Pytest+LangSmith构建多维断言矩阵,确保智能体产品的可控性、可复现性和高效性,帮助开发者从混沌到有序,构建工业级智能体产品。
Claude Agent Skills(技能)是一种可复用的文件系统资源,为Claude提供特定领域的专业知识、工作流程和最佳实践。与传统的提示词不同,Skills可以按需加载,无需在每次对话中重复提供相同的指导。
本文针对鸿蒙6开发中CANN Kit的常见问题提供解决方案,涵盖环境配置、模型转换、算子开发、系统集成和性能优化五大类问题。重点包括:CANN Toolkit安装步骤、ONNX模型转换方法、自定义算子开发模板、ArkUI与CANN的异步交互实现,以及温度控制和资源分配等性能优化技巧。文章提供了详细的命令行操作、代码示例和调试方法,所有方案均通过鸿蒙6.0 CANN 6.3环境验证,并推荐使用Min
我们追求的终极目标,不是创造一个冰冷计算的世界,而是利用人工智能的强大能力,去放大人类的创造力、同情心和智慧,共同应对全球性挑战,提升每一个人的生活品质和生命尊严。然而,在这片由算法和算力构筑的新大陆上,一个根本性的命题日益凸显:如何让人工智能的理性之光,与人类社会深厚而复杂的人文精神达成一种新的平衡?关于AI的规范和边界,需要科学家、工程师、人文学者、政策制定者和公众的共同参与,通过跨学科的交流
有很多小伙伴不知道学习哪些鸿蒙开发技术?不知道需要重点掌握哪些鸿蒙应用开发知识点?而且学习时频繁踩坑,最终浪费大量时间。所以有一份实用的鸿蒙(HarmonyOS NEXT)资料用来跟着学习是非常有必要的。这份鸿蒙(HarmonyOS NEXT)资料包含了鸿蒙开发必掌握的核心知识要点,内容包含了。
手机Mozilla/5.0 (Phone; OpenHarmony 5.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36 ArkWeb/4.1.6.1 Mobile HuaweiBrowser/5.1.8.311电脑Mozilla/5.0 (PC; OpenHarmony 5.0) AppleWebKi
📌 高通DLBC模型转换摘要 本文详细介绍将ONNX/TFLite模型转换为高通专属DLBC格式的完整流程: DLBC优势:深度优化骁龙硬件,支持CPU/GPU/DSP/NPU异构计算,比通用格式性能提升30%+ 转换步骤: 安装QAIRT工具链并配置环境 基础转换(层融合、内存布局优化) 可选INT8/FP16量化。关键技巧: 使用--fusion-rules实现卷积+BN+ReLU融合 按硬
创建一个Modelfiledockerfile复制下载SYSTEM """你是一个有帮助的AI助手。"""bash复制下载。
本文分享了Linux自学过程中的实用命令总结,主要涵盖文件查看、管理和操作技巧。重点介绍了more/less查看文件、head/tail查看首尾、mkdir/touch创建目录文件、rm/cp/mv删除复制移动文件等核心命令,并提供了alias别名、stat文件信息、tree目录结构等提升效率的技巧。作者结合自身学习经验,强调动手实践的重要性,建议从常用命令开始逐步深入,同时注意操作安全(特别是r
"ND"],"type": ["fp16"},"ND"],"type": ["fp16"],"ND"],"type": ["fp16"使用msopgen生成工程项目文件-i:算子原型定义文件add_custom.json所在路径。代表算子在AI Core上执行,<soc_version>*为昇腾AI处理器的型号。<soc_version>可以通过命令查看昇腾AI处理器的型号AddCustom├──
本文提供了一份全面的Chrome浏览器性能优化指南,涵盖基础设置到高级技巧。从识别CPU、内存、GPU及网络等性能瓶颈入手,指导用户使用ChromeDevTools进行分析,并提供了关闭硬件加速、限制后台标签页资源、管理内存、优化网络性能等具体方案。文章还包含扩展程序管理、实验性功能调整等高级优化技巧,建议结合Lighthouse等工具持续监控。这些基于官方文档和最佳实践的优化方法,可显著提升浏览
本文介绍了基于 Plasmo 框架开发 Chrome 插件的经验,包括插件嵌入方法、技术栈选择、样式隔离技术(如 Shadow Root)、Ant Design 组件静态引入的难点以及整体功能和目录结构。
AI Agent是基于大模型的智能体,具备"自主感知-决策-执行"闭环能力,从"只会说"升级到"能做事"。它能一站式解决复杂任务、跨场景协作、提供个性化服务,适用于职场人提高效率、企业降本增效和个人生活简化。零代码即可创建专属Agent,未来可能像APP一样普及,成为每个人的智能伙伴。
在大模型智能体*(LLM Agent)*落地过程中,复杂工作流的**高效执行、资源冲突、跨框架兼容、分布式部署**等问题一直困扰着开发者。而一款名为Maze的分布式智能体工作流框架,正以任务级精细化管理、智能资源调度、多场景部署支持等核心优势,为这些痛点提供一站式解决方案。
本文全面解析RAG(检索增强生成)技术,详解其解决LLM幻觉、时效性和安全问题的必要性。系统介绍四大核心模块:版面分析(多格式文件处理)、知识库构建(文本分块、向量化、索引)、大模型微调(FFT/PEFT)及问答流程。对比RAG与SFT优劣,提供实战技巧及RAGFlow、QAnything等开源项目学习指南,助力开发者构建企业级知识库问答系统。
本文探讨了在微服务架构中优化gRPC性能的方法,重点针对软实时服务调用场景。通过优化gRPC的长连接管理和线程模型,可显著降低延迟并提高吞吐量。文章详细介绍了从环境搭建到具体实现的完整流程,包括复用连接通道、调整线程池大小等优化策略,并提供了性能测试方法和常见问题解决方案。这些优化技巧特别适用于金融交易等对实时性要求较高的系统,能有效提升服务调用的效率和稳定性。
任务必须具体、可执行,最好以动词开头。模糊指令:“看看有什么问题”精准指令:“执行以下三个检查:1)识别所有按钮的可用状态 2)验证表单必填项标识 3)检测文字截断或重叠现象”测试场景专用动词库验证类:校验、确认、核对检测类:识别、定位、发现对比类:比较、核对、匹配评估类:评估、判断、分级在多模态AI时代,工程师的核心竞争力正在发生变化。技术实现能力固然重要,但更关键的是问题定义能力和指令设计能力
GLM-4.7模型突破性地从"答得对"转向"做得完",重点提升编程任务和多步骤执行能力。其创新训练方法采用工程化思维:严格筛选有效数据,小模型验证后再训练。推理机制引入"交织式思考",显著提升Agent任务稳定性。同时,模型在UI审美和工程理解方面也取得突破,能完成复杂交互流程。智谱还开源了强化学习框架Slime,推动模型向生产落地转型。
在当今人工智能飞速发展的时代,深度学习模型的推理性能成为了众多开发者关注的焦点。NVIDIA TensorRT 是一款高性能的深度学习推理(Inference)优化器和运行时库,能够显著提升模型的推理速度,降低延迟,同时保持较高的吞吐量。在实际应用中,例如自动驾驶、智能安防、实时语音识别等领域,对模型推理的实时性要求极高。掌握 TensorRT C++ API 的集成技能,对于开发者来说,不仅可以
本文深入解析了AI Agent记忆系统架构,涵盖短期记忆的上下文工程策略(缩减、卸载、隔离)和长期记忆的技术实现(信息提取、向量化存储、语义检索)。对比了Google ADK、LangChain、AgentScope等框架的记忆系统实现,并探讨了行业趋势与产品对比。记忆系统作为AI Agent的核心基础设施,能解决上下文窗口限制、token成本等问题,实现跨会话用户偏好记忆,是构建实用AI Age
M3KG-RAG是一种创新的端到端多模态RAG框架,通过构建多跳多模态知识图谱(M3KG)和GRASP检索策略,显著提升多模态大模型在音视频问答任务中的推理能力和准确性。该框架采用多智能体协作构建知识图谱,结合模态感知检索和选择性剪枝技术,解决了跨模态嵌入不匹配问题。实验表明,该框架在多个基准测试上实现了显著性能提升,最高达37.8%,为多媒体内容理解和智能问答系统提供了新的技术路径。
文章批评当前AI Agent开发的浮躁现象,指出真正智能的Agent需超越简单RAG和工具调用。具备CoT实现深度思考、完善的Memory系统构建身份认同、Multi-Agent架构实现群体智慧。将Agent比作完整生物体,强调开发者应成为设计AI大脑结构的架构师,把握AI从"单细胞"向"多细胞"进化的机遇。
本文提出SCOPE框架,通过从自身执行轨迹中提炼指导原则,使大语言模型智能体能够自主优化提示词。该框架解决了AI智能体的"静态提示问题",包括纠正性失败和增强性失败。SCOPE采用双流演化机制平衡战术修复与战略成长,并通过视角驱动探索维持多样化策略。实验证明,该框架将任务成功率从14.23%提升至38.64%,实现了AI代理的自我进化能力。
本文介绍CORE(概念导向强化学习)框架,解决大语言模型数学推理中的"定义-应用鸿沟"。通过概念对齐测验和针对性干预训练,提供细粒度概念监督而非仅依赖最终答案正确性。实验显示,CORE训练的模型在多个基准测试上表现显著提升,能真正理解并应用数学概念,而非简单模式匹配,展现出更强推理能力和鲁棒性。
RAG技术真正的难点不在检索端,而在于知识库管理。通过物流系统比喻,RAG如同物流控制中心,大模型是客户,知识库是仓库。强大的物流系统依赖于完善的仓库管理体系,而非单纯的运输方式。RAG系统面临数据量大时的压力,需要良好的数据新增、更新、分类策略,否则系统容易崩溃。知识库管理才是构建高效RAG系统的核心。
我见过最厉害的学员,是个每天通勤 1 小时的大学生:他用半年时间,每天通勤学 1 个小知识点,摸鱼刷 10 道真题,最后不仅通过 NISP 考试,还在 SRC 挖到 2 个低危漏洞 —— 他说 “我没整块时间,但每天 1 小时,积少成多也够了”。别再用 “没时间” 当借口:通勤时别刷短视频了,看个 Nmap 小视频;摸鱼时别聊八卦了,刷道网安真题;睡前别刷朋友圈了,画个知识点思维导图。这些零散的
的作用是允许工作线程安全地与主线程的事件循环交互,确保回调函数在正确的线程(事件循环所在的线程)执行。其中获取当前asyncio事件循环。
摘要: 本插件专为文员设计,用于自动化浏览器数据录入任务。支持录制网页点击、输入等操作并生成脚本,匹配Excel/CSV表格数据自动填充表单,可设置执行间隔避免操作过快。数据本地存储保障安全,支持断网及局域网使用,无需编程基础。适用于CRM录入、订单更新等重复性工作,兼容Chrome及动态网页。注:网页改版需重新适配脚本,建议先测试少量数据。 (149字)
本文介绍了两种使用FFmpeg减小GIF文件大小的方法。方法1是简单的一行命令,直接转换视频为GIF;方法2采用高质量压缩方案,通过首先生成调色板再转换的两步操作,能获得更好的画质和更小的文件体积。文章详细说明了关键参数的作用,包括帧率(fps)、尺寸缩放(scale)和高质量算法(flags=lanczos)等设置,并提供了多种尺寸选项和进一步压缩的建议。推荐使用需要两步操作但效果更优的方法2来
Chrome浏览器的用户数据目录(User Data Directory)是存储所有用户相关数据的文件夹,包括:用户配置文件(如书签、扩展程序、设置等)、 缓存文件、浏览历史记录、Cookies、本地存储数据(如LocalStorage、IndexedDB等)。默认情况下,Chrome会尝试使用同一个用户数据目录运行。如果已经有一个Chrome实例在使用该目录,后续启动的Chrome实例会共享同一
这几天也关注到头条的Trae Agent开源了,因此读了下源码,重点想知道它是如何分析全仓库代码的,毕竟全代码当prompt输入也不现实,LLM有长度限制,就算没限制也会看了后面,忘了前面。传统的思维链虽能拆分任务,但对于复杂问题,需要很多步骤来解决的,经常是走个2,3步就收工,很难长链思考与执行,而且还无法观测与修正,除非你用多agent协同解决。通过bash工具来搜索代码过于粗糙了,因为会把符
说起,我们可以把它理解为桌面上的一个AI快速操作台,只要把光标移到悬浮球上,一些AI辅助功能就会“闪现”,像开会录音、截屏提问、帮你润色总结翻译这些都不在话下,能随时满足工作学习需求。这次重大版本发布,夸克可不是功能层的小修小补,而是依托阿里完整的技术生态、Qwen最强大模型,有别于市面上AI作为插件的形式,深度融合千问AI助手,实现系统级全局AI的全新交互体验。在新的夸克AI浏览器里,AI是随时
Chrome DevTools Protocol (CDP) 是 Chrome 提供的基于 WebSocket 的调试协议,支持远程控制浏览器行为。
数据持久化与选项页开发摘要 本文介绍了 Chrome 扩展开发中的数据持久化技术,重点讲解 chrome.storage API 的使用方法,包括本地存储(local)和同步存储(sync)两种方案,并详细对比了它与 localStorage 的区别。文章还指导开发者如何为扩展创建功能完善的选项页(Options Page),通过实际案例演示如何实现数据的增删改查(CRUD)操作,帮助用户自定义配
今天带来三款软件,一款是离线翻译,一款是时长计费系统,一款是电子发票更名软件。
现在的136版本已经包含在内,至此WebRTC已经完整包含了H264和H265解码器,这个事情应该从2015年开始,Google强推VP9 AV1,最终还是妥协了。时间过的真快,去年8月份写过一篇文章介绍如何加参数方式启动Chrome H265 硬件解码器,
解决客户连接不上服务器的ollama的问题
本文介绍了如何解决Chrome浏览器中的Akamai指纹问题。文章首先指出在请求目标时返回头中包含Akamai信息,必须解决其指纹识别。随后详细说明了Akamai哈希计算的TCP内容,包括SETTINGS和WINDOW_UPDATE两部分。作者提供了Java实现代码,展示了如何发送HTTP/2客户端前言、SETTINGS帧和窗口更新帧,并给出了具体的函数实现。最后通过验证网站对比了Java实现与C
大家使用chatgpt问问题的使用越来越广泛,询问的内容也会越来越多,全部的内容还是保存在chatgpt的聊天记录中,可能随着时间推移忘记,再想查看寻找费事费力,我在想把聊天的记录内容可以保存到本地,构建自己的知识库。这个插件可以在chatgpt对话页面,打开后,可以将当前的对话内容以markdown格式保存到本地。chrome默认会记录不同后缀的下载路径,在下载过 .md 文件后,下次会默认打开
以下是在 Ubuntu 20.04 上安装 SPDK (Storage Performance Development Kit) 的完整步骤:# 更新系统sudo apt updatesudo apt upgrade -y# 安装基础依赖sudo apt install -y git make gcc g++ libssl-dev libaio-dev libnuma-dev \pkg-confi
chrome
——chrome
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net