logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

人工智能NLPPython数据挖掘

可提供的服务

暂无可提供的服务

告别野路子!LLM时代百万级文献语料库的架构演进与合规获取深度指南

本文主张告别爬虫,用有限状态机(FSM)搭建文献获取:以DOI唯一标识驱动,先拉元数据,再按OA→TDM回退链路取文;下载PDF/XML后做版本与许可校验并入库。强调“发现≠获取”、优先XML/HTML,并以license/source/version/timestamp做审计追溯,避免侵权与失效。

文章图片
RAG 五大应用场景:2025-2026 工业级 RAG 落地的 5 个深水区与架构解法

本文从工程实践角度剖析了当前最具商业价值的五大RAG应用场景,揭示了传统方法的三大致命漏洞:语义相似度陷阱、权限裸奔问题和黑盒生成风险。文章指出2025年工业级RAG的核心KPI已转变为检索可控性和权限可控性,并重点分析了客服AI Agent、企业知识助手和代码库Copilot三大深水区应用。

文章图片
#架构#RAG
OpenClaw 落地指南:在 Windows 本地零基础部署 OpenClaw 与自动化强化学习 (RL) 系统

OpenClaw作为2026年爆发的AI Agent框架,凭借模块化设计、多模型支持和强化学习能力,正在重塑AI应用开发范式。本文从架构设计到实战部署,详细介绍了在Windows环境下搭建OpenClaw系统的全流程,包括硬件配置、安装指南、智谱GLM-4模型集成,以及强化学习调优等关键技术。通过高校智能助教系统的案例,展示了如何实现从基础对话到自主进化的完整AI Agent闭环。文章特别强调GR

文章图片
#windows#自动化#运维
RAG 五大应用场景(三)企业级 Code RAG 与代码库 Copilot 深度架构指南

传统代码检索系统因采用“字符串暴力切分”而频繁失效,根源在于忽视了代码的结构化特性。本文提出基于AST语法树的检索范式,通过Tree-sitter工具实现精准代码解析,建立包含符号引用、调用链、配置依赖等元数据的知识图谱。相比文本切分方案,该方法能提升40%的代码生成准确率,解决依赖缺失、语义断裂等核心痛点。关键技术包括:以函数/类为最小检索单元、构建多跳依赖关系图谱、实现代码与配置的关联索引。该

文章图片
#copilot#架构#RAG
AI 时代的学术入门:文献综述实践指南

《AI 时代的学术入门:文献综述实践指南》面向初学者,提供一套可复用、可落地的文献综述工作流,避免“堆论文却写不出观点、引用链易断”的常见困境。指南以 Step 1 检索、Step 2 筛选、Step 3 入库、Step 4 提取、Step 5 生成串起全流程,强调“AI 负责加速,你负责判断与把关”。读者将学会用关键词金字塔构建检索式、用规则与相似度做筛选、用 Zotero 沉淀文献资产,并用

文章图片
#人工智能
AI 时代文献综述:从检索到成稿的 RAG 五步法

这篇文章围绕“AI 时代如何把文献综述写成一条可复用的流程”展开。文章首先指出多数人之所以“读了很多却写不出来”,核心原因不是不努力,而是检索、管理、理解与写作缺少工程化方法。随后解释文献综述的关键目标:按主题归纳,呈现共识与分歧,并明确研究空白(Gap)。在此基础上,文章引入 RAG 思维,强调用可追溯的原文证据约束生成,避免“看似真实”的学术幻觉。最后给出平台无关的五步法框架(检索、筛选、嵌入

文章图片
#算法#RAG#windows +1
从 CUDA OOM 到彻底榨干 GPU:DeepSeek 等大模型高效推理与部署全攻略

本文深入剖析大模型部署中的显存瓶颈问题,以DeepSeek-V3为例,系统分析显存占用的四大来源(模型权重、KV缓存、激活值、运行时上下文),并通过量化、动态优化、分布式扩展等策略提供解决方案。文章包含工业级诊断工具和实战代码,帮助开发者在资源受限环境下高效部署大模型,涵盖INT8/INT4量化、FlashAttention优化及vLLM集群部署等关键技术。

文章图片
#DeepSeek
用 Python + OpenAlex + 国产大模型,给毕业论文造一个选题侦察兵

当 OpenAlex 的图谱每天以百万级的速度自我演进,当国产大模型的成本每年下降一个数量级,研究的入口正在被彻底重新定义。此时,我们不妨做一个互动思考:当未来学术知识图谱 100% API 化、大模型生成的候选选题质量超过 80% 的初级研究者时,研究生还需要“想“选题吗,还是只需要“评审“选题?或许,作为新一代的研究者和工程师,我们的根本任务早已不是“手动找选题“,而是“为自己构建一个能持续产

文章图片
#python#开发语言
把“选题三角”做成一个评分系统:Prompt 工程 + 多模型投票实战

当 LLM-as-a-Judge 的论文每周以几十篇的速度涌现,当多模型投票被工程界默认接受为评估范式,“AI 评分”正在从玄学走向工程。此时,我们不妨做一个思考:当未来 AI 评审委员会的可信度(Cohen’s Kappa)稳定超过 0.7 时,毕业论文还需要导师亲自打分吗?或者说,导师的角色会不会从“评审”变成“评审的评审”(meta-reviewer)?或许,作为新一代工程师,我们的根本任务

文章图片
#人工智能
突破大模型推理天花板:基于 GraphRAG 的多跳推理与隐式因果关系挖掘深度指南

GraphRAG:知识图谱与大模型协同的因果推理架构 摘要:本文提出GraphRAG架构,通过知识图谱增强大模型的因果推理能力。传统RAG依赖向量相似度检索,无法捕捉数据间的隐式因果关系。GraphRAG将非结构化数据转化为结构化属性图(实体-关系网络),实现多跳推理:1)基于图注意力网络动态计算跳转路径;2)引入反事实检验验证因果关系。核心创新在于融合图神经网络与因果推断理论,使AI系统能像人类

文章图片
#RAG
    共 37 条
  • 1
  • 2
  • 3
  • 4
  • 请选择