logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

爆肝程序员必看!RAG 2.0实战全攻略:从零构建企业级AI原生投诉系统,小白也能秒变AI架构师!

RAG 2.0通过混合检索、重排序、多模态、图结构、Agentic编排与安全可信技术,构建可落地的检索增强系统。针对投诉处理场景,文章提出"理解—证据—约束—辅导"的AI原生架构,将RAG 2.0作为证据层和决策编排层,实现可追溯的证据与受约束的行动方案。系统分为索引层、检索层、排序层、编排层和治理层,并提供了从混合召回+重排开始的MVP实施路线,最终实现企业级AI原生投诉处理系统。

文章图片
#人工智能#自然语言处理#架构 +2
AI智能体爆火!大模型+自主决策=未来开发必备技能,小白也能快速上手

本文详解了AI智能体的概念、发展阶段、应用与架构。智能体是能感知环境、自主决策并执行行动的系统,分为对话式AI、人类水平推理者、执行者、创新者和组织者五个阶段,广泛应用于服务、医疗、销售等领域。架构上分为单一智能体和多智能体两种实现方式,前者依赖大模型和工具,后者可通过低代码平台或Python等代码实现。未来还将介绍基于不同平台的智能体快速实现方法,为开发者提供入门指导。

#人工智能#数据库#spring boot +1
不会代码的独立开发者,除了学Cursor,还该会些什么?|十问爆款「小猫补光灯」

十多年前有本书叫《人人都是产品经理》,但现在可能才真正到了「人人都是产品经理」的时刻。背后独立开发者用1.5个小时,开发并上架了包括「小猫补光灯」在内的2款iOS App,这个初代版本最高冲到了苹果商店“摄影与录像分类”免费排行榜前20。后来因为抄袭者众,开发者一怒之下,选择的竟然是开发功能进阶的「小猫补光灯Pro」,收费1元。不料上架4小时内竟然冲上付费总榜第一。它成功地告诉我们:AI Nati

文章图片
#人工智能#大数据#运维 +1
Prompt Engineer/提示工程师

自人工智能(AI)诞生之初,人们就担心它会抢走人类的工作。不过,AI也不断在创造新的职业,比如最近大火的“提示工程师”(prompt engineer),随着ChatGPT等语言类大模型(large language model)和Midjourney等图像生成程序(image generator)的爆红而需求剧增。什么是提示工程师?

文章图片
#人工智能#语言模型#大数据 +2
从0到1构建商用Agent(智能体):为什么技术框架首选Dify

在AI智能体开发的赛道上,开发者面临着一个关键选择:是使用传统的编程框架如LangChain,还是选择新兴的可视化低代码平台?经过大量实践验证,Dify正在成为企业级智能体开发的首选框架,原因不仅仅是技术先进性,更在于它解决了传统开发方式的根本痛点。

文章图片
#css#前端#人工智能 +2
AI大厂都在偷偷研究!BambooKG知识图谱架构,让大模型不再“胡说八道“,程序员必学!

BambooKG是一种新型知识图谱框架,借鉴神经科学中的Hebbian学习法则,通过非三元组边和频率加权机制建模实体关系。系统分为记忆构建和知识召回两阶段,支持多跳推理和跨文档关系推理。实验显示,在HotPotQA数据集中,BambooKG的准确率比GraphRAG最高提升58%,兼具高准确率、快速召回与强推理能力,为构建可持续学习的智能记忆系统提供了新路径。

文章图片
#人工智能#知识图谱#架构 +3
【大模型开发】Graph-RAG“减负“神器:如何让知识图谱减少40%噪音却提升70%性能?小白程序员也能懂的AI黑科技!

Deg-Rag提出Graph-based RAG知识图谱降噪方法,通过实体消歧和关系反思处理LLM生成图谱。实验显示,该方法减少约40%实体节点和30-60%关系,同时QA性能提升50%-70%。类型感知Blocking和直接合并节点效果最佳,传统KG嵌入在算力紧张时更具性价比。研究证实"Less is More"原则在Graph-based RAG中成立,降噪后的图谱反而提升了检索与生成效率。

文章图片
#人工智能#知识图谱#科技 +3
API推荐界的“断舍离“:大模型让推荐列表自己“做减法“,准确率暴涨21.59%,小白也能秒懂!

WAR-Re框架引入<API_start/stop>令牌,使TinyLlama模型实现API推荐列表动态伸缩,同步输出语义解释。实验显示,平均只需推荐1.79个API即可达81.3%命中率,较最佳基线提升21.59%。该技术解决了传统固定Top-N推荐导致的冗余或缺配问题,显著提高API推荐准确性和效率,为Web开发提供更智能的API选择方案。

文章图片
#人工智能#大数据#架构 +1
程序员必看!RelayLLM:大模型“点餐“式协作,小模型精准求助,性能提升60%成本降低98%!

RelayLLM是一种创新的大模型协作推理框架,解决传统"全有或全无"策略的效率问题。它让小模型在生成过程中主动识别需要帮助的关键时刻,通过特殊指令仅在这些位置调用大模型,实现token级"接力"生成。实验显示,该方法能将小模型性能提升约60%,而计算开销仅增加1%,显著优于传统路由方法。这种精准协作机制不仅提高了效率,还使小模型内化了部分专家推理能力。

文章图片
#人工智能#架构#java +1
DeepSpeed大模型训练神器:微软开源加速库,小白也能秒变AI大神![特殊字符]

DeepSpeed是微软开源的大模型训练优化库,提供3D并行、梯度累积、混合精度训练等关键技术。其核心组件包括API、RunTime和Ops,通过ZeRO优化器状态分片技术显著降低显存占用,支持超大规模模型训练。文章详解了从安装配置、模型加载、数据处理到训练执行的完整流程,以及多机多卡分布式训练方案,为开发者提供了从零开始使用DeepSpeed进行大模型训练的全面指南。

文章图片
#人工智能#数据库#java +2
    共 1708 条
  • 1
  • 2
  • 3
  • 171
  • 请选择