logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型开发新姿势!通义千问3.0保姆级教程:从零开始构建智能RAG系统,小白也能秒变AI大神!

本文介绍通义千问3.0系列模型,特别是拥有256K超长上下文的Qwen3-4B模型。文章通过代码示例和实际应用,指导读者如何利用这些模型的嵌入和重排功能,构建完整的检索增强生成(RAG)系统,实现智能问答功能,适合大模型开发者和编程初学者学习参考。

文章图片
#人工智能#AIGC#架构 +2
AI开发必看!RAG技术大揭秘:从基础版到智能体,一张图搞定三种RAG的区别

文章详解了三种RAG技术的区别:基础RAG按简单流程执行,像"三好学生";Self-RAG增加了自我反思机制,会检查信息可靠性和答案质量;Agentic RAG则像"超级大脑",能自主决策选择不同路径。三者从简单高效到灵活强大,代表了RAG技术的进化历程,帮助开发者根据需求选择合适方案。

文章图片
#人工智能#机器学习#数据挖掘 +3
爆肝整理!大模型上下文工程十大核心技巧,让你轻松构建高效智能代理

Anthropic最新上下文工程报告提出十大关键理念,强调将上下文视为有限资源需动态管理。核心包括:精选高信号信息、设计简洁系统提示、优化工具行为、使用高质量少样本示例、支持即时上下文检索、混合检索策略、长时程代理行为、渐进式信息披露,以及动态迭代优化上下文。这些方法帮助开发者构建更智能高效的智能代理系统。

文章图片
#人工智能#算法#开发语言 +3
大模型输出像开盲盒?一文解锁7个隐藏参数,让AI代码生成精准如狙击手

文章详细解析了控制大型语言模型输出的七大核心参数:Temperature控制随机性与确定性;Top-p和Top-k限制采样范围;Max Tokens和Stop Sequences控制输出长度和终止条件;Frequency Penalty和Presence Penalty防止重复并鼓励多样性。通过组合调整这些参数,可实现从严谨任务到创意写作的精准控制,是提升大模型应用性能的关键技能。

#人工智能#人机交互#算法 +1
代码生成只是开始,AI Agent才是未来!CSDN独家揭秘,如何用多代理工作流提升40%开发效率

从生成式AI到代理式AI的演进正在改变编程开发领域。多代理工作流通过链式连接多个AI代理,能更好地处理复杂任务。市场上有LangGraph、CrewAI、IBM Watson和Amazon Bedrock AgentCore等解决方案,各有优势和局限。未来,AI的发展将从生成响应转向协调协作的代理,转变各行业工作方式。

文章图片
#人工智能#科技#python +2
【爆肝整理】LLM应用开发五层架构全解析!附爆火工具箱,小白也能入门高阶AIGC!

本文详细解析了LLM应用开发的五层技术架构:基础设施层、模型层、数据与集成层、逻辑层和前端用户界面。每层都有其特定角色、关键内容和功能重要性。文章还提供了各层常用工具清单,并指导如何利用这些架构规划LLM应用。这张技术地图为开发者提供了清晰的开发路线,帮助他们从零开始构建复杂的AI应用,是成为LLM应用架构师的重要参考。

文章图片
#架构#AIGC#人工智能 +3
[特殊字符]提示词时代已过!大牛们都在构建AI Agent,五大架构层详解,让AI真正“自主思考“!

文章揭秘AI Agent的五大核心架构层:认知与推理层实现智能思考规划;语言与理解层促进人类沟通;自动化与执行层将思考付诸行动;记忆与知识层让AI能学习和进化;协作与环境层使其融入真实世界。这标志着AI从被动工具向能自主思考、规划、行动甚至协作的"数字员工"转变,开发者掌握这五层架构,可从"会用"AI升级到"会造"AI,构建真正的下一代智能系统。

#人工智能#架构#mysql +2
大模型开发必学!上下文工程全攻略:从提示词到智能体,小白也能秒变AI大神

上下文工程是提示词工程的演进,关注如何在有限的上下文窗口中筛选和管理最有效的tokens。文章探讨了上下文工程与提示词工程的区别,解释了其对构建高效AI智能体的重要性,并介绍了高效上下文的核心构成(系统提示词、工具、示例等)。此外,还详细讨论了上下文检索策略和长期任务的上下文工程技术(压缩、结构化笔记、子智能体架构)。核心原则是找到最小规模的高价值tokens,最大程度确保预期结果。

文章图片
#人工智能#大数据#架构 +2
【震惊】斯坦福ACE框架大杀器!小模型秒杀GPT-4,智能体告别“失忆症“,附完整代码实现

斯坦福大学与SambaNova联合推出的ACE框架解决了智能体开发中上下文坍缩和简洁性偏差两大痛点。该框架通过生成-反思-整理三大组件形成闭环,将静态提示词升级为动态演化式操作手册,实现增量更新避免信息丢失。测试显示,基于开源模型的ACE性能媲美GPT-4.1,适配延迟降低86.9%,令牌成本减少83.6%,为开发者提供了一种低成本、高效能的智能体自改进方案。

文章图片
#人工智能#算法#大数据 +2
RAG优化黑科技:让大模型“找得到、答得好“,AI开发者的进阶之路

文章系统介绍了RAG(检索增强生成)技术的优化方法,围绕"检索器→索引与分块→生成器"三大核心环节展开。详细阐述了混合检索、两阶段检索、语义分块、Prompt工程等关键技术,以及向量库调优、数据优化等系统级优化方案,为企业落地RAG系统提供全面指导,旨在解决检索不准、不全和生成不稳等问题,提升AI应用性能。

文章图片
#人工智能#科技#python +4
    共 1419 条
  • 1
  • 2
  • 3
  • 142
  • 请选择