logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从“通才”到“专家”:SFT与RLHF如何让你的AI真正“懂”你的业务?

在实际应用中,选择合适的微调技术,可以使AI模型在特定场景中发挥更强大的性能。无论是在电商、法律、旅游还是医疗等行业,微调技术的运用都能为企业带来更加精准的业务决策、更加个性化的用户体验,并进一步推动智能化应用的落地与发展。微调不仅是提高AI模型质量的技术手段,更是推动行业创新与发展的催化剂。在未来,随着AI技术的不断发展和成熟,微调技术将会在更多领域中发挥重要作用,帮助我们走向更加智能化的未来。

文章图片
#人工智能
大模型RAG | RAG技术演进全解析(三)Agentic RAG

架构上引入Agent的思路,实现动态决策(如是否检索、工具调用)和多轮迭代优化。相比上述提到的几种RAG,Agentic RAG将实际输入处理的多样性交给LLM处理,可以解决更复杂的问题。如何运作?从Modular RAG的架构来看,只要是涉及LLM的模块理论上都可以使用Agent来增强,但在该Agentic RAG架构中更多强调的是在retrievel模块中使用。在检索阶段,不同数据源可以视作不

文章图片
#AI#人工智能#RAG
一篇搞明白!推理大模型与普通大模型的区别是什么?

核心观点:别把推理大模型看成普通大模型的简单升级版!这是两种基于不同工作机制、训练方法和运行机制的AI模型。普通大模型,如ChatGPT、Qwen这些,工作流程是这样的:先用海量文本数据进行预训练,让它学会语言规律和各种知识;然后通过监督微调(SFT)和人类反馈的强化学习(RLHF)进行对齐。以我自己的使用经验来说,像ChatGPT这类通用模型很会聊天,多轮对话也没问题,但遇到需要一步步推理的任务

文章图片
#人工智能#AI
大模型RAG技术 | 一文解析RAG系统的十大核心组件

当被问及AI系统表现不佳的原因时,90%的情况下问题并不出在模型本身,而是源于RAG系统中被忽视的核心组件:低效的文本分块、劣质的检索结果或存在干扰的提示词。优秀的RAG系统不是靠调参炼出来的,而是通过精心设计系统架构实现的。掌握这10大核心组件后,你不仅能开发出更强大的LLM应用,更能打造出可靠、可信、可直接投产的用户级工具。

文章图片
#人工智能#RAG
TensorRT-YOLO:灵活易用的 YOLO 部署工具

TensorRT-YOLO 是一款专为 NVIDIA 设备设计的的推理部署工具。项目不仅集成了 TensorRT 插件以增强后处理效果,还使用了 CUDA 核函数以及 CUDA 图来加速推理。TensorRT-YOLO 提供了 C++ 和 Python 推理的支持,旨在提供的部署体验。包括 目标检测、实例分割、图像分类、姿态识别、旋转目标检测、视频分析等任务场景,满足开发者的部署需求。

文章图片
#人工智能
AI大模型面试题解析之LangChain&LlamaIndex面试高频考点,含核心概念与实战技巧!

本文全面介绍LangChain框架的核心概念与实战应用,包括Models、Prompts、Indexes、Memory、Chains、Agents六大组件,以及LCEL、RAG、ReAct等重要技术。: 将检索到的文本块作为上下文,与原始问题组合成一个增强的提示(Prompt),发送给LLM生成最终答案。:它简化了与大模型交互的流程,并提供了与外部数据源、工具(API、函数)和内存集成的标准化接口

文章图片
#人工智能#面试#AI
一文详解Graph RAG!

Graph RAG是微软开发的一种基于图数据库的检索增强生成(Retrieval-Augmented Generation)技术,它将传统的向量检索与图数据库的语义关系相结合,提供更精准的信息检索和生成能力。

文章图片
#人工智能#AI#RAG
大模型训练全流程:从预训练到PPO对齐的完整实战指南

本文详细介绍了大模型训练全流程,包括预训练、继续预训练、指令微调(SFT)、偏好对齐(DPO/ORPO/KTO)和强化学习对齐(PPO)。提供了基于Hugging Face/TRL/PEFT和ms-swift的代码实现,介绍了LoRA/QLoRA技术、数据格式与chat模板使用,以及评测部署方法。以Qwen模型为例,适用于其他大模型,适合不同GPU配置的学习者参考。说明。

文章图片
#人工智能
大模型实战 | RAG检索增强技术深度解析,构建高效知识库问答系统

RAG 的核心价值是 “让大模型基于真实信息回答”,其效果优化需贯穿 “文档准备→检索→生成” 全链路。新手入门时,可先按 “句子切片 + 内存向量存储 + 基础提示词” 搭建最小原型,再逐步通过 “问题改写、重排序、知识库补充” 提升效果。在生产环境中,优先选择云服务向量数据库和专业 Embedding 模型,兼顾性能与运维效率。

文章图片
#人工智能#RAG
大模型论文 | 腾讯发布DRT-o1,引入长思维链,精准翻译文学作品

近年来,O1模型成为展示长链思维(Chain-of-Thought, CoT)在数学和编程等推理任务中效果的典型代表。在此基础上,我们推出了DRT-o1,旨在将长CoT的优势引入神经机器翻译(Neural Machine Translation, NMT)。特别是对于文学作品中涉及的比喻和隐喻,由于文化差异的存在,将其准确翻译成目标语言是一项挑战。实际操作中,直译通常无法有效传达作者的意图,即便是

文章图片
#人工智能#深度学习
    共 1343 条
  • 1
  • 2
  • 3
  • 135
  • 请选择