
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
检索增强生成(RAG,Retrieval-Augmented Generation) 作为前沿的人工智能技术框架,创造性地融合了大规模语言模型(LLM)与外部知识源检索功能,致力于提升模型在问答与内容生成方面的表现。它通过从外部知识库提取相关信息,为语言模型输出注入更精准、更具深度的上下文信息,使模型响应更贴合实际需求。从技术内核来看,RAG 的本质是 InContext Learning,可简单

大模型生态系统通过分层技术(Prompt优化输入、RAG增强知识、Agent实现自主)逐步解决模型幻觉、知识局限和动态适应问题。未来发展方向包括更高效的代理协作、多模态融合及闭环优化机制,最终推动AI向AGI演进。

AIGC的全称为“Artificial Intelligence Generated Content”,中文翻译为“人工智能生成内容”。这是一种新的创作方式,利用人工智能技术来生成各种形式的内容,包括文字、音乐、图像、视频等大模型与AIGC的关系大模型与AIGC之间的关系可以说是相辅相成、相互促进的。大模型为AIGC提供了强大的技术基础和支撑,而AIGC则进一步推动了大模型的发展和应用AIGC应用

Qwen3的发布不仅是技术突破,更是一场开源生态的胜利。正如阿里CEO吴泳铭所言:“开源是AI普惠的基石。” 从春晚舞台到矿山深处,从开发者社区到全球市场,Qwen3正在重新定义AI的未来。

RAG是一种将外部知识库检索与生成模型相结合的技术,不过最近的Agent,MCP喧嚣至上,包括DS-R1模型的热度,让RAG的技术热度下降了很多。甚至我和一些AI的从业者讨论基本技术的时候,大家对RAG嗤之以鼻。其实RAG一点都不简单,我今天就总结了一下RAG的经常遇到的“左右手”怎么选的问题,算是给自己的学习做个总结。

GPT在处理Prompt时,GPT模型将输入的文本(也就是Prompt)转换为一系列的词向量。 然后,模型通过自回归生成过程逐个生成回答中的词汇。在生成每个词时,模型会基于输入的Prompt以及前面生成的所有词来进行预测。

RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了信息检索和文本生成的技术框架,旨在通过引入外部知识库来提升生成模型(如GPT等)的准确性和可靠性。RAG知识库是这一技术的核心组成部分,它存储了结构化或非结构化的海量数据(如文档、网页、数据库等),供模型在生成答案时动态检索并参考。

用DeepSeek的方法做微调,可以显著提升传统模型的思考能力。这是我训练好的模型文件,已经传到Hugging Face上了,大家自取。它是基于Qwen2.5 3B,通过微调加强了数学能力,最后生成了Q4、Q5和Q8三个版本。咱们来对比一下Q4精度的效果。我问一个经典问题:9.9和9.11这两个数字,哪个更大?先来看原版的回答。不仅答案错了,而且给的理由也是完全混乱的——什么叫“小数部分相同,唯一
凌晨2点,梅大高速的一个不起眼路段,车速突然下降,异常停车数量激增。没有摄像头感知,没有人工报警,但百度的交通大模型却在第一时间捕捉到了这些异常。15分钟后,救援车辆已赶到现场,而此时,第一通报警电话才刚刚拨出。这是大模型赋能交通行业的一个经典场景,也揭示了未来智慧交通的无限可能。

在银行业数字化、智能化发展的过程中,数字员工成为发展数字金融的重要应用载体,正在重塑银行业的服务模式和创新能力. 数字员工已经历基于流程自动化的1.0时代、基于“RPA+传统人工智能应用”的2.0时代,2023年,大模型驱动的生成式人工智能技术掀起新的发展浪潮,数字员工正迈向基于大模型和智能体的3.0时代.数字员工3.0以更贴近人类的方式进行交流和互动,智能化能力和拟人化水平大幅提升,成为推动银行








