
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
大语言模型技术迅猛发展的脚步,正引领着信息检索技术进入一个新的纪元。在这一领域中, RAG 技术将传统信息检索技术与大语言模型技术相结合,为知识理解、知识获取提供了全新的解决方案。然而,尽管 RAG 在很多任务上表现出色,其在深度应用上仍面临诸多挑战。在日前的 InfoQ 《极客有约》X AICon 直播中,我们邀请到了阿里巴巴总监 & TGO 鲲鹏会学员阿里云高级算法专家、英飞流 CEO、合合信
在使用大模型处理书籍 PDF 时,有时你会遇到扫描版 PDF,也就是说每一页其实是图像形式。这时,大模型需要先从图片中提取文本,而这就需要借助 OCR(光学字符识别)技术。``像 Gemini 2.5 这样的强大模型,具备非常强的从图片中提取文本的能力。实际上,我们完全可以利用它来执行 OCR 任务。

一句话介绍就是:基于开源大模型 + 知识库的 Code Review 实践,类似一个代码评审助手(CR Copilot)。飞书文档没有格式要求,能看懂正确代码是怎样就行这里直接使用 LangChain 提供的LarkSuitechunk_size: 控制每个块的长度。例如设置为 1024,则每个块包含 1024 个字符。: 控制相邻两个块之间的重叠长度。例如设置为 128,则每个块会与相邻块重叠

一个大语言模型微调工具箱。由 MMRazor 和 MMDeploy 联合开发。以数据集为例基于 InternLM-chat-7B 模型,用 MedQA 数据集进行微调,将其往医学问答领域对齐。此时,我们重新建一个文件夹来玩“微调自定义数据集”把前面下载好的internlm-chat-7b模型文件夹拷贝过来。别忘了把自定义数据集,即几个.jsonL,也传到服务器上。

在 LangChain 中,Agent 通过调用 LLM(Language Logic Model)和各种工具来完成用户的指令,这种设计使得 Agent 能够处理各种复杂的任务,并且可以通过添加新的工具来扩展其功能。LangChain 的 Agents 概念,就是针对于类似的场景,结合 LLM,可以自动帮你进行处理,需要走具体哪个服务,这个服务需要什么参数,从而给出对应的输出。,但是用户输入的格式

在 RAG 流程中,如何实现基于 Bad Cases(负面案例)的合同审查和合同生成(基于合同模板)的提问,算是一个很有代表性的进阶 RAG 应用方向,这篇针对其中的合同审查场景来做些介绍和演示。

本文深入解析了知识图谱如何有效缓解大模型RAG系统中的内外部知识冲突,以及多模态文档处理中表格识别的前沿技术。通过结构化知识图谱筛选可靠信息和创新的表格处理方法,帮助开发者提升大模型应用的准确性和可靠性。无论您是RAG系统开发者还是文档处理研究者,这些技术思路都将为您的项目提供实用参考。本文来源于网络,由于如有侵权,请联系删除。今天是2025年11月14日,星期五,北京,天气晴继续回到RAG和文档

步骤内容第一步新建应用,选择聊天助手第二步填写应用基础信息第三步设计提示词第四步配置用户输入字段(可选)第五步测试并发布零代码搭建专属聊天助手,就是这么简单!大模型作为新时代的风口,确实为那些希望转行或寻求职业突破的人提供了广阔的舞台。然而,是否选择进入这一领域还需综合考虑自身的兴趣、特长以及长远规划。通过构建基础知识体系、参与实际项目、拓展软技能、关注跨学科融合以及建立广泛的社交网络,你可以在这

系列编程实践教程,源自上海交通大学2024年春季《人工智能安全技术》课程讲义的深度拓展,由资深教师张倬胜精心打造。本教程专注于为大模型领域提供详尽的入门编程指导,以简洁明了的实践项目为载体,助力同学们迅速掌握大模型核心要义,为其后续的课程设计与学术研究筑牢根基,开启大模型探索之旅。该教程内容较为专业,理解起来有一定难度,因此。当然,若想深入透彻地理解,建议读者按照教程亲自进行实践操作。此外,想要获

大语言模型的进展催生出了ChatGPT这样的应用,让大家对“第四次工业革命”和“AGI”的来临有了一些期待,LLM和视觉的结合也越来越多:比如把LLM作为一种通用的接口,把视觉特征序列作为文本序列的PrefixToken,一起作为LLM的输入,得到图片或者视频的caption;也有把LLM和图片生成模型、视频生成模型结合的工作,以更好控制生成的内容。当然2023年比较热门的一个领域便是多模态大模型








