logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

本地部署大模型实现扫描版PDF文件OCR 识别,笔记本可跑

在使用大模型处理书籍 PDF 时,有时你会遇到扫描版 PDF,也就是说每一页其实是图像形式。这时,大模型需要先从图片中提取文本,而这就需要借助 OCR(光学字符识别)技术。``像 Gemini 2.5 这样的强大模型,具备非常强的从图片中提取文本的能力。实际上,我们完全可以利用它来执行 OCR 任务。

文章图片
#人工智能#自然语言处理#AI
基于大模型 + 知识库的 Code Review 实践

一句话介绍就是:基于开源大模型 + 知识库的 Code Review 实践,类似一个代码评审助手(CR Copilot)。飞书文档没有格式要求,能看懂正确代码是怎样就行这里直接使用 LangChain 提供的LarkSuitechunk_size: 控制每个块的长度。例如设置为 1024,则每个块包含 1024 个字符。: 控制相邻两个块之间的重叠长度。例如设置为 128,则每个块会与相邻块重叠

文章图片
#代码复审#人工智能#自然语言处理
[AI大模型学习笔记]XTuner 大模型单卡低成本微调实战

一个大语言模型微调工具箱。由 MMRazor 和 MMDeploy 联合开发。以数据集为例基于 InternLM-chat-7B 模型,用 MedQA 数据集进行微调,将其往医学问答领域对齐。此时,我们重新建一个文件夹来玩“微调自定义数据集”把前面下载好的internlm-chat-7b模型文件夹拷贝过来。别忘了把自定义数据集,即几个.jsonL,也传到服务器上。

文章图片
#人工智能#学习#开发语言
AI大模型简史:萌芽、沉淀、爆发

近一年来,随着ChatGPT爆火,大模型热潮席卷全球并持续升温,国内越来越多的知名高校、科研院所和创新型企业加大研究力度,大模型技术不断迭代升级,模型能力不断加强,逐渐形成从底层算力、模型开发到行业应用的新兴产业,大模型也从语言文本,到音视图文,再到动作行为,最终将走向人类社会往人机共生的社会。PART 01。

文章图片
#人工智能#语言模型#自然语言处理
一文搞懂大模型的预训练(Pre-training)

今天来聊一聊BERT和GPT的预训练,从而了解大模型的第四步:Pre-training。预训练(Pre-training)是大语言模型(如BERT、GPT)训练的第一阶段,其核心目标是通过自监督学习从海量无标注文本中学习通用的语言表示(Language Representation)。这一阶段的目标是让模型掌握语言的语法、语义、常识等基础能力,为后续的微调(Fine-tuning)打下基础。

文章图片
#人工智能
基于 GPT 实现 Agent ️

在 LangChain 中,Agent 通过调用 LLM(Language Logic Model)和各种工具来完成用户的指令,这种设计使得 Agent 能够处理各种复杂的任务,并且可以通过添加新的工具来扩展其功能。LangChain 的 Agents 概念,就是针对于类似的场景,结合 LLM,可以自动帮你进行处理,需要走具体哪个服务,这个服务需要什么参数,从而给出对应的输出。,但是用户输入的格式

文章图片
#数据库#人工智能
基于Bad Cases的Dify合同审查案例演示(工作流拆解)

在 RAG 流程中,如何实现基于 Bad Cases(负面案例)的合同审查和合同生成(基于合同模板)的提问,算是一个很有代表性的进阶 RAG 应用方向,这篇针对其中的合同审查场景来做些介绍和演示。

文章图片
#人工智能#自然语言处理#AI
【值得收藏】2025最新:知识图谱缓解RAG冲突+多模态文档表格处理技术详解

本文深入解析了知识图谱如何有效缓解大模型RAG系统中的内外部知识冲突,以及多模态文档处理中表格识别的前沿技术。通过结构化知识图谱筛选可靠信息和创新的表格处理方法,帮助开发者提升大模型应用的准确性和可靠性。无论您是RAG系统开发者还是文档处理研究者,这些技术思路都将为您的项目提供实用参考。本文来源于网络,由于如有侵权,请联系删除。今天是2025年11月14日,星期五,北京,天气晴继续回到RAG和文档

文章图片
#知识图谱#人工智能
Dify 实战教程 | 10分钟搭建你的聊天助手(旅游顾问)

步骤内容第一步新建应用,选择聊天助手第二步填写应用基础信息第三步设计提示词第四步配置用户输入字段(可选)第五步测试并发布零代码搭建专属聊天助手,就是这么简单!大模型作为新时代的风口,确实为那些希望转行或寻求职业突破的人提供了广阔的舞台。然而,是否选择进入这一领域还需综合考虑自身的兴趣、特长以及长远规划。通过构建基础知识体系、参与实际项目、拓展软技能、关注跨学科融合以及建立广泛的社交网络,你可以在这

文章图片
#人工智能#RAG
全面解读 AI 实践系列课程:动手学大模型(含课件下载)

系列编程实践教程,源自上海交通大学2024年春季《人工智能安全技术》课程讲义的深度拓展,由资深教师张倬胜精心打造。本教程专注于为大模型领域提供详尽的入门编程指导,以简洁明了的实践项目为载体,助力同学们迅速掌握大模型核心要义,为其后续的课程设计与学术研究筑牢根基,开启大模型探索之旅。该教程内容较为专业,理解起来有一定难度,因此。当然,若想深入透彻地理解,建议读者按照教程亲自进行实践操作。此外,想要获

文章图片
#人工智能#计算机视觉#深度学习 +1
    共 537 条
  • 1
  • 2
  • 3
  • 54
  • 请选择