logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【Datawhale AI 夏令营】2025多模态RAG方向 - Task3 调整方案,进阶上分

本文记录了参与AI夏令营多模态RAG方向的学习过程。项目目标是构建基于图文混排PDF的可溯源问答系统,主要挑战包括多模态信息融合、精准检索和细粒度信息抽取。针对baseline存在的文档解析粗糙、分块策略单一等问题,提出了多维度优化方案:1)改用MinerU解析工具提取结构化内容;2)优化分块策略并引入重排机制;3)对Embedding模型和LLM进行领域微调;4)实施全量测试数据运行。文章还探讨

文章图片
#人工智能#python#语言模型
到底了