logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek 不能看图怎么办?Claude Code 看图+读 PDF 完整方案(含一键部署)

看图:图片 → base64 → 千问 VL → 文字 → DeepSeek读 PDF(文字):pdfjs-dist 提取文本 → 直接喂读 PDF(图形):pdfjs-dist 渲染成 PNG → 走看图流程把 DeepSeek 不认识的格式,在外面转成纯文本再给它。这套方案不限于嵌入式开发,任何用纯文本模型做复杂任务的场景都适用。

#DeepSeek#AI
DeepSeek 不能看图怎么办?Claude Code 看图+读 PDF 完整方案(含一键部署)

看图:图片 → base64 → 千问 VL → 文字 → DeepSeek读 PDF(文字):pdfjs-dist 提取文本 → 直接喂读 PDF(图形):pdfjs-dist 渲染成 PNG → 走看图流程把 DeepSeek 不认识的格式,在外面转成纯文本再给它。这套方案不限于嵌入式开发,任何用纯文本模型做复杂任务的场景都适用。

#DeepSeek#AI
DeepSeek 不能看图怎么办?Claude Code 看图+读 PDF 完整方案(含一键部署)

看图:图片 → base64 → 千问 VL → 文字 → DeepSeek读 PDF(文字):pdfjs-dist 提取文本 → 直接喂读 PDF(图形):pdfjs-dist 渲染成 PNG → 走看图流程把 DeepSeek 不认识的格式,在外面转成纯文本再给它。这套方案不限于嵌入式开发,任何用纯文本模型做复杂任务的场景都适用。

#DeepSeek#AI
到底了