logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

FastGPT中文文件名上传乱码——python代码

【摘要】本文针对FastGPT中文文件名上传乱码问题提出解决方案。关键发现服务端需URL编码(Percent-encoding)而非RFC2231或UTF-8原始字节。通过Python的quote_plus()模拟Java URLEncoder,结合requests自动处理文件句柄,完美匹配服务端预期。方案包含重试机制、完整响应日志及批量导入功能,经测试成功解决中文PDF上传乱码问题。技术亮点包括

文章图片
#python
【OpenAgents 实战踩坑指南】从环境配置到多模型适配全流程

摘要:本文总结了在Windows环境下部署OpenAgents框架时常见的编码兼容、环境变量配置及大模型适配问题。主要问题包括Windows终端GBK编码导致Emoji符号报错,可通过修改系统为UTF-8编码解决;环境变量命名规则混淆(DEFAULT_*与OPENAI_*前缀的区分)导致模型调用失败;阿里通义千问和火山引擎方舟等第三方模型的适配错误,涉及模型名、接口地址和变量名的精准匹配。文章提供

文章图片
#github
使用大模型提取论文关键词对应值的一些思考

本文总结了利用大模型从科学文献PDF中提取关键词和对应值的实践经验。通过PDF转文本、关键词提取和提示词优化,正确率从初始较低水平提升至95%。关键改进包括:1)采用LaTeX标准格式处理化学符号;2)优化提示词策略,增加对比表、差异表和值范围表;3)建立三级提取验证流程(生成者-评审者-仲裁者);4)使用PaddleOCR将PDF转为结构化Markdown格式。研究发现模型选择(闭源优于开源)、

文章图片
#python#java#paddlepaddle +3
到底了