登录社区云,与社区用户共同成长
邀请您加入社区
习题7.1:习题7.2:如有看到的同学,请先自己做题,再与下面的答案进行对照——————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————我是分割线———
ERNIE-4.5-VL-28B-A3B正是百度推出的一款多模态 MoE(Mixture of Experts)大模型,融合了图像识别、语言理解与推理能力,在多模态对话场景中表现出色。该模型拥有 28B 总参数量,但采用 MoE 架构,每次仅激活3B 参数,大幅提升推理效率和响应速度。支持包括图像描述、图文问答、多模态思维链推理(Chain-of-Thought)、结构化信息提取等多种任务,特别适
生产级 Agent 的落地关键不只是模型或框架,而是模型、数据、工具、算力、芯片、终端与场景之间的系统协同。大量合同、制度、SOP、表格、扫描件与长图,仍停留在邮件附件、本地磁盘和非结构化文档中,难以被稳定引用、统一管理,也难以接入权限、版本与审计链路。百度文心飞桨、星河社区将继续携手 OceanBase、LangChain 及更多生态伙伴,为开发者提供更易用的模型能力、更完整的工程入口与更开放的
本文介绍了基于PaddleOCR-2.7框架的OCR模型训练流程,主要包括环境配置、数据标注、文本检测和识别训练四个部分。首先配置了CUDA 11.6环境并安装PaddlePaddle和相关依赖。其次使用PPOCRLabel工具进行数据标注,生成训练所需的Label.txt和rec_gt.txt文件。然后详细说明了文本检测模型的训练过程,包括配置文件修改、训练执行、模型验证和导出。最后介绍了文本识
在用命令paddleocr text_detection -i ./data/test/plateimages --model_name PP-OCRv5_mobile_det测试的时候出现了问题。8、按照上面的方式只能测试pp-ocrv3和pp-ocrv4,测试不了pp-ocrv5。下载download_ch.md,在这个里面发现了pp-ocrv5模型的下载。说是卸载,按照下面这个文档重新安装,
大模型技术(如RAG、Agent等)作为当前人工智能领域的前沿方向,依然具有广阔的发展前景和就业机会。
本文作者-是 Yu 欸,华科在读博士生,定期记录并分享所学知识,博客关注者5w+。本文将详细介绍如何在 PaddlePaddle 中利用稀疏计算应用稀疏 ResNet,涵盖稀疏数据格式的础知识、如何创建和操作稀疏张量,以及如何开发和训练稀疏神经网络模型。项目完整代码已上传至飞桨星河社区:https://aistudio....
3.File->New->Import Project打开Paddle-Lite-Demo\object_detection\android\app\cxx\ssd_mobilenetv1_detection_demo点击运行。mkdir -p /你的目录/Paddle-Lite/ch_PP-OCRv4_det_infer/nbmodel/--model_file=/你的路径/nbmodel/in
摘要:本文介绍了如何使用ATC工具将ONNX模型转换为NPU可执行的OM文件。ATC不仅进行格式转换,还涉及算子验证、图优化和量化处理。文章详细讲解了ATC命令行使用方法,包括静态/动态shape转换、精度模式选择(fp16/fp32)、算子融合优化以及AIPP预处理模块配置。通过实际案例说明常见问题(如动态shape报错)和性能优化技巧,帮助开发者高效部署模型到NPU硬件。
本文介绍了将PaddlePaddle模型转换为ONNX格式的方法。指出新版本Paddle2ONNX(2.1.0)使用inference.json文件而非旧版的model.pdmodel文件。文章详细说明了转换命令格式,并提供了三个具体转换示例(文本检测、识别和方向分类模型)。同时给出了官方模型下载链接和转换后的效果展示。注意事项部分强调版本兼容性:PaddlePaddle需≥3.0.0且≤3.1.
围绕英特尔酷睿Ultra硬件平台与OpenVINO™ 推理加速工具链,结合飞桨框架与FastDeploy极速部署能力,深度拆解多模态模型在通用算力设备上的适配逻辑、提速技巧与性能调优策略,详解产业级AI部署的技术要点与工程难题解法。聚焦飞桨开源技术体系、文心大模型多模态能力与英特尔oneAPI全栈开发生态,解读软硬件协同适配的底层逻辑,展示通用算力环境下,文档智能识别、图文解析、结构化提取等AI应
之前帮一个团队做 PaddlePaddle 模型迁移,他们用的是 PP-YOLOe 做目标检测,在 GPU 上跑得好好的,换成昇腾NPU 后直接报了一堆算子不支持的错误。,把 PaddlePaddle 的算子映射成昇腾CANN 的算子。
最新的ppocrv5模型训练过程,搭配上一个环境配置的文章使用。训练之前我已经用paddlelabel标注好了五百多张图片,我训练模型是为了识别书脊的文字。
PaddleOCR是基于PaddlePaddle深度学习框架的OCR工具,支持多语言文本识别。使用PaddleOCR提取图片中的文字主要包括以下步骤:首先安装PaddleOCR及其依赖项,然后在Python脚本中导入并初始化OCR模型。加载图片后,使用PaddleOCR进行文字识别,识别结果包含每行文字及其位置信息。可以通过解析结果获取文字内容和置信度,并将结果保存到文件中。此外,PaddleOC
在使用PaddlePaddle进行深度学习开发时,选择合适的CUDA和cuDNN版本至关重要。首先,确定所需PaddlePaddle版本,然后安装相应版本的CUDA和cuDNN。常见问题包括驱动未更新导致CUDA安装失败,需先更新NVIDIA驱动。安装过程中,注意版本匹配,例如PaddlePaddle 2.3.2对应CUDA 11.6。安装完成后,通过命令行验证CUDA和cuDNN是否成功安装。此
它主要关注与计算资源直接相关的开支,如服务器和网络设备的购置费用、电力和冷却成本、日常维护和管理人员的费用,以及必要的软件授权费用。指通过使用大规模异构算力资源,包括通用算力(CPU) 和智能算力(GPU、FPGA、ASIC 等),主要为人工智能应用 (如人工智能深度学习模型开发、模型训练和模型推理等场景) 提供所需算力、数据和算法的设施。硬件架构设计是产品设计初期的关键步骤,尤其对于复杂度较高的
经典模型可以满足一些简单深度学习任务的需求,然后更多情况下,需要使用深度学习框架构建一个自己的神经网络,这时可以使用飞桨框架paddle.nn下的 API 构建网络,该目录下定义了丰富的神经网络层和相关函数 API,如卷积网络相关的 Conv1D、Conv2D、Conv3D,循环神经网络相关的 RNN、LSTM、GRU 等,方便组网调用,详细清单可在API 文档中查看。使用组网:构建顺序的线性网络
注:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文档详细介绍了在Windows环境下,使用飞桨OCR进行数据标注、模型二次训练、服务部署的全过程。包括创建虚拟环境、安装依赖、下载官方模型、使用PPOCRLabel进行数据打标、训练文本检测与识别模型、模型评估,以及在Linux下基于PDServing部署识别服务。此外,还提供了基于Sanic构建的解析服务示例
2026年1月29日,“AI4Science 前沿:材料研发计算新范式——国产算力×深度学习框架技术沙龙·上海站”在张江百度飞桨人工智能产业赋能中心举办。本次活动由百度飞桨与沐曦联合主办,聚焦 AI for Science(AI4S)在材料科学领域的最新应用。来自高校、科研院所及企业的数十位开发者与技术专家齐聚一堂,共同探讨国产算力与深度学习框架如何协同推动材料研发的创新。
本文系统介绍了百度PaddleOCR工具库的核心功能与应用实践。作为基于飞桨框架的轻量级OCR解决方案,PaddleOCR具备多语言支持、角度自适应和高精度识别等特点。文章通过三个典型场景演示:静态图片多语言识别(日语示例)、OpenCV可视化标注(英文示例)以及摄像头实时中文检测,详细解析了API调用、结果解析、坐标转换等关键技术点,并针对中文显示问题提供了Pillow库的解决方案。这些案例覆盖
基于WPF&OpenCV的高级显示控件2.0是一款面向图像可视化与交互操作的专业控件库,采用.NET Framework 4.8框架开发,融合WPF的高效UI渲染能力与OpenCV的强大图像处理功能。控件支持图像拖入显示、多类型绘图对象交互、图像特效处理等核心功能,通过WPF的Adorner和Thumb组件实现绘图对象的拖拽、缩放、旋转等交互操作,适用于机器视觉、图像分析、工业检测等场景。颜色自定
本文提出了一种针对小型企业需求的低成本单证识别方案,采用PaddleOCR+YOLOv8技术栈,重点解决了单证多角度倾斜矫正和文本区域精准检测两大核心痛点。方案创新性地使用PaddleOCR双阶段矫正(粗调+精调)技术,结合YOLOv8小样本目标检测,在RTX2060等消费级显卡上即可实现高效识别。相比传统方案,该方法显著降低了标注工作量(仅需50张样本)和硬件成本,同时保证了护照等制式证件关键字
paddlepaddle
——paddlepaddle
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net