登录社区云,与社区用户共同成长
邀请您加入社区
ERNIE-4.5-VL-28B-A3B正是百度推出的一款多模态 MoE(Mixture of Experts)大模型,融合了图像识别、语言理解与推理能力,在多模态对话场景中表现出色。该模型拥有 28B 总参数量,但采用 MoE 架构,每次仅激活3B 参数,大幅提升推理效率和响应速度。支持包括图像描述、图文问答、多模态思维链推理(Chain-of-Thought)、结构化信息提取等多种任务,特别适
生产级 Agent 的落地关键不只是模型或框架,而是模型、数据、工具、算力、芯片、终端与场景之间的系统协同。大量合同、制度、SOP、表格、扫描件与长图,仍停留在邮件附件、本地磁盘和非结构化文档中,难以被稳定引用、统一管理,也难以接入权限、版本与审计链路。百度文心飞桨、星河社区将继续携手 OceanBase、LangChain 及更多生态伙伴,为开发者提供更易用的模型能力、更完整的工程入口与更开放的
本文介绍了基于PaddleOCR-2.7框架的OCR模型训练流程,主要包括环境配置、数据标注、文本检测和识别训练四个部分。首先配置了CUDA 11.6环境并安装PaddlePaddle和相关依赖。其次使用PPOCRLabel工具进行数据标注,生成训练所需的Label.txt和rec_gt.txt文件。然后详细说明了文本检测模型的训练过程,包括配置文件修改、训练执行、模型验证和导出。最后介绍了文本识
在用命令paddleocr text_detection -i ./data/test/plateimages --model_name PP-OCRv5_mobile_det测试的时候出现了问题。8、按照上面的方式只能测试pp-ocrv3和pp-ocrv4,测试不了pp-ocrv5。下载download_ch.md,在这个里面发现了pp-ocrv5模型的下载。说是卸载,按照下面这个文档重新安装,
大模型技术(如RAG、Agent等)作为当前人工智能领域的前沿方向,依然具有广阔的发展前景和就业机会。
本文作者-是 Yu 欸,华科在读博士生,定期记录并分享所学知识,博客关注者5w+。本文将详细介绍如何在 PaddlePaddle 中利用稀疏计算应用稀疏 ResNet,涵盖稀疏数据格式的础知识、如何创建和操作稀疏张量,以及如何开发和训练稀疏神经网络模型。项目完整代码已上传至飞桨星河社区:https://aistudio....
3.File->New->Import Project打开Paddle-Lite-Demo\object_detection\android\app\cxx\ssd_mobilenetv1_detection_demo点击运行。mkdir -p /你的目录/Paddle-Lite/ch_PP-OCRv4_det_infer/nbmodel/--model_file=/你的路径/nbmodel/in
摘要:本文介绍了如何使用ATC工具将ONNX模型转换为NPU可执行的OM文件。ATC不仅进行格式转换,还涉及算子验证、图优化和量化处理。文章详细讲解了ATC命令行使用方法,包括静态/动态shape转换、精度模式选择(fp16/fp32)、算子融合优化以及AIPP预处理模块配置。通过实际案例说明常见问题(如动态shape报错)和性能优化技巧,帮助开发者高效部署模型到NPU硬件。
本文介绍了将PaddlePaddle模型转换为ONNX格式的方法。指出新版本Paddle2ONNX(2.1.0)使用inference.json文件而非旧版的model.pdmodel文件。文章详细说明了转换命令格式,并提供了三个具体转换示例(文本检测、识别和方向分类模型)。同时给出了官方模型下载链接和转换后的效果展示。注意事项部分强调版本兼容性:PaddlePaddle需≥3.0.0且≤3.1.
围绕英特尔酷睿Ultra硬件平台与OpenVINO™ 推理加速工具链,结合飞桨框架与FastDeploy极速部署能力,深度拆解多模态模型在通用算力设备上的适配逻辑、提速技巧与性能调优策略,详解产业级AI部署的技术要点与工程难题解法。聚焦飞桨开源技术体系、文心大模型多模态能力与英特尔oneAPI全栈开发生态,解读软硬件协同适配的底层逻辑,展示通用算力环境下,文档智能识别、图文解析、结构化提取等AI应
之前帮一个团队做 PaddlePaddle 模型迁移,他们用的是 PP-YOLOe 做目标检测,在 GPU 上跑得好好的,换成昇腾NPU 后直接报了一堆算子不支持的错误。,把 PaddlePaddle 的算子映射成昇腾CANN 的算子。
最新的ppocrv5模型训练过程,搭配上一个环境配置的文章使用。训练之前我已经用paddlelabel标注好了五百多张图片,我训练模型是为了识别书脊的文字。
PaddleOCR是基于PaddlePaddle深度学习框架的OCR工具,支持多语言文本识别。使用PaddleOCR提取图片中的文字主要包括以下步骤:首先安装PaddleOCR及其依赖项,然后在Python脚本中导入并初始化OCR模型。加载图片后,使用PaddleOCR进行文字识别,识别结果包含每行文字及其位置信息。可以通过解析结果获取文字内容和置信度,并将结果保存到文件中。此外,PaddleOC
在使用PaddlePaddle进行深度学习开发时,选择合适的CUDA和cuDNN版本至关重要。首先,确定所需PaddlePaddle版本,然后安装相应版本的CUDA和cuDNN。常见问题包括驱动未更新导致CUDA安装失败,需先更新NVIDIA驱动。安装过程中,注意版本匹配,例如PaddlePaddle 2.3.2对应CUDA 11.6。安装完成后,通过命令行验证CUDA和cuDNN是否成功安装。此
它主要关注与计算资源直接相关的开支,如服务器和网络设备的购置费用、电力和冷却成本、日常维护和管理人员的费用,以及必要的软件授权费用。指通过使用大规模异构算力资源,包括通用算力(CPU) 和智能算力(GPU、FPGA、ASIC 等),主要为人工智能应用 (如人工智能深度学习模型开发、模型训练和模型推理等场景) 提供所需算力、数据和算法的设施。硬件架构设计是产品设计初期的关键步骤,尤其对于复杂度较高的
经典模型可以满足一些简单深度学习任务的需求,然后更多情况下,需要使用深度学习框架构建一个自己的神经网络,这时可以使用飞桨框架paddle.nn下的 API 构建网络,该目录下定义了丰富的神经网络层和相关函数 API,如卷积网络相关的 Conv1D、Conv2D、Conv3D,循环神经网络相关的 RNN、LSTM、GRU 等,方便组网调用,详细清单可在API 文档中查看。使用组网:构建顺序的线性网络
注:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文档详细介绍了在Windows环境下,使用飞桨OCR进行数据标注、模型二次训练、服务部署的全过程。包括创建虚拟环境、安装依赖、下载官方模型、使用PPOCRLabel进行数据打标、训练文本检测与识别模型、模型评估,以及在Linux下基于PDServing部署识别服务。此外,还提供了基于Sanic构建的解析服务示例
2026年1月29日,“AI4Science 前沿:材料研发计算新范式——国产算力×深度学习框架技术沙龙·上海站”在张江百度飞桨人工智能产业赋能中心举办。本次活动由百度飞桨与沐曦联合主办,聚焦 AI for Science(AI4S)在材料科学领域的最新应用。来自高校、科研院所及企业的数十位开发者与技术专家齐聚一堂,共同探讨国产算力与深度学习框架如何协同推动材料研发的创新。
本文系统介绍了百度PaddleOCR工具库的核心功能与应用实践。作为基于飞桨框架的轻量级OCR解决方案,PaddleOCR具备多语言支持、角度自适应和高精度识别等特点。文章通过三个典型场景演示:静态图片多语言识别(日语示例)、OpenCV可视化标注(英文示例)以及摄像头实时中文检测,详细解析了API调用、结果解析、坐标转换等关键技术点,并针对中文显示问题提供了Pillow库的解决方案。这些案例覆盖
基于WPF&OpenCV的高级显示控件2.0是一款面向图像可视化与交互操作的专业控件库,采用.NET Framework 4.8框架开发,融合WPF的高效UI渲染能力与OpenCV的强大图像处理功能。控件支持图像拖入显示、多类型绘图对象交互、图像特效处理等核心功能,通过WPF的Adorner和Thumb组件实现绘图对象的拖拽、缩放、旋转等交互操作,适用于机器视觉、图像分析、工业检测等场景。颜色自定
本文提出了一种针对小型企业需求的低成本单证识别方案,采用PaddleOCR+YOLOv8技术栈,重点解决了单证多角度倾斜矫正和文本区域精准检测两大核心痛点。方案创新性地使用PaddleOCR双阶段矫正(粗调+精调)技术,结合YOLOv8小样本目标检测,在RTX2060等消费级显卡上即可实现高效识别。相比传统方案,该方法显著降低了标注工作量(仅需50张样本)和硬件成本,同时保证了护照等制式证件关键字
模板机制模板=Word 书签+JSON 配置,用户可自定义公司 Logo、封面、保密级别。曲线自动转矢量 EMF,保证放大 400% 无锯齿;表格采用“三线表”样式,符合 GB/T 1.1-2020。批注功能:对异常结果(如续航低于目标 8%)自动插入批注,附带灵敏度雷达图。E-DEV 通过“参数化建模+多目标优化+秒级仿真+一键报告”的组合拳,把传统需要 1-2 周的匹配验证周期压缩到 1 个下
1、服务器中实用NVIDIA A100并且装有cuda 12.4版本,而paddlepaddle-gpu比较接近时cuda 12.3版本。格式分布如上,图片数据:data_dir+第一个数据。
本文介绍了使用PaddlePaddle框架构建图像分类器的全流程实践。主要内容包括:1)数据准备与预处理,演示了数据加载、预处理和增强的方法;2)模型构建与训练,展示了如何构建CNN模型并进行训练;3)模型评估与保存,说明如何评估模型性能并保存训练结果。文章通过CIFAR-10数据集示例,详细讲解了从数据准备到模型训练、评估的完整过程,为深度学习初学者提供了实用的项目开发指南。
摘要 本课程介绍PaddlePaddle深度学习框架的模型训练方法,重点讲解训练参数设置与训练过程监控。内容包括:学习率、批次大小、迭代次数等关键参数配置;使用DataLoader加载数据、优化器设置;通过VisualDL工具可视化训练过程。课程提供完整的代码示例,涵盖模型定义、数据预处理、训练循环等实战环节,帮助开发者掌握PaddlePaddle模型训练的核心技术。学习目标为独立完成模型训练与优
构建高效的数据分析工作流需要根据具体需求选择合适的工具链。Python生态提供了从数据清洗到可视化的完整解决方案,通过合理的流程设计和性能优化,可以显著提升数据分析的效率和质量。持续关注新兴工具库的发展,不断优化工作流架构,将使数据分析工作保持高效和竞争力。
paddlepaddle
——paddlepaddle
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net