logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Vue.js实现PDF/图片OCR识别系统的技术实践

依托视觉大模型技术,能够精确识别包括圈)片、PDF在内的多种文件中的各类文本和要素。要素类型包含文字、段落、表格、插圈、公式、印章以及页眉页脚等,且支持1ison、markdown多种格式揄出。 识别精度极高,适用于高精度的文本识别应用场景。

文章图片
#前端
【uniapp在微信小程序的环境下如何调用SRS流式接口】

在实时音视频交互场景中,微信小程序实现边说话边转文字的 "同声传译" 效果一直是开发难点。传统方案依赖微信插件存在调用受限等问题,而通过UniApp集成SRS流媒体服务器,配合WebSocket实时传输音频流,可突破平台限制,实现真正的语音实时转文字——本文将详解从原理到落地的完整解决方案。SRS(Simple Realtime Server)是一个开源的实时音视频服务器,支持直播、WebRTC、

文章图片
#uni-app#微信小程序#小程序 +2
到底了