logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

PPT auto Crorrector

PPT-auto-Corrector 是一个基于 AI 的自动化工具,能够将拍摄的 PPT 照片智能矫正为标准幻灯片图像。项目结合 Segment Anything Model (SAM) 实现 PPT 区域自动识别,利用 OpenCV 进行透视变换与去畸变处理,输出统一尺寸(如 1920×1080)的高清图像,并支持批量处理与 PDF 合并。适用于讲座记录、会议归档、教学整理等场景,让模糊、倾斜

#opencv#计算机视觉
PPT auto Crorrector

PPT-auto-Corrector 是一个基于 AI 的自动化工具,能够将拍摄的 PPT 照片智能矫正为标准幻灯片图像。项目结合 Segment Anything Model (SAM) 实现 PPT 区域自动识别,利用 OpenCV 进行透视变换与去畸变处理,输出统一尺寸(如 1920×1080)的高清图像,并支持批量处理与 PDF 合并。适用于讲座记录、会议归档、教学整理等场景,让模糊、倾斜

#opencv#计算机视觉
深入了解阿里云 OSS:强大的云存储解决方案

阿里云 OSS(Object Storage Service)是阿里云提供的对象存储服务,它使得用户能够通过 Web 服务接口管理和存储海量数据。OSS 提供了高可用、高扩展性和高安全性的存储解决方案,适用于各类数据存储需求,从图片、音视频文件到日志数据、备份数据等都可以在 OSS 中存储。

文章图片
#阿里云#云计算
中文语音识别技术实战

语音识别技术,也称为自动语音识别(Automatic Speech Recognition,ASR),其主要目标是将人类的语音中的词汇内容转换为相应的行动或文本。

文章图片
#语音识别#人工智能
DH_Live部署与训练方法详述

致力于让每个人都能够轻松创建和使用数字人,推动数字人技术的普及和应用,为用户提供一个全面的数字人解决方案

文章图片
#人工智能#深度学习
到底了