
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
PPT-auto-Corrector 是一个基于 AI 的自动化工具,能够将拍摄的 PPT 照片智能矫正为标准幻灯片图像。项目结合 Segment Anything Model (SAM) 实现 PPT 区域自动识别,利用 OpenCV 进行透视变换与去畸变处理,输出统一尺寸(如 1920×1080)的高清图像,并支持批量处理与 PDF 合并。适用于讲座记录、会议归档、教学整理等场景,让模糊、倾斜
PPT-auto-Corrector 是一个基于 AI 的自动化工具,能够将拍摄的 PPT 照片智能矫正为标准幻灯片图像。项目结合 Segment Anything Model (SAM) 实现 PPT 区域自动识别,利用 OpenCV 进行透视变换与去畸变处理,输出统一尺寸(如 1920×1080)的高清图像,并支持批量处理与 PDF 合并。适用于讲座记录、会议归档、教学整理等场景,让模糊、倾斜
阿里云 OSS(Object Storage Service)是阿里云提供的对象存储服务,它使得用户能够通过 Web 服务接口管理和存储海量数据。OSS 提供了高可用、高扩展性和高安全性的存储解决方案,适用于各类数据存储需求,从图片、音视频文件到日志数据、备份数据等都可以在 OSS 中存储。

语音识别技术,也称为自动语音识别(Automatic Speech Recognition,ASR),其主要目标是将人类的语音中的词汇内容转换为相应的行动或文本。

致力于让每个人都能够轻松创建和使用数字人,推动数字人技术的普及和应用,为用户提供一个全面的数字人解决方案
