logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

轻量级的语音唤醒引擎Snowboy

Snowboy 是一个开源的、轻量级的语音唤醒引擎,专为嵌入式设备和移动设备设计。它允许用户通过自定义的唤醒词来激活语音助手。原官方训练平台已关闭# 安装 Mycroft Precise git clone https://github.com/MycroftAI/mycroft-precise cd mycroft-precise。

#人工智能#语言模型
科普一下TTS技术

文本转语音(Text-to-Speech, TTS)是一种将书面文本转换为可听语音的技术,广泛应用于智能助手、导航系统、有声读物、无障碍服务等领域。随着AI和深度学习的发展,现代TTS系统能够生成接近人类语音的自然音频。# 获取可用语音engine = pyttsx3 . init() # 获取可用语音 voices = engine . getProperty("voices") for voi

#人工智能
Python将OpenCV摄像头视频流通过浏览器播放

对于快速实现,推荐方法1(Flask + MJPEG),它简单易用且兼容性好。如果需要更低延迟,可以选择方法2(WebSocket)。对于专业级实时应用,**方法3(WebRTC)**是最佳选择,但实现复杂度最高。根据你的具体需求(延迟要求、浏览器兼容性、开发复杂度)选择最适合的方案。

文章图片
#python#opencv#开发语言
大模型微调工具库XTuner

是一个高效、灵活且功能全面的大语言模型(LLM)和多模态模型(VLM)微调工具库,由上海人工智能实验室开发。它旨在帮助开发者在有限的资源下轻松微调大模型,支持多种主流模型和灵活的数据处理方式。兼容多种主流大语言模型(如InternLM、Llama2、ChatGLM等)和多模态模型(如LLaVA)。支持多种数据格式(如JSON、CSV)和微调算法(如QLoRA、LoRA、全量参数微调)。仅需8GB显

#人工智能
RayData数据可视化工具

成为企业级数据可视化的优选工具,尤其适合需要动态交互与三维展示的场景。其产品矩阵可灵活匹配不同复杂度需求,从快速报表生成(Report)到高保真数字孪生(Plus)均有覆盖。RayData是腾讯云推出的一站式大数据可视交互系统,专注于将复杂数据通过。转化为动态、交互式的可视化场景。以下是关于腾讯云旗下。

文章图片
#信息可视化
强大的开源模型推理框架Xinference

Xinference是一个强大的开源模型推理框架,能帮你轻松地在本地或服务器上部署、管理各种AI模型(如ChatGLM、Baichuan等)。其核心优势是统一管理并支持多种主流推理引擎(如vLLM、llama.cpp),并提供简单易用的Web界面。

文章图片
#人工智能
点对点传输工具FilePizza

FilePizza是一款开源的点对点文件传输工具,基于WebRTC技术实现,无需中转服务器即可在浏览器之间直接传输文件。

#p2p
推荐一款开源基于AI的富文本编辑器

开发,支持几乎所有主流前端框架(如 Vue、React、Angular、Layui 等),并适配 PC 端和移动端,提供亮色和暗色两种主题。它的目标是打造一个完全由 AI 驱动的富文本编辑器,支持对接多种大模型(如科大讯飞星火、ChatGPT、文心一言等),并提供灵活的配置,开发者可以轻松集成到各类文本编辑应用中。

#开源#人工智能#编辑器
免费文本转语音python库gTTS

的文本转语音(TTS)API,将文本转换为语音并保存为音频文件(如MP3)。它基于 Google 的 TTS 引擎,支持多种语言和发音选项。(Google Text-to-Speech)是一个 Python 库,用于调用。希望这份详细介绍对你有帮助!如果有进一步问题,欢迎讨论。(违反 Google TOS 可能被封)(依赖 Google TTS 服务)(Google 可能会封禁高频访问)如果需要更

#python#开发语言
开源文档管理系统Paperless-ngx

Paperless-ngx 是一个开源的文档管理系统,旨在帮助用户将纸质文档转换为可搜索的在线档案,实现无纸化办公。它支持多种文件格式(如 PDF、图片、Office 文档等),并集成了 OCR 功能,可以自动识别文档中的文字。

文章图片
#开源
    共 221 条
  • 1
  • 2
  • 3
  • 23
  • 请选择