logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

你的AI老婆开源了 能陪你打游戏追剧的桌面AI伴侣 Project AIRI 复刻 Neuro-sama 让 AI waifu 虚拟角色也能来到我们的世界

你的AI老婆开源了 能陪你打游戏追剧的桌面AI伴侣 Project AIRI 复刻 Neuro-sama 让 AI waifu 虚拟角色也能来到我们的世界Project AIRI,一个以复刻Neuro-sama为目标的项目,致力于让AI waifu、虚拟角色真正走进我们的世界,成为可交互、可陪伴的赛博生命与数字伴侣。

文章图片
#人工智能
indextts api启动接口 源码 IndexTTS API 是一套基于本地部署的语音合成接口,支持文本转语音、音色选择、语速调节等功能,启动后可通过 HTTP 请求调用

IndexTTSAPI是一款本地部署的语音合成接口,支持通过HTTP请求实现文本转语音功能。主要特性包括音色选择、语速调节(0.5-2.0)和多种输出格式(wav/mp3/base64)。服务可通过Windows整合包(运行API.bat)或手动命令(python api.py)启动,默认监听7860端口。调用时需POST请求/api/tts接口,包含文本内容和可选参数。Python示例代码展示了

文章图片
#http#网络协议#网络
[AI工具]Infinite Talk数字人对口型图像转视频AI工具 支持无限时长视频生成

InfiniteTalk是一款先进的AI数字人视频生成工具,能够将静态图像与音频结合,生成无限时长的逼真说话视频。该工具采用创新的音频驱动框架,实现毫秒级唇形同步,并保持人物特征稳定。支持480P/720P分辨率,单GPU即可处理长视频生成,多GPU可扩展性能。主要应用于教育、企业宣传、自媒体和影视制作等领域,支持通过官网或本地部署使用。技术特点包括智能帧插值、情感映射和高效内存管理,提供量化模型

文章图片
#人工智能#视频生成
VSE硬字幕提取工具 Video subtitle extractor 视频生成srt字幕文件 含详细使用方法

VSE(Video-subtitle-extractor)是一款免费开源的硬字幕提取工具,支持Windows、macOS、Linux系统。它通过深度学习技术自动检测视频内嵌字幕,生成SRT文件或纯文本,支持87种语言识别和GPU加速。操作简单:下载解压后导入视频,选择识别模式(推荐自动模式),点击运行即可生成字幕文件。注意事项包括:路径不含中文/空格、NVIDIA显卡需安装CUDA驱动等。该工具全

文章图片
#音视频
VMware Workstation Pro VM虚拟机个人免费版本的下载地址

VMware宣布旗下两大虚拟机软件VMware Workstation Pro(Windows平台)和VMware Fusion Pro(macOS平台)完全免费开放,包括个人和商业用途。同时提供了老版本(支持Win7/XP)和新版本(支持Win10/11)的下载,这一重大调整将显著降低用户使用专业级虚拟化技术的门槛。

文章图片
#虚拟机
音谷今夕定制版2.0版本 多角色有声小说生成系统全维度升级 优化后台播放、增强音色管理,提升LLM拆分与角色匹配能力,补全核心功能短板 支持本地大模型接入

音谷今夕定制版系统完成全维度升级,主要涵盖七大核心优化:1)后台播放保活与音频合成功能,新增听书开关、修复停播问题;2)音色管理增强,优化标签拆分、导入流程;3)LLM台词拆分能力提升,重写提示词并改进情绪解析;4)智能角色匹配升级为两阶段机制,新增性别过滤;5)拆分链路改为分段处理,实现实时刷新;6)完善拆分完成提示与空白结果兜底机制;7)支持接入本地大模型。升级显著提升了系统稳定性、用户体验和

文章图片
LM Studio切换模型目录 LM Studio自定义模型目录

LMStudio模型目录迁移指南 本文介绍了4种将LMStudio默认模型存储路径(系统盘)迁移到其他目录的方法:1)图形界面设置(新版);2)修改配置文件;3)创建符号链接(推荐);4)设置环境变量。详细说明了Windows/macOS/Linux各平台的操作步骤,包括配置文件路径、命令示例和常见问题解决方法。迁移后可释放系统盘空间,统一管理模型文件,提升使用体验。适用于所有平台用户,操作前需注

文章图片
音谷 今夕自用版 智能配音全面升级:LLM 台词解析与角色匹配精度再突破 github 开源软件

本次升级聚焦三大核心目标:易用性、智能化和可控性,全面优化用户体验与系统稳定性。主要升级内容包括:1)增强播放与调试能力,新增后台听书保活策略和媒体调试日志;2)升级智能匹配功能,采用两阶段匹配算法并增加结果预览;3)优化台词拆分逻辑,重写LLM提示词提升准确性;4)改进音色管理,增强标签拆分与批量导入功能。特别推荐使用Electron桌面端以获得完整的本地文件操作能力,并建议在智能匹配前先执行音

文章图片
#人工智能#AI配音
音谷 - AI 多角色多情绪配音平台 github开源的多角色、多情绪 AI 配音生成平台,支持小说、剧本、视频等内容的自动配音与导出。

音谷-AI多角色多情绪配音平台是一款基于AGPL-3.0协议开源的AI配音工具。该平台采用Electron+Vue+FastAPI技术栈,支持小说、剧本等内容的多角色多情绪语音合成,提供文本导入、角色管理、情绪绑定、音频编辑等功能。技术核心采用Index-TTS-2.0服务,支持本地部署或云端调用。二次开发需遵守署名规范和非商用限制。项目包含完整的前后端架构,开发者可通过GitHub获取源码,按照

文章图片
#人工智能#github#开源
The Agency,agency-agents 144位开源AI专家全集,一键组建你的专属AI 团队 github开源

The Agency(agency-agents)是一个**开箱即用的专业化AI智能体合集**,由社区打磨成型,内置**144位垂直领域AI专家角色**,覆盖研发、设计、营销、产品、项目管理、测试、运维、空间计算等**9大职能部门**,无需复杂配置,即可为个人开发者、创业团队、企业项目提供全流程AI协作支持。它不是简单的提示词模板库,而是一套**带人格、有流程、可交付、可验证**的完整AI工作体系

文章图片
#开源#人工智能#github
    共 41 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择