logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

不看后悔!GitHub 开源 MultiTalk .8k star 强大的人语音+图像绑定项目

MultiTalk是一款开源的多角色对话视频生成框架,由MeiGen-AI开发。它能通过多路音频输入、参考图片和文本提示,生成唇音同步的多人对话视频,支持最长15秒内容。技术亮点包括L-RoPE机制解决音频角色绑定问题、TeaCache加速推理、APG优化长视频色彩一致性等。相比同类工具,MultiTalk在多人交互、唇动精度和场景多样性方面表现突出。适用于教学视频、营销内容、卡通动画等场景,支持

文章图片
#github#开源
NoteGen:看看使用DeepSeek能力的开源项目有多牛,平替TyporaAI笔记应用

NoteGen 是一款专注于记录和写作的跨端 AI 笔记应用,旨在将记录、整理和写作完美结合。它支持 Mac、Windows、Linux 等多个平台,并计划在未来扩展到 iOS 和 Android。通过内置的 AI 模型(ChatGPT、ChatAnyWhere、Ollama、LM Studio、豆包、通义千问、Kimi、DeepSeek),NoteGen 能够帮助用户高效地捕捉灵感、整理知识,并

文章图片
#github#开源
1.4K star!几分钟搞定AI视频创作,这个开源神器让故事可视化如此简单!

story-flicks 是一个基于AI技术的自动化视频生成工具,能够将文字剧本快速转化为高质量短视频。开发者@alecm20通过深度学习算法,实现了从文本解析到视频合成的全流程自动化处理,支持多平台适配输出,是内容创作者和自媒体运营者的效率神器。

文章图片
#人工智能#github#开源
Claude code AI 技能神器:Anthropic Skills!

摘要:Anthropic Skills工具可大幅提升AI工作效率,将复杂任务打包成"技能包"供Claude直接调用。用户只需指定技能名称,AI就能自动完成专业任务,如财务报告、PPT制作等,节省50%以上时间。该工具支持团队共享,采用渐进披露机制确保精准输出。三步即可上手:下载技能包、设置目录、调用指令。相比反复修改Prompt的传统方式,Skills让AI任务执行更高效精准。

文章图片
#github#人工智能
斩获18.3K star!再见Airtable,这款Postgres驱动的开源表格神器要火!太 6了

Teable是一款基于PostgreSQL的无代码数据库平台,提供类电子表格界面,支持百万级数据的实时协作。其核心功能包括秒级响应、多人实时协同、多维度数据视图(表格、看板、日历、画廊、表单)、智能数据处理和开放扩展体系。技术架构采用Next.js、React、NestJS、PostgreSQL等,支持Docker和Kubernetes部署。Teable适用于敏捷开发、跨部门数据中台、个人知识库管

文章图片
#开源#github
MineAdmin:试过之后才发现,CMS、CRM、OA、ERP,这些系统它都能快速实现,一款基于Hyperf框架和Vue3+Vite5 开发的前后端分离权限管理系统,自适应多终端

MineAdmin是一款基于Hyperf框架和Vue3+Vite5开发的前后端分离权限管理系统,它以其自适应多终端的特性脱颖而出。这款系统不仅能够满足网站管理后台、CMS、CRM、OA、ERP等需求,还以其后端crud生成和前端低代码json化配置的特色赢得了广泛关注。

文章图片
#github#php
吊打中文合成!这款开源语音神器效果炸裂,逼真到离谱!

如果想要打造专属音色,Spark-TTS 提供了针对个性化音色定制的训练流程。通过输入少量的录音数据,即可训练生成风格化的语音模型,满足差异化的创作需求。在使用 Spark-TTS 时,大家能轻松地从文本输入到合成语音输出,大幅减少在语音处理上的开发难度。同时,它也提供了较为简洁易懂的接口,适配多平台部署,具备优秀的可移植性和拓展性。无论是个人项目还是企业级应用,都能从中受益。

文章图片
#开源#github
VanBlog:真的太丝滑啦,简洁实用优雅的个人博客系统,支持文章、评论、分类、标签一站式管理,赶紧上车

VanBlog是一款简洁、易用、功能丰富的开源博客系统。无论是个人博客、知识库还是团队协作,VanBlog都能满足你的需求。快来尝试一下吧,相信你会爱上这款博客系统!

文章图片
#开源#github
DeepSeek-Free-API:DeepSeekV3免费的api接口,需要使用api方式的同学可以参考一下这个项目,可以收藏起来试一下

DeepSeek V3 Free 服务是一个基于 DeepSeek-V3 R1 大模型的逆向 API 项目。该项目由 LLM-Red-Team 团队开发,旨在为开发者提供一个免费、稳定且易于使用的 API 服务,以便在测试和开发过程中能够更好地利用 DeepSeek 的强大功能。该项目支持高速流式输出、多轮对话、联网搜索、R1 深度思考等多种功能,并且与 ChatGPT 接口完全兼容,让开发者能够

文章图片
#开源#github#ChatGPT
bailing:真心不错,Ai又整新花样,这款开源语音对话项目能快速让你的项目拥有和人一样对话能力,后台系统能快速集成,还在等什么呢~~

百聆是一个开源的语音对话助手,它的目标是让机器能够通过语音与用户进行自然的对话。该项目集成了自动语音识别(ASR)、语音活动检测(VAD)、大语言模型(LLM)和语音合成(TTS)等多项技术,打造了一个类似GPT-4o的语音对话机器人。值得一提的是,百聆在保证高质量对话体验的同时,将端到端时延降低至800ms,且无需GPU即可运行,非常适合边缘设备和低资源环境。

文章图片
#人工智能#github#语音识别
    共 194 条
  • 1
  • 2
  • 3
  • 20
  • 请选择