logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AIDC-AI/Pixelle-Video 项目详情及安装使用

Pixelle-Video是一款由阿里智能计算团队开发的AI全自动短视频引擎,采用Apache-2.0开源协议。该项目通过Python实现,只需输入主题即可自动完成文案撰写、AI配图/视频生成、语音合成、背景音乐添加等全流程视频制作。核心创新在于采用ComfyUI工作流架构,实现模型与管线的解耦,支持本地和云端两种部署方式。项目提供丰富的模板体系,涵盖竖屏、横屏等多种尺寸,适用于抖音、B站等不同平

文章图片
#人工智能#开源#音视频 +1
深入解析 ComposioHQ/awesome-codex-skills:从 Prompt 复用到 AI 工程技能化的实践路径

ComposioHQ/awesome-codex-skills项目展示了AI编程工具从代码补全向工程代理的演进路径。该项目通过结构化SKILL.md文件将AI使用经验转化为可复用技能,实现任务触发、流程执行和外部工具调用的自动化。关键技术包括:模块化技能设计(每个技能独立维护)、懒加载机制(优化上下文使用)、以及连接外部系统的能力。典型应用场景如CI故障修复(gh-fix-ci)和跨系统协作(co

文章图片
#人工智能#开源#github +1
从 free-claude-code 爆火看 AI 编码的“接入层战争“:当 API 代理开始重塑开发工作流

该项目并非Claude Code的替代品,而是一个创新的AI代理中间层,通过协议转换和路由策略实现了多模型服务的无缝接入。

文章图片
#人工智能#开源
obra/superpowers 深度解析(完整版)

Superpowers是一套让AI遵循软件工程方法论的开源框架,解决当前AI编程工具直接生成代码导致的质量问题。它将开发流程封装为14个可复用的Skill,分为规划、执行、验证、协作四类,通过三层约束体系确保AI行为可控。该项目由Jesse Vincent创建,已在GitHub获得12.8万星,被多家公司采用为标准。Superpowers不是代码生成工具,而是让AI从代码打字员转变为严谨工程师的方

文章图片
#人工智能
FinceptTerminal vs Bloomberg Terminal:一个技术人的硬核拆解

市面上对比这两款终端的文章多如牛毛,但大多止步于商业模式和价格战。作为一名写代码的人,本文将带你从**技术实现、架构设计、工程取舍**的角度,剖开表皮看本质,看看开源挑战者与四十年商业帝国的硬碰硬。

文章图片
#开源#金融
学大模型别再乱看了,先看这个开源项目

想系统学大模型,最怕的不是内容难,而是资料太散。相比反复刷零碎文章,一套结构清晰、强调动手实践的中文开源教程,往往更适合作为学习入口。

文章图片
#人工智能#机器学习#RAG
学大模型别再乱看了,先看这个开源项目

想系统学大模型,最怕的不是内容难,而是资料太散。相比反复刷零碎文章,一套结构清晰、强调动手实践的中文开源教程,往往更适合作为学习入口。

文章图片
#人工智能#机器学习#RAG
微软 MarkItDown 登顶 GitHub 热榜:108K Star,一键将任意文档转 Markdown,深度拆解它的技术野心

微软开源工具MarkItDown:一键将15+种文档格式转为结构化Markdown,助力RAG和AI应用预处理。支持PDF、Word、Excel等办公文档,以及图片、音频、网页等格式,智能保留标题、列表、表格等结构。0.1.0版本新增插件系统,支持OCR等扩展功能,并可通过LLM为图片生成描述。提供简洁CLI和Python API,支持流式处理大文件。定位为AI时代文档预处理基础设施,显著提升RA

文章图片
#microsoft#github#开源
不会编程也能上手尝试!Voicebox这款开源语音合成工具的一键安装流程,还有实现音色克隆的实际操作经验

Voicebox是一款值得上手的开源语音合成工具,主打本地运行、免费使用和简单安装三大特性,无需编程基础即可轻松操作。它支持文本转语音、音色克隆、音频编辑等功能,在Apple Silicon设备上速度提升显著。安装过程简单,Mac和Windows用户均可一键完成。音色克隆功能尤其实用,只需3-5分钟清晰语音样本即可生成专属音色。软件完全离线运行,保障隐私安全,支持中英文,适合个人和商用场景。常见问

文章图片
#开源#github#性能优化
Voicebox 开源语音合成爆火解析:从云端到本地,重构千亿音频生态

摘要:Voicebox技术解决音频行业三大痛点 (1)内容生产成本高,专业配音每小时300-2000元;(2)云端数据隐私风险,曾发生千万条语音样本泄露事件;(3)个性化需求难满足,特殊群体定制化需求长期被忽视。Voicebox通过三大创新解决这些问题:(1)5秒即可克隆音色,相似度超95%;(2)支持20余种情感模式的精细化语音控制;(3)实现万字内容一键批量生成。该技术可在30分钟内完成本地部

文章图片
#开源#重构#音视频
    共 28 条
  • 1
  • 2
  • 3
  • 请选择