logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从文案到口播视频:一条FFmpeg+TTS流水线的完整实现

摘要: 文章详细拆解了智播坊AI口播视频生成的后端9步流水线,核心包括TTS语音合成、FFmpeg视频合成与字幕同步。关键技术点: TTS分句策略:按标点拆分文本,流式API处理长音频,克隆音色需特殊参数; 字幕同步:通过FFprobe修正估算时长,避免误差累积; FFmpeg滤镜链:处理背景叠加、字幕烧录(注意ASS字幕BGR颜色格式),跨平台中文字体兼容; 进度优化:伪进度+WebSocket

文章图片
#node.js
我又用AI做了一个智能表单平台,跟AI对话就能生成表单,也开源了

本文介绍了开源AI表单生成平台"智枢矩阵"的开发历程。最初为解决传统表单工具功能死板的问题,作者通过AI对话实现表单创建,逐步扩展出6个核心功能:多轮对话生成、智能改写、OCR识别、智能评分、数据洞察和预测分析。技术栈采用Vue3+Express+SQLite/MySQL,重点解决了AI返回JSON解析、表单评分规则引擎等关键问题。项目开源后包含全部AI功能,支持私有化部署等企

文章图片
#AI#前端#vue.js
我用AI一周做了个口播视频平台,现在开源了

独立开发者利用AI技术打造开源口播视频生成平台"智播坊",实现从文案到视频的全自动生成。该平台整合TTS语音合成、FFmpeg视频处理等技术,解决真人拍摄成本高、数字人平台费用贵等问题。核心功能包括自动拆分长文本、智能抠图、字幕生成等,支持声音克隆等高级特性。项目采用Vue3+Express.js技术栈,代码量约1600行,已开源并附带详细部署指南。开发者分享过程中遇到的四大技

文章图片
#人工智能#vue.js#前端
AI生成表单:从自然语言到JSON Schema,我是怎么做到的

用户输入“做一个活动报名表”,几秒后表单自动生成。本文完整拆解智枢矩阵中AI生成表单的实现过程:Prompt设计(如何让大模型稳定输出JSON)、火山方舟API接入、JSON解析与容错、前端动态渲染。同时分享了踩坑记录(markdown污染、字段类型映射、复杂需求降级)。适合正在开发低代码平台、表单设计器或AI应用的开发者参考。

文章图片
#AI#vue.js
多页表单的实现:从分页到进度条,一套优雅的解决方案

摘要:本文介绍了多页表单的实现方案,通过将复杂表单拆分为多页可显著提升用户体验。核心功能包括:1)支持配置分页和每页字段数;2)智能分页算法,保留辅助字段位置;3)进度显示和导航控制;4)全表单校验机制;5)与条件逻辑的兼容处理。该方案适用于问卷调查、订单提交等多步骤场景,已在开源项目"智枢矩阵"中实现,可有效降低用户填写压力,提高表单完成率。(149字)

文章图片
#vue.js#前端
到底了