logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

SentrySearch:一款支持用自然语言检索原生 MP4 视频的 Python 命令行工具

SentrySearch是一款革命性的视频检索工具,通过Python CLI实现自然语言搜索MP4视频。它利用Gemini Embedding模型直接将视频内容映射到768维向量空间,无需文本转录即可精准匹配"红色卡车"等语义查询。系统由FFmpeg视频处理、Gemini API特征提取、Python调度和ChromaDB向量存储组成,将视频智能切分并建立索引。其创新点包括5秒

文章图片
#音视频#python#概率论
暗夜武器库:极客开源项目巡礼

内置的MIR JIT编译器支持极其强大的管道操作符和类似SQL的向量算术计算,完成纯函数式的转换后,再交给专有的Radiant排版引擎进行最终渲染,真正实现了"万物皆数据"的极客美学。更关键的是,它引入了计划审查模式,让人类可以在AI执行可能具有破坏性的操作前,进行安全拦截与审批,重塑了人机协作的边界。纵轴则涵盖了从扎实的基础学习,到前沿的AI与编排调度。无论你是急需一套能够即插即用的高效生产力工

文章图片
#开源#人工智能
Codebase-to-course:赋能“直觉派程序员“的Claude终极武器

《代码库秒变交互课程:氛围派程序员的破局神器》摘要:针对依赖AI编程却缺乏底层认知的"氛围派程序员",codebase-to-course工具可将任意代码库转化为单页HTML交互课程。该工具具有三大核心特性:1)代码与自然语言的双语对照解析;2)动态架构可视化呈现;3)实战导向的故障排查测验。通过定制化隐喻(如将数据库比作图书馆)和动画演示,帮助用户从"黑盒操作&qu

文章图片
#github
构建生产级 AI Agent工作流

第三步,n8n 负责发送结构化的上下文,记住这里仅发送清晰的结构化负载,绝不抛入原始杂乱数据。那真正的解法是什么呢,其实就是解耦,我们要走向模块化的混合技术栈,把工作流的管道、智能代理,还有运行的数据彻底分离开来。第二块是 OpenClaw,它代表执行智能,这种需要拟人化和推理的地方归它管,包括处理助手的行为、感知工具并制定决策,以及运营和人类交互的界面。最后一块是 Supabase,负责持久化状

文章图片
#人工智能#github
构建生产级 AI Agent工作流

第三步,n8n 负责发送结构化的上下文,记住这里仅发送清晰的结构化负载,绝不抛入原始杂乱数据。那真正的解法是什么呢,其实就是解耦,我们要走向模块化的混合技术栈,把工作流的管道、智能代理,还有运行的数据彻底分离开来。第二块是 OpenClaw,它代表执行智能,这种需要拟人化和推理的地方归它管,包括处理助手的行为、感知工具并制定决策,以及运营和人类交互的界面。最后一块是 Supabase,负责持久化状

文章图片
#人工智能#github
Impeccable:赋予AI顶级设计美学

摘要:Impeccable是一款革新前端设计的AI工具,通过20个精准控制指令和严格的反模式指南,有效避免AI生成模板化UI。它包含三大核心组件:设计知识库、审美护栏和微调指令,能自动修正字体、色彩、布局等常见设计问题,支持多种开发工具链。该工具将LLM的编码效率与专业设计审美相结合,实现高质量前端开发,用户可通过官网或GitHub快速部署使用。

文章图片
#人工智能#github
Shopify 性能炼金术:pi-autoresearch 120 次暴力实验下的架构尊严

Shopify 那套跑了十几年的模板引擎,在所有人都觉得已经优化到极限的时候,被 Tobi Lütke 丢给了一个 AI Agent。指令极其简单粗暴:让它变快。这个叫 pi-autoresearch 的玩意儿没有像普通程序员那样对着代码发呆,它在沙盒里连续跑了 120 次实验,自动修改、自动编译、自动跑 Benchmark。结果让所有自诩资深的架构师老脸一红:性能提升 53%,内存占用砍掉 61

文章图片
#架构#人工智能#github
开源离线语音识别输入工具CapsWriter v1.0——支持无限时长语音、音视频文件转录字幕。

默认转录之后生成的文件会跟着音视频文件的目录:json 文件:包含了字级时间戳,txt 文件:包含了分行结果,merge.txt 文件:包含了带标点的整段结果,srt 文件:字幕文件,如果生成的字幕有微小错误,可以在分行的 txt 文件中修改,并将 txt 文件拖动到客户端打开,最后自动修正其余字幕文件。3.日记功能:默认每次录音识别后,识别结果记录在 年份/月份/日期.md ,录音文件保存在 年

文章图片
#python#语言模型#机器翻译 +2
开源离线语音识别输入工具CapsWriter v1.0——支持无限时长语音、音视频文件转录字幕。

默认转录之后生成的文件会跟着音视频文件的目录:json 文件:包含了字级时间戳,txt 文件:包含了分行结果,merge.txt 文件:包含了带标点的整段结果,srt 文件:字幕文件,如果生成的字幕有微小错误,可以在分行的 txt 文件中修改,并将 txt 文件拖动到客户端打开,最后自动修正其余字幕文件。3.日记功能:默认每次录音识别后,识别结果记录在 年份/月份/日期.md ,录音文件保存在 年

文章图片
#python#语言模型#机器翻译 +2
【XM音频转换工具】Ximalaya-XM-Decrypt-v0.1.2 支持批量XM音频转换成MPEG-4音频

解压到Ximalaya-XM-Decrypt文件夹,文件夹包含两个文件,缺一不可。然后点击Ximalaya-XM-Decrypt-v0.1.2.exe文件!(转换文件夹位置小技巧:找到文件夹位置直接拖进去即可)【XM音频转换工具】Ximalaya-XM-Decrypt-v0.1.2 支持批量XM格式音频文件转换成MPEG-4格式音频文件!将XM格式音频转换成MPEG-4格式。

文章图片
#音视频#开源软件
    共 11 条
  • 1
  • 2
  • 请选择