logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

语音转录使用Whisper和SenseVoice-Small对比实测

摘要: 2026年开源中文语音转录技术迎来突破,阿里达摩院的SenseVoice模型通过非自回归架构和多模态联合建模(融合语音识别、情感分析、噪声过滤),显著提升高噪场景(如游戏直播喷麦)的转录准确率。相比传统Whisper模型,SenseVoice在延迟(<150ms)、抗干扰(CER 6.1%)和功能扩展(标记笑声/喷麦事件)上全面领先。工程实践中,结合Silero VAD前置降噪和ON

文章图片
#语音识别#人工智能
MinerU、Docling 和 DeepDoc,带你彻底告别复杂 PDF 解析的深坑

要彻底解决 RAG 数据清洗的噩梦,我们必须从底层架构上重塑文档解析逻辑。今天,我们将硬核拆解当前全球开源社区中最强悍的三款知识抽取神器——MinerU、Docling 和 DeepDoc,带你彻底告别复杂 PDF 解析的深坑。

文章图片
#人工智能#数据挖掘
工程化实战:Agentic CRAG解决大模型幻觉

本文探讨了大模型在医疗等关键领域中的"幻觉"风险及其工程解决方案。通过一个急性心梗患者因错误用药建议而丧命的案例,揭示了传统大模型基于概率生成的致命缺陷。 文章剖析了大模型产生幻觉的底层机制,指出其本质是概率序列预测而非逻辑推理。针对传统RAG技术的两大痛点——PDF解析灾难和拓扑信息丢失,提出了2026年新一代的Agentic CRAG架构。该架构通过智能路由、多跳检索和纠错

文章图片
#人工智能
RAGFlow · 第 0 章:企业 AI 工程师需要掌握 RAGFlow

RAGFlow 是当前最值得深入掌握的开源 RAG 引擎。这不是因为它完美,而是因为它在企业知识管理这个场景上,覆盖了从文档解析到 Agentic RAG 再到生产部署的完整链路。这篇文章作为前言将回答两个问题:为什么(WHY)和做什么(WHAT)。

文章图片
#人工智能#数据仓库#知识图谱
从「收藏吃灰」到「知识入库」:用 AI 流水线把微信视频号收藏变成 Obsidian 知识库

本文介绍一套完整的 AI 自动化方案:批量下载视频号收藏 → 语音转文字 → 智能分类 → 生成结构化笔记 → 导入 Obsidian 知识库。全程本地 GPU 运行 Whisper,配合大模型做内容分析和分类,262 条短视频从原始视频变成可检索、可跳转、可行动的知识体系。

文章图片
#人工智能#微信#音视频 +1
AI量化Agent黑科技:暴力拆穿LLM作弊陷阱

基于 LangGraph 的实现长程量化 Agent,并引入软件工程中极度严苛的 Harness CI/CD 评测框架,构建一套暴力的沙盒拦截机制。我们将通过真实的代码和血淋淋的失败案例,揭开普通人利用 AI 搞钱的底层真相。

文章图片
#人工智能#科技
AI量化交易Agent:长程记忆与暴力评测

以工程实现的视角,硬核拆解如何从零手搓一个具备长程记忆与反思能力的**量化交易 Agent**,并引入严格的**Harness 评测框架**,对不同基座模型的交易表现进行暴力压测,揭示普通人利用 AI 进行量化交易的真正护城河。

文章图片
#人工智能
LangGraph + Harness 评测体系,实现一个能够执行长程任务的 AI 量化 Agent

大语言模型(LLM)结合 Agent 架构,在金融量化领域掀起降维打击的根本原因。今天,我们将完全抛开烂俗的“AI理财”营销话术,从极客与系统架构的视角,硬核拆解如何利用 LangGraph 与 Harness 评测体系,手搓一个能够执行长程任务的 AI 量化 Agent,实盘跑赢 CPI。

文章图片
#人工智能#数据挖掘
低显存实战:用Harness榨干量化Agent极限长程红利!

本文将以极度硬核的工程视角,带你实现在 24GB 甚至 16GB 低显存环境下,通过底层量化与编排框架(Harness)的深度咬合,榨干大模型长程任务的红利。这不是一篇简单的教程,而是一份低算力对抗高算力通胀的实战宣言。

文章图片
#数据挖掘#人工智能#自动化
RAGFlow Agent 搞定火电复杂图表

开源项目 RAGFlow 因其出色的文档解析能力在技术圈引发了热议。它不仅仅是一个 RAG(检索增强生成)框架,更关键的是它试图解决文档解析中的“最后一公里”问题——TSR(Table Structure Recognition,表格结构识别)与 OCR 的像素级复刻。

文章图片
#架构#人工智能
    共 79 条
  • 1
  • 2
  • 3
  • 8
  • 请选择