Nanotrix 个人主页

@Nanotrix

Nanotrix

2026-01-21 11:03:44 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

瑞芯微RK3588 语音识别模型准确度测试报告

摘要：在RK3588平台上对5种语音识别模型进行测试评估，结果显示zipformer_rknn综合表现最优。该模型文件仅121.8MB，平均识别耗时1.2秒/条，词/字错误率最低（10.93%/4.12%），且支持中英文自动切换。相比其他模型（如whisper系列），zipformer_rknn在精度、速度、体积和多语言支持方面均具优势，特别适合边缘计算场景部署。测试基于2620条LibriSp

#语音识别 #人工智能

面向AI芯片的VLM智能监控方案：性能优势与系统边界分析

摘要：本文探讨了基于VLM（视觉语言模型）的智能监控方案相较于传统视觉算法的优势与局限。VLM通过多模态理解能力，可实现开放类别识别、语义场景分析、自然语言交互等复杂任务，显著提升了监控系统的智能化水平。然而，VLM存在实时性差（推理延迟1000–5000ms）、算力需求高（需GPU支持）等挑战。为此，建议采用“VLM+传统算法”混合架构，结合边缘计算与任务调度Agent，平衡性能与智能。典型应

#人工智能

瑞芯微RK3588 语音识别模型准确度测试报告

#语音识别 #人工智能

多模态检索模型clip、vit 测试报告

本文对多模态检索模型在RK3588硬件平台上的性能进行了全面测试，使用COCO和MSVD数据集评估了包括SigLIP2、nllb-clip等7种主流模型。测试结果显示，ViT-SO400M-16-SigLIP2-384__webli表现最优，在图像到文本任务中R@10达0.927，文本到图像任务中R@10达0.815。nllb-clip系列在长尾数据检索中更具优势。人工验证表明模型在Immich环

#人工智能 #嵌入式硬件

OpenClaw 系统在AMD395上的测试报告

OpenClaw是一个创意不错的项目，展现了AI助理的潜力，确实能够完成一部分工作。但当前版本更适合作为**实验性工具**或**辅助工具**使用，而非生产环境的主力工具。

#人工智能 #嵌入式硬件 #算法 +2

OpenClaw 在全志芯片 ARM 平台部署测试报告

本报告记录了 OpenClaw 平台在全志科技(Allwinner Technology)基于 ARM 架构的芯片平台上的完整部署和功能测试过程。测试硬件为 Radxa Cubie A7A 开发板,搭载全志 sun60iw2 芯片,运行 Debian GNU/Linux 11 (bullseye) 系统。

#arm开发 #人工智能 #语言模型 +1

瑞芯微RK3588 语音识别模型准确度测试报告

#语音识别 #人工智能

大模型算法测试方案调查

摘要本文系统调研了大语言模型（LLMs）的算法测试方案，涵盖英文和中文通用模型的评测框架。评测聚焦四大维度：能力评测、对话质量、安全真实性和速度吞吐。英文评测采用MMLU（多学科知识理解）、MMLU-Pro（高难度推理）、BIG-bench（综合认知能力）和TruthfulQA（真实性测试）等基准；中文评测则使用C-Eval（对标MMLU的中文综合测试）。这些测试通过标准化的few-shot设定

#算法 #人工智能 #嵌入式硬件

OpenClaw 系统在AMD395上的测试报告

#人工智能 #嵌入式硬件 #算法 +2

各大厂商模型功能分类

各大AI厂商模型功能分类概览：阿里云Qwen系列涵盖通用文本、多模态、代码、安全审核、超长上下文等10种模型；万Wan2.2系列专注于视频生成，支持文本/图像/音频输入；智谱GLM系列包含通用、边缘部署、图像生成、视频生成等8种模型；字节跳动模型涉及视频生成/编辑、文档理解、推荐系统等多样化功能。各厂商通过细分场景布局，形成差异化产品矩阵，覆盖文本、图像、视频、语音等多模态AI应用需求。

#分类 #数据挖掘 #人工智能

共 18 条

请选择