seiji morisako 个人主页

@weixin_36078669

seiji morisako

2022-07-08 16:51:27 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

基于深度强化学习的计算机资源调度研究项目

本文还有配套的精品资源，点击获取简介：本研究项目探讨了深度强化学习（DRL）在计算机系统资源调度中的应用，展示了DRL模型如何作为一个智能调度器，通过学习最优策略提高系统效率。项目结合了深度学习、Python和C++编程，利用深度学习框架实现DRL模型，并通过与操作系统的交互，优化了资源分配。学生们将深入了解DRL原理、模型构建，并在仿真环境中评估模型性能，最后比较不同调...

Ostrakon-VL-8B效果对比：与Claude、GPT-4V多模态模型的实际应用测评

本文介绍了Ostrakon-VL-8B多模态模型与Claude、GPT-4V在实际应用中的效果对比。该模型可在星图GPU平台上实现自动化部署，为开发者提供了一个高性价比、可私有化部署的视觉语言理解方案，适用于图片内容描述、基础视觉问答等应用场景。

为 OpenClaw 配置 Taotoken 作为其 AI 供应商的详细步骤

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。👉。

ollama部署Phi-4-mini-reasoning参数详解：context length扩展对显存占用实测

本文介绍了如何在星图GPU平台上自动化部署【ollama】Phi-4-mini-reasoning镜像，高效支持长上下文数学推理任务。该模型专为密集型逻辑推导优化，可在消费级显卡上稳定处理128K token输入，典型应用于技术文档分析、多步代数求解等场景，显著提升工程化AI推理效率。

Qwen3-ASR-1.7B私有化语音交互平台部署：数据不出域的合规方案

本文介绍了如何在星图GPU平台上自动化部署Qwen3-ASR-1.7B语音识别模型v2，构建私有化语音交互平台。该方案确保数据不出域，满足金融、医疗等行业的合规要求，典型应用场景包括将客户服务录音、内部会议等音频内容高效、安全地转写为文本。

#语音识别

Ollama部署LFM2.5-1.2B-Thinking：轻量模型在车载语音交互中的潜力验证

本文介绍了如何在星图GPU平台上自动化部署【ollama】LFM2.5-1.2B-Thinking镜像，验证其在车载语音交互场景中的实际能力。该轻量级大语言模型支持本地化多意图指令解析与上下文连续对话，可在断网、低功耗车机环境中实现毫秒级响应，显著提升隐私性与系统稳定性。

Qwen3-ASR-1.7B惊艳效果：演唱会现场录音（高混响）人声分离转写实测

本文介绍了如何在星图GPU平台上自动化部署🎙️ Qwen3-ASR-1.7B高精度语音识别工具镜像。该平台简化了部署流程，用户可快速搭建本地语音识别环境。该工具特别适用于处理复杂音频场景，例如，可将演唱会现场嘈杂、高混响的录音，准确分离人声并转写成可读文本，有效提升音频内容处理效率。

#语音识别

使用Fun-ASR WebUI进行实时流式语音识别的技术细节解析

Fun-ASR WebUI通过VAD分段与离线识别结合，实现类流式语音转写。系统利用浏览器音频采集、语音活动检测和异步模型推理，在普通设备上达成低延迟、高可用的本地化识别体验，兼顾性能与隐私，适合教育、会议等场景。

语音识别不求人：Qwen3-ASR模型自助使用手册

本文介绍了如何在星图GPU平台自动化部署Qwen3-ASR-1.7B语音识别模型v2镜像，实现高效语音转文字功能。该模型支持中英日韩多语言识别，适用于会议记录转写、外语学习辅助等场景，提供离线、安全、快速的语音识别服务。

#语音识别

语音识别模型服务化：SenseVoice-Small ONNX版本多并发HTTP API部署指南

本文介绍了如何在星图GPU平台上自动化部署sensevoice-small-语音识别-onnx模型(带量化后)镜像，以构建支持多并发的语音识别HTTP API服务。该服务可高效应用于在线会议实时转录、客服录音分析等场景，实现音频到文字的快速、准确转换。

#语音识别

共 348 条

请选择