logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

gpt-oss-20b部署教程:Docker一键启动快速上手

本文介绍如何通过Docker一键部署开源大模型gpt-oss-20b,支持16GB内存设备和主流NVIDIA显卡,结合稀疏激活与量化技术,实现高效本地化运行,适用于私有知识库、智能客服等场景。

通义千问3-4B-Instruct部署教程:Android手机运行实操

本文介绍了如何在星图GPU平台上一键自动化部署通义千问3-4B-Instruct-2507镜像,并实现其核心应用。该镜像是一个轻量级大语言模型,部署后可作为本地AI助手,典型应用场景包括处理长文本摘要、代码辅助生成以及日常知识问答,为用户提供便捷的离线智能服务。

MinerU内存溢出?大文件分片处理部署优化实战案例

本文介绍了如何在星图GPU平台上自动化部署MinerU 2.5-1.2B 深度学习 PDF 提取镜像,通过分片处理技术解决大文件内存溢出问题。该镜像可高效提取复杂PDF文档中的文本、表格和公式,典型应用于学术论文与企业财报的结构化转换,显著提升文档处理效率。

#深度学习
小白也能懂:Xinference分布式部署LLM的详细教程

本文介绍了如何在星图GPU平台上自动化部署xinference-v1.17.1镜像,快速构建分布式大语言模型(LLM)推理服务。用户可轻松实现Qwen、GLM等开源模型的跨节点调度与OpenAI兼容调用,典型应用于智能客服、私有知识问答等场景,显著降低LLM部署门槛。

通义千问2.5-7B量化精度平衡:Q4/Q6/Q8效果对比实战

本文介绍了如何在星图GPU平台上自动化部署通义千问2.5-7B-Instruct镜像,并对比了其Q4、Q6、Q8等不同量化版本在效果与速度上的差异。该镜像可用于文本生成、代码编写等多种AI应用场景,帮助开发者根据自身硬件和需求选择最合适的量化方案,实现高效部署与应用。

使用VSCode调试通义千问3-Reranker-0.6B模型的完整指南

本文介绍了如何在星图GPU平台上自动化部署通义千问3-Reranker-0.6B镜像,高效支持AI重排序任务。通过平台一键部署,用户可快速构建可调试的Reranker环境,典型应用于搜索结果相关性排序、RAG系统文档筛选等场景,显著提升检索质量与开发效率。

通义千问3-14B模型解析:148亿参数Dense架构特点

本文介绍了基于星图GPU平台自动化部署通义千问3-14B镜像的完整方案。该模型采用148亿参数Dense架构,支持128k长上下文与双模式推理,适用于模型微调、AI应用开发等场景,结合Ollama或vLLM可实现高效本地化部署与企业级服务集成。

SenseVoice-Small ONNX模型部署教程:Docker镜像构建+Gradio服务容器化发布

本文介绍了如何在星图GPU平台上自动化部署sensevoice-small-语音识别-onnx模型(带量化后)镜像,实现高效的多语言语音识别服务。该镜像通过Docker容器化封装,可快速搭建支持50多种语言的语音转文字应用,适用于会议记录、音频内容转录等场景,大幅提升语音处理效率。

#语音识别
多语言语音识别神器:Qwen3-ASR-0.6B快速上手指南

本文介绍了如何在星图GPU平台上一键自动化部署Qwen3-ASR-0.6B镜像,快速搭建多语言语音识别服务。该模型支持52种语言和方言,用户可通过简洁的Web界面轻松上传音频文件,实现将会议录音、方言故事等语音内容自动转换为可编辑文字,极大提升了音频转录效率。

#语音识别
基于StructBERT的跨平台情感分析APP开发

本文介绍了如何在星图GPU平台上自动化部署StructBERT情感分类-中文-通用-base镜像,快速构建跨平台情感分析应用。该方案结合Flutter框架,可开发适用于电商评论分析、用户反馈情绪判断等场景的移动端APP,实现对中文文本情感倾向的精准识别。

    共 343 条
  • 1
  • 2
  • 3
  • 35
  • 请选择