logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Qwen-Audio语音识别实战:5分钟快速部署与测试教程

本文介绍了如何在星图GPU平台上自动化部署QWEN-AUDIO | 智能语音合成系统Web镜像,快速搭建智能语音识别环境。该平台简化了部署流程,用户可轻松实现音频转文字功能,典型应用场景包括将会议录音自动转写为文字记录,提升信息整理效率。

#语音识别
GLM-4.7-Flash新手教程:手把手教你调用30B最强MoE模型

本文介绍了如何在星图GPU平台上自动化部署【ollama】GLM-4.7-Flash镜像,快速启用30B级MoE大语言模型。该镜像支持本地化、低延迟的中文技术文档生成与理解,适用于代码注释编写、论文摘要提炼及API文档辅助撰写等典型开发场景,显著提升工程师日常工作效率。

GLM-4-9B-Chat-1M代码实例:RAGFlow集成GLM-4-9B-Chat-1M构建企业知识中枢

本文介绍了如何在星图GPU平台上自动化部署glm-4-9b-chat-1m镜像,构建企业级知识中枢。依托其100万token超长上下文能力,该镜像可高效处理百页合同、年报等长文档,典型应用于法务条款精准提取、跨文档合规比对与智能摘要生成,显著提升企业知识服务响应速度与准确率。

#RAG
DeepSeek-R1-Distill-Qwen-1.5B与Phi-3对比:移动端推理速度评测

本文介绍了如何在星图GPU平台自动化部署DeepSeek-R1-Distill-Qwen-1.5B镜像,实现高效的移动端AI推理应用。该镜像专为资源受限环境优化,支持数学推理和代码生成等任务,在移动设备上提供流畅的对话体验和边缘计算能力,显著提升响应速度并降低内存占用。

GLM-4.7-Flash中文NLP能力展示:命名实体识别、情感分析prompt范例

本文介绍了如何在星图GPU平台自动化部署GLM-4.7-Flash镜像,实现中文自然语言处理任务。该镜像支持命名实体识别和情感分析等核心功能,可应用于社交媒体舆情监控、客户反馈分析等场景,提升文本处理效率与准确性。

#自然语言处理
DeepSeek-R1-Distill-Qwen-7B模型量化压缩实战指南

本文介绍了如何在星图GPU平台上自动化部署【ollama】DeepSeek-R1-Distill-Qwen-7B镜像,实现大语言模型的高效量化压缩。通过GPTQ和AWQ等量化技术,用户可显著降低模型存储和计算需求,适用于智能对话、文本生成等AI应用场景,提升推理效率并降低部署成本。

小白也能懂:Qwen-Ranker Pro语义精排核心功能全解析

本文介绍了如何在星图GPU平台自动化部署Qwen-Ranker Pro: 智能语义精排中心Web镜像,实现智能语义精排功能。该镜像能够深度理解搜索意图,精准排序文档相关性,典型应用于电商商品排序、企业知识库搜索等场景,显著提升搜索准确性和用户体验。

Qwen-Ranker Pro与数据结构优化:提升大规模检索效率

本文介绍了如何在星图GPU平台上自动化部署Qwen-Ranker Pro: 智能语义精排中心Web镜像,以优化大规模语义检索效率。该镜像通过倒排索引和哈希表等数据结构优化,显著提升电商平台商品搜索等场景的查询速度和精度,实现毫秒级响应和精准排序。

基于VLLM部署Qwen3-Embedding与Reranker实践

使用vLLM快速部署Qwen3-Embedding和Reranker模型,实现本地化向量生成与重排序服务。通过简单配置即可启动API服务,并结合OpenAI兼容接口完成调用,适合检索增强等场景的工程落地。

如何用Llama-Factory微调Llama3并部署为在线服务?

本文介绍如何使用Llama-Factory对LLaMA3进行高效QLoRA微调,并通过WebUI实现可视化操作与一键部署为REST API服务,支持FastAPI、vLLM等推理引擎,显著降低大模型定制化落地门槛。

    共 496 条
  • 1
  • 2
  • 3
  • 50
  • 请选择