logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

GLM-4V-9B Streamlit高级功能:支持语音输入指令+图片结果语音播报

本文介绍了如何在星图GPU平台自动化部署GLM-4V-9B镜像,实现语音输入指令和图片分析结果的语音播报功能。该多模态AI模型能理解图像与文本,适用于电商商品描述、教育讲解及无障碍辅助等场景,让交互更自然高效。

GLM-4v-9b保姆级教程:从零部署vLLM+Open WebUI全流程详解

本文介绍了如何在星图GPU平台上自动化部署GLM-4v-9b镜像,高效实现多模态视觉理解任务。用户可快速搭建支持图片上传与分析的服务环境,典型应用于财务报表OCR提取、Excel图表自然语言描述生成及手写数学题智能解析等中文办公场景,显著提升非结构化图像信息处理效率。

GLM-4-9B-Chat-1M实测:8GB显存跑百万token大模型

本文介绍了如何在星图GPU平台自动化部署🤖 GLM-4-9B-Chat-1M - 本地百万长文本大模型镜像,实现高效处理百万token长文本。该模型适用于技术文档总结、代码分析等场景,仅需8GB显存即可在本地安全运行,提升数据处理效率。

Qwen-Audio歌声合成展示:AI翻唱流行歌曲

本文介绍了如何在星图GPU平台上一键自动化部署QWEN-AUDIO | 智能语音合成系统Web镜像,实现AI歌声合成功能。该镜像能够生成富有情感和音高变化的AI翻唱歌曲,适用于音乐创作辅助、短视频配乐等场景,显著提升音频内容的生产效率与创意表现。

DeepSeek-OCR-2技术揭秘:视觉token压缩算法解析

本文介绍了星图GPU平台如何自动化部署DeepSeek-OCR-2智能文档解析工具镜像,实现高效的文档识别与处理。该镜像通过创新的视觉token压缩技术,将复杂文档的视觉token压缩至256-1120个,显著提升处理效率,特别适用于多栏文档、表格报告等复杂场景的自动化信息提取,助力企业快速实现文档数字化。

vLLM-v0.17.1部署教程:Jupyter中加载本地GGUF模型并调用vLLM API

本文介绍了如何在星图GPU平台上自动化部署vLLM-v0.17.1镜像,实现高效的大语言模型推理。通过该平台,用户可快速在Jupyter环境中加载本地GGUF模型并调用vLLM API,适用于智能客服、文本生成等场景,显著提升自然语言处理任务的效率。

#vLLM
如何在Llama-Factory中实现prompt-tuning而非fine-tuning?

本文介绍如何在Llama-Factory框架中使用Prompt Tuning进行轻量级大模型适配,通过冻结主干参数、仅训练少量可学习的soft prompt向量,实现低显存、多任务共享和快速部署,适合资源有限的开发者高效定制大模型。

AI+教育创新实践:Qwen3-VL-2B课件图文解析部署案例

本文介绍了如何在星图GPU平台自动化部署Qwen/Qwen3-VL-2B-Instruct视觉理解机器人镜像,实现教育场景的智能课件图文解析。该镜像能够识别教学图片中的内容,如解析生物学图表、数学公式等,并提供详细的问答交互,助力教师与学生进行高效的多模态教学与学习。

Qwen3-0.6B-FP8效果展示:思考模式下算法时间复杂度分析过程

本文介绍了如何在星图GPU平台上自动化部署Qwen3-0.6B-FP8镜像,并展示了其核心的“思考模式”功能。该模式能逐步推导并展示算法时间复杂度分析的完整过程,为算法学习、代码审查和技术面试准备提供了直观的辅助工具,有效提升理解与效率。

Qwen3字幕对齐入门:清音刻墨镜像中宣纸UI与后端Qwen3模型解耦设计

本文介绍了如何在星图GPU平台自动化部署🎬 清音刻墨 · Qwen3 智能字幕对齐系统镜像,实现高效精准的字幕生成。该系统基于Qwen3模型,能够将音频内容自动转换为毫秒级精准对齐的字幕文件,广泛应用于影视制作、在线教育视频的字幕添加与时间轴标注,大幅提升内容创作效率。

#语音识别
    共 579 条
  • 1
  • 2
  • 3
  • 58
  • 请选择