logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

安全隔离策略:多租户环境下模型与数据的权限控制

在共享算力环境下,ms-swift 通过LoRA等轻量微调技术实现模型与数据的逻辑隔离,结合分布式训练、模块化控制和推理封装,保障多租户间权限清晰、资源可控,支持金融、医疗、教育等差异化场景高效安全落地。

MedGemma 1.5部署教程:适配国产昇腾/海光平台的异构算力迁移方案

本文介绍了如何在星图GPU平台上自动化部署 🩺MedGemma 1.5 医疗助手镜像,实现医疗AI模型的快速应用。该平台简化了在异构算力环境下的部署流程,用户可轻松搭建服务,将模型应用于智能医学问答、辅助病例分析等核心场景,提升医疗信息处理效率。

Qwen3-4B Instruct-2507部署案例:中小企业低成本GPU算力高效落地指南

本文介绍了如何在星图GPU平台上自动化部署⚡Qwen3-4B Instruct-2507镜像,赋能中小企业低成本落地高质量AI能力。该镜像专为纯文本任务优化,可稳定运行于单卡GPU环境,典型应用于电商文案生成、API错误排查与合同条款审查等高频业务场景,显著提升内容生产与专业服务效率。

Pixel Dimension Fissioner算力适配:自动设备检测+多GPU负载均衡配置

本文介绍了如何在星图GPU平台上自动化部署🕹️ 像素语言 · 维度裂变器 (Pixel Dimension Fissioner)镜像,实现高效的文本处理与增强功能。该镜像通过自动设备检测和多GPU负载均衡技术,显著提升文本裂变任务的处理速度,适用于创意写作、内容改写等场景,帮助用户轻松获得最优性能。

星图GPU平台网络配置:优化Qwen3-VL:30B与飞书的数据传输

本文介绍了如何在星图GPU平台上自动化部署Clawdbot镜像,实现私有化本地Qwen3-VL:30B大模型与飞书平台的高效集成。通过优化网络配置,该方案能显著提升多模态数据传输效率,典型应用于企业级智能问答和图像理解场景,确保实时交互的流畅性和稳定性。

Clawdbot+Qwen3-32B实战:构建支持RAG增强的智能知识代理平台

本文介绍了如何在星图GPU平台上自动化部署Clawdbot 整合 qwen3:32b代理网关与管理平台镜像,快速构建支持RAG增强的智能知识代理。用户上传企业文档后,系统可自动完成索引与检索,实现精准、可溯源的技术文档问答,适用于客服知识库、产品支持等典型场景。

#RAG
UI-TARS-desktop功能展示:多模态AI Agent的视觉语言能力实测

本文介绍了如何在星图GPU平台上自动化部署UI-TARS-desktop镜像,实现多模态AI Agent的视觉语言交互功能。该镜像基于Qwen3-4B-Instruct-2507模型,能够理解自然语言指令并自动完成界面操作、文件管理等办公任务,显著提升工作效率。典型应用场景包括自动化邮件处理、网页数据提取和文件批量整理等。

AutoGLM-Phone是否耗电?后台运行功耗测试报告

本文介绍了如何在星图GPU平台上自动化部署Open-AutoGLM – 智谱开源的手机端AI Agent框架镜像,实现基于屏幕理解与云端协同的智能UI自动化操作。典型应用场景包括自动抢票、定时打卡及消息聚合回复等无需人工干预的移动端任务流,兼顾低功耗与高可靠性。

Qwen3-4B-Instruct-2507效果惊艳:AutoGen Studio中多Agent协同生成完整微服务架构

本文介绍了如何在星图GPU平台上自动化部署AutoGen Studio镜像,实现多AI Agent协同生成微服务架构。通过可视化配置与Qwen3-4B-Instruct模型集成,用户可一键启动产品、架构、开发与测试Agent协作流程,快速产出Java/Spring Boot微服务项目结构及代码,显著提升软件工程效率。

Open-AutoGLM成本优化案例:零显卡环境部署实操手册

本文介绍了如何在星图GPU平台上自动化部署智谱开源的Open-AutoGLM手机端AI Agent框架,实现低成本AI手机助手。该方案通过云端模型服务与本地控制分离的架构,让用户能够通过自然语言指令,指挥AI自动完成如打开应用、搜索内容等手机操作任务。

    共 130 条
  • 1
  • 2
  • 3
  • 13
  • 请选择