logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Qwen2.5-0.5B部署成本太高?低成本GPU方案实战优化

本文介绍了如何在星图GPU平台上自动化部署Qwen2.5-0.5B-Instruct镜像,实现低延迟、高可用的轻量级中文指令推理服务。依托平台能力,用户可在RTX 4060 Ti等低成本GPU上一键部署,典型应用于智能客服应答、设备说明书解析及电商短文案生成等场景,显著降低算力成本与运维复杂度。

PaddlePaddle-v3.3监控告警:GPU利用率实时监测设置

本文介绍了基于星图GPU平台,如何自动化部署PaddlePaddle-v3.3镜像并实现GPU利用率的实时监控与告警。通过Python脚本结合nvidia-smi工具,可高效采集GPU使用数据,并在模型微调等训练场景中及时发现资源瓶颈,提升算力利用效率与任务稳定性。

QwQ-32B在ollama中的GPU算力适配方案:32B模型显存占用优化实录

本文介绍了如何在星图GPU平台上自动化部署【ollama】QwQ-32B镜像,并针对该32B大语言模型的显存占用问题提供优化方案。通过量化、分片加载等策略,用户可在有限GPU资源上高效运行该模型,实现复杂的文本推理与逻辑分析等应用,显著提升本地AI部署的可行性。

SGLang与普通LLM框架有何不同?对比实测

本文介绍了如何在星图GPU平台上自动化部署SGLang-v0.5.6镜像,显著提升大语言模型的结构化输出能力与多轮对话效率。该镜像支持正则约束解码和RadixAttention缓存复用,典型应用于AI Agent中高可靠JSON格式的API响应生成,降低后处理开销并提升服务稳定性。

5分钟上手Open-AutoGLM,用AI自动操作手机太简单了

本文介绍了基于星图GPU平台自动化部署Open-AutoGLM – 智谱开源的手机端AI Agent框架的方法。通过该平台,用户可快速搭建环境,实现自然语言指令驱动的手机自动化操作,适用于模型微调、AI应用开发等场景,显著提升移动设备上的智能交互效率。

Open-AutoGLM使用全解析:自然语言控制安卓设备

本文介绍了如何在星图GPU平台上自动化部署Open-AutoGLM – 智谱开源的手机端AI Agent框架镜像,实现自然语言控制安卓设备的核心能力。用户可通过简单指令(如‘打开微信发送截图’)完成跨APP操作、表单填写与批量任务,显著提升移动场景下的自动化效率。

Youtu-Parsing构建智能Agent:自动阅读技术手册并回答查询

本文介绍了如何利用星图GPU平台,自动化部署Youtu-Parsing多模态文档智能解析模型,快速构建智能文档问答Agent。该方案能自动解析PDF技术手册中的图文信息,并结合大语言模型,实现针对复杂技术文档的精准、可溯源的智能问答,极大提升工程师查阅手册和获取知识的效率。

nanobot保姆级教程:Qwen3-4B-Instruct模型服务端口映射与公网访问配置

本文介绍了如何在星图GPU平台上自动化部署🐈 nanobot:超轻量级OpenClaw镜像,实现AI助手服务。该镜像内置Qwen3-4B-Instruct模型,支持通过Web界面或QQ机器人进行智能对话,适用于个人AI助手、社交平台智能客服等典型应用场景,大幅降低部署门槛。

#AI助手
Open-AutoGLM能否用于反欺诈检测?风控流程实战案例

本文探讨了如何利用星图GPU平台自动化部署智谱开源的手机端AI Agent框架Open-AutoGLM,并将其应用于金融反欺诈风控领域。通过模拟真人操作手机应用,该框架可自动化执行社交账号核查等任务,例如自动搜索并分析抖音账号信息,作为辅助调查工具提升风控流程的效率和一致性。

Open-AutoGLM开发者模式开启详细步骤

本文介绍了如何在星图GPU平台上自动化部署Open-AutoGLM – 智谱开源的手机端AI Agent框架镜像,实现安卓设备的智能自动化操作。通过平台一键部署模型服务与控制端,用户可快速开展UI交互任务,如自动打开应用、发送消息、批量设备测试等典型移动端AI Agent应用场景。

    共 192 条
  • 1
  • 2
  • 3
  • 20
  • 请选择