logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

arm64 x64应用场景对比:嵌入式与高性能计算详解

深入探讨arm64和x64在嵌入式系统与高性能计算中的实际应用差异,结合能效、性能与生态特点,帮助理解arm64在移动与物联网领域的优势,以及x64在桌面与服务器场景的主导地位。

WuliArt Qwen-Image Turbo高算力适配:4090上1024×1024单图显存峰值<18GB

本文介绍了如何在星图GPU平台自动化部署🎨 WuliArt Qwen-Image Turbo镜像,实现高效AI图片生成。该镜像针对RTX 4090等消费级显卡深度优化,支持快速生成1024×1024高清图像,适用于数字艺术创作、社交媒体配图和概念设计等场景,显著提升个人创作效率。

Ollama部署translategemma-12b-it:开源模型+GPU算力优化,推理成本降低67%

本文介绍了如何在星图GPU平台上自动化部署【ollama】translategemma-12b-it镜像,快速搭建本地私有化翻译服务。该方案利用开源模型与GPU算力优化,能显著降低翻译成本,并支持图文翻译等典型应用场景,尤其适合处理需数据安全的文档翻译任务。

AIGlasses_for_navigation高性能部署:单卡RTX4090支持4路ESP32视频流并行处理

本文介绍了如何在星图GPU平台上自动化部署AIGlasses_for_navigation可穿戴智能设备镜像,实现高性能AI导航处理。该方案利用单卡RTX 4090的强大算力,能够并行处理4路ESP32视频流,典型应用场景是为视障人士提供实时环境感知与导航指引,例如识别盲道、障碍物和交通信号灯。

Hunyuan-MT-7B高算力适配:vLLM支持LoRA微调后的热加载部署

本文介绍了如何在星图GPU平台上自动化部署Hunyuan-MT-7B镜像,并利用vLLM推理框架实现LoRA微调模型的热加载。该方案支持用户在不中断服务的情况下,动态切换不同领域的微调模型,典型应用场景包括为法律、医疗等垂直领域提供高质量、定制化的多语言翻译服务。

SiameseAOE中文-base算力适配:显存占用仅3.2GB(FP16),A10即可流畅运行

本文介绍了如何在星图GPU平台自动化部署SiameseAOE通用属性观点抽取-中文-base镜像,实现高效中文文本情感分析。该镜像能够从商品评论等场景中自动抽取属性情感对,如识别“音质很好”中的属性词和情感词,助力电商评论分析与客户反馈处理,仅需3.2GB显存即可流畅运行。

SGLang分布式部署最佳实践,稳定性拉满

本文介绍了如何在星图GPU平台上自动化部署SGLang-v0.5.6镜像,构建高稳定性、高并发的结构化文本生成服务。通过PD分离架构与Mooncake分布式缓存协同,该方案可支撑RAG问答、AI Agent任务编排等典型生产场景,显著降低首Token延迟并保障多轮对话连续性。

Clawdbot汉化版代码实例:Python脚本自动读取企业微信审批单,交由AI生成执行计划

本文介绍了如何在星图GPU平台上自动化部署Clawdbot 汉化版 增加企业微信入口镜像,实现企业微信审批单的AI自动解析与执行计划生成。通过本地化大模型理解审批语义,可快速输出含责任人、时间节点和交付物的结构化任务清单,显著提升采购、HR等流程的自动化水平。

Clawdbot+Qwen3:32B实战教程:构建带人工审核节点(Human-in-the-loop)的合规Agent审批流程

本文介绍了如何在星图GPU平台上自动化部署Clawdbot 整合 qwen3:32b代理网关与管理平台镜像,构建带人工审核节点的合规AI审批流程。该镜像支持合同条款智能分析与高风险识别,典型应用于企业合同初审+法务复核场景,显著提升审批效率与合规性。

AI代理管理利器:Clawdbot整合Qwen3-32B实战体验

本文介绍了如何在星图GPU平台上自动化部署Clawdbot 整合 qwen3:32b代理网关与管理平台镜像,快速构建专业AI代理服务。通过可视化界面即可完成Qwen3-32B模型注册与法律文书助手等代理配置,典型应用于合同条款解析、风险识别与结构化报告生成,显著提升法务场景的AI工程化效率。

    共 127 条
  • 1
  • 2
  • 3
  • 13
  • 请选择