logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

TileLang国产算子编程语言解析与应用实践

实际使用中发现,平台提供的H100测试环境能完美还原论文中的性能数据,一键部署功能让算法验证变得非常便捷。自动调度机制可减少80%以上的样板代码,FlashAttention实现仅需80行。多后端代码生成覆盖CUDA/Ascend C等主流硬件。支持Jupyter Notebook交互式开发。编译器自动生成优化后的CUDA代码。

Claude Code 配置 Taotoken 详细步骤,告别令牌不足与连接困扰

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。👉。

将Hermes Agent工具连接到Taotoken的自定义提供方配置

Hermes Agent 是一款功能强大的AI代理开发框架,支持通过自定义提供方(custom provider)接入不同的模型服务。Taotoken 作为大模型聚合分发平台,提供了与 OpenAI 兼容的 API,可以方便地作为 Hermes Agent 的后端模型服务。本文将详细介绍如何将 Hermes Agent 配置为使用 Taotoken 的自定义提供方,涵盖从获取凭证到完成测试的完整步

在Python项目中集成多模型服务实现智能客服问答场景

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。👉。

OpenClaw语音交互:Qwen3.5-9B实现本地化语音助手

本文介绍了如何在星图GPU平台上自动化部署Qwen3.5-9B 90 亿参数开源大语言模型,实现本地化语音助手功能。通过该方案,用户可构建完全离线的智能交互系统,典型应用于智能家居控制场景,如语音调节灯光、播放音乐等,兼顾隐私保护与实时响应。

#智能家居
Linux下如何配置ollama在GPU上高效运行模型

如果发现GPU未被使用,可能是驱动加载问题。对于想要深入优化性能的用户,建议关注模型的量化版本选择和批处理大小调整,这些细节也会显著影响GPU的利用率。在实际操作中,我发现容器方案虽然需要额外配置,但稳定性更高,特别是在多用户共享GPU资源的场景下。:运行模型后,通过ollama ps命令可以查看处理器使用情况,但更准确的方式是实时监控nvidia-smi的输出,观察GPU利用率和功耗是否达到预期

OpenClaw语音交互方案:GLM-4.7-Flash对接Whisper实现语音指令

本文介绍了如何在星图GPU平台上自动化部署【ollama】GLM-4.7-Flash镜像,实现与Whisper对接的语音交互方案。该方案通过自然语言处理技术,将语音指令转换为可执行操作,典型应用于智能家居控制和无障碍办公场景,显著提升人机交互效率。

造相 Z-Image 行业应用:电商详情页配图自动化生成实战解析

本文介绍了如何在星图GPU平台自动化部署造相 Z-Image 文生图模型(内置模型版)v2镜像,实现电商详情页配图的自动化生成。该方案能快速生成高质量、风格统一的商品图片,大幅降低设计成本,提升电商运营效率。

vLLM-v0.17.1部署教程:AMD GPU(ROCm)环境适配与性能调优

本文介绍了如何在星图GPU平台上自动化部署vLLM-v0.17.1镜像,实现高效的大型语言模型推理。该镜像专为AMD GPU(ROCm)环境优化,支持连续批处理和多种量化选项,适用于智能客服、文本生成等场景,显著提升AI应用的响应速度和处理能力。

OpenClaw任务编排:千问3.5-9B复杂工作流可视化设计

本文介绍了如何在星图GPU平台上自动化部署千问3.5-9B镜像,并利用OpenClaw任务编排工具实现复杂工作流的可视化设计。该方案特别适用于电商价格监控等场景,通过AI模型自动分析多平台价格差异并生成报告,显著提升数据处理效率与决策智能化水平。

    共 134 条
  • 1
  • 2
  • 3
  • 14
  • 请选择