PearlOwl67 个人主页

@PearlOwl67

PearlOwl67

2025-06-16 16:39:16 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

TileLang国产算子编程语言解析与应用实践

实际使用中发现，平台提供的H100测试环境能完美还原论文中的性能数据，一键部署功能让算法验证变得非常便捷。自动调度机制可减少80%以上的样板代码，FlashAttention实现仅需80行。多后端代码生成覆盖CUDA/Ascend C等主流硬件。支持Jupyter Notebook交互式开发。编译器自动生成优化后的CUDA代码。

Claude Code 配置 Taotoken 详细步骤，告别令牌不足与连接困扰

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。👉。

将Hermes Agent工具连接到Taotoken的自定义提供方配置

Hermes Agent 是一款功能强大的AI代理开发框架，支持通过自定义提供方（custom provider）接入不同的模型服务。Taotoken 作为大模型聚合分发平台，提供了与 OpenAI 兼容的 API，可以方便地作为 Hermes Agent 的后端模型服务。本文将详细介绍如何将 Hermes Agent 配置为使用 Taotoken 的自定义提供方，涵盖从获取凭证到完成测试的完整步

在Python项目中集成多模型服务实现智能客服问答场景

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。👉。

OpenClaw语音交互：Qwen3.5-9B实现本地化语音助手

本文介绍了如何在星图GPU平台上自动化部署Qwen3.5-9B 90 亿参数开源大语言模型，实现本地化语音助手功能。通过该方案，用户可构建完全离线的智能交互系统，典型应用于智能家居控制场景，如语音调节灯光、播放音乐等，兼顾隐私保护与实时响应。

#智能家居

Linux下如何配置ollama在GPU上高效运行模型

如果发现GPU未被使用，可能是驱动加载问题。对于想要深入优化性能的用户，建议关注模型的量化版本选择和批处理大小调整，这些细节也会显著影响GPU的利用率。在实际操作中，我发现容器方案虽然需要额外配置，但稳定性更高，特别是在多用户共享GPU资源的场景下。：运行模型后，通过ollama ps命令可以查看处理器使用情况，但更准确的方式是实时监控nvidia-smi的输出，观察GPU利用率和功耗是否达到预期

OpenClaw语音交互方案：GLM-4.7-Flash对接Whisper实现语音指令

本文介绍了如何在星图GPU平台上自动化部署【ollama】GLM-4.7-Flash镜像，实现与Whisper对接的语音交互方案。该方案通过自然语言处理技术，将语音指令转换为可执行操作，典型应用于智能家居控制和无障碍办公场景，显著提升人机交互效率。

造相 Z-Image 行业应用：电商详情页配图自动化生成实战解析

本文介绍了如何在星图GPU平台自动化部署造相 Z-Image 文生图模型（内置模型版）v2镜像，实现电商详情页配图的自动化生成。该方案能快速生成高质量、风格统一的商品图片，大幅降低设计成本，提升电商运营效率。

vLLM-v0.17.1部署教程：AMD GPU（ROCm）环境适配与性能调优

本文介绍了如何在星图GPU平台上自动化部署vLLM-v0.17.1镜像，实现高效的大型语言模型推理。该镜像专为AMD GPU（ROCm）环境优化，支持连续批处理和多种量化选项，适用于智能客服、文本生成等场景，显著提升AI应用的响应速度和处理能力。

OpenClaw任务编排：千问3.5-9B复杂工作流可视化设计

本文介绍了如何在星图GPU平台上自动化部署千问3.5-9B镜像，并利用OpenClaw任务编排工具实现复杂工作流的可视化设计。该方案特别适用于电商价格监控等场景，通过AI模型自动分析多平台价格差异并生成报告，显著提升数据处理效率与决策智能化水平。

共 134 条

请选择