logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

为ubuntu上的开源agent工具hermes配置taotoken自定义提供商

现在您已经成功将 Hermes Agent 配置为使用 Taotoken 作为自定义提供商。如需了解更多功能或查看最新支持的模型,请访问。所有请求将通过 Taotoken 平台路由到您指定的模型,并在控制台中记录使用量和费用。Taotoken 提供了官方 CLI 工具来简化配置过程。如果配置正确,您应该能看到来自 Taotoken 的模型响应。路径,这是与 OpenAI 兼容 API 的关键区别。

GLM-4-9B-Chat-1M应用场景:新闻媒体长篇调查报道事实核查+信源交叉验证

本文介绍了如何在星图GPU平台上自动化部署GLM-4-9B-Chat-1M镜像,赋能新闻媒体行业。该平台简化了部署流程,使记者能快速利用该模型处理超长文本,核心应用场景是自动对海量调查材料进行事实核查与信源交叉验证,显著提升深度报道的效率和准确性。

GLM-4.7-Flash实战落地:烟草专卖局执法文书智能生成系统

本文介绍了如何在星图GPU平台自动化部署GLM-4.7-Flash镜像,快速搭建智能文书生成系统。该系统能自动提取案件信息并生成符合规范的执法文书,大幅提升烟草专卖局的文书编写效率与准确性,适用于行政处罚决定书等多种法律文书的自动化生成场景。

Qwen-Ranker Pro性能优化:Linux系统下的GPU资源调配

本文介绍了如何在星图GPU平台上自动化部署Qwen-Ranker Pro: 智能语义精排中心Web镜像,实现高效的GPU资源调配与性能优化。该镜像专注于智能语义重排序任务,可应用于电商搜索、内容推荐等场景,通过动态调整批处理大小和计算核心分配,显著提升语义匹配的准确性和处理效率。

Qwen-Ranker Pro在招聘系统中的应用:JD与简历语义匹配精度提升

本文介绍了如何在星图GPU平台上自动化部署Qwen-Ranker Pro: 智能语义精排中心Web镜像,实现招聘系统中岗位描述(JD)与候选人简历的高精度语义匹配。通过Cross-Encoder深度重排序,显著提升Top-5匹配准确率,广泛应用于技术岗初筛、HR智能推荐等典型场景。

4-bit量化黑科技:GLM-4-9B-Chat-1M低显存部署教程

本文介绍了如何在星图GPU平台自动化部署🤖 GLM-4-9B-Chat-1M - 本地百万长文本大模型镜像。该镜像通过4-bit量化技术实现低显存需求,支持处理长达百万tokens的文本,典型应用于一次性分析整本学术论文或法律合同,并提取核心观点与关键条款。

无需GPU!Qwen-Image图片生成服务云端体验全记录

本文介绍了如何在星图GPU平台上自动化部署基于Qwen-Image-2512-SDNQ-uint4-svd-r32的图片生成服务镜像。该服务让用户无需本地GPU即可通过浏览器输入文字描述快速生成高质量图片,适用于电商配图、社交媒体内容和概念设计等场景,大幅降低了AI绘画的技术门槛和使用成本。

从零开始:GLM-OCR图片文字识别保姆级教程

本文介绍了如何在星图GPU平台上一键自动化部署GLM-OCR镜像,实现高效的图片文字识别。该镜像支持文本、表格和公式的精准识别,可广泛应用于文档数字化、数据提取和自动化办公等场景,显著提升信息处理效率。

#文字识别
低配电脑也能用!GLM-Image优化部署方案

本文介绍了如何在星图GPU平台自动化部署智谱AI GLM-Image镜像,快速搭建文本生成图像的Web交互界面。该方案特别优化了低配设备,支持CPU Offload技术降低显存需求,用户可通过自然语言描述轻松生成高质量图片,适用于社交媒体配图、设计灵感获取等创意场景。

DeepSeek-R1-Distill-Qwen-1.5B多平台适配:手机/PC/嵌入式实操

本文介绍了如何在星图GPU平台自动化部署DeepSeek-R1-Distill-Qwen-1.5B镜像,实现多平台AI助手应用。该镜像经过蒸馏训练,仅需3GB显存即可运行,支持在手机、PC及嵌入式设备上进行文本生成、代码辅助和逻辑推理等任务,大幅降低AI应用部署门槛。

#边缘计算
    共 592 条
  • 1
  • 2
  • 3
  • 60
  • 请选择