logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

开发AI应用时如何利用Taotoken模型广场进行多模型选型与测试

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。👉。

为Hermes Agent配置Taotoken自定义供应商接入大模型

Hermes Agent 是一个功能强大的AI智能体开发框架,它支持通过自定义供应商来接入不同的模型服务。如果你希望使用 Taotoken 平台提供的多样化大模型能力,并将其集成到 Hermes Agent 项目中,配置自定义供应商是一个直接且高效的方法。本文将详细介绍如何将 Taotoken 设置为 Hermes Agent 的 custom 供应商,涵盖从获取凭证到完成配置的完整步骤。

Qwen3-VL-8B智能客服应用:用户发截图,AI秒懂问题并解答

本文介绍了如何在星图GPU平台上自动化部署Qwen3-VL-8B镜像,构建智能客服系统。该方案能自动解析用户发送的截图,结合上下文精准识别问题并提供解决方案,显著提升客服效率与用户体验,适用于软件报错、电商售后等典型场景。

ollama下载模型卡顿?vLLM动态批处理来救场

本文探讨了本地大模型推理中常见卡顿问题,指出ollama等工具在高并发下的性能瓶颈,并介绍vLLM如何通过动态批处理和PagedAttention技术显著提升吞吐量与显存利用率。实测显示,vLLM可在相同硬件下支持更多并发请求,降低延迟,实现高效稳定的推理服务。

ollama-QwQ-32B量化部署:在4GB内存设备运行OpenClaw的配置

本文介绍了如何在星图GPU平台上自动化部署【ollama】QwQ-32B量化镜像,实现在4GB内存设备上运行OpenClaw大模型。通过4-bit量化技术,该方案将内存需求从32GB降至3.2GB,使树莓派等轻量设备能够支持个人知识管理、自动化任务等AI应用场景,为资源受限环境提供可行的AI解决方案。

保姆级教程:用Ollama玩转Qwen2.5-VL多模态大模型

本文介绍了如何在星图GPU平台自动化部署【ollama】Qwen2.5-VL-7B-Instruct镜像,实现多模态AI应用。该镜像具备强大的图像理解能力,可自动分析图片内容、识别物体和场景,适用于智能图像描述、文档信息提取等视觉任务,提升内容处理效率。

从零开始:Qwen3-ASR语音识别工具的详细使用指南

本文介绍了如何在星图GPU平台自动化部署Qwen/Qwen3-ASR-0.6B镜像,实现高效的语音识别应用。该镜像支持20多种语言的本地化语音转文字处理,典型应用于会议记录转录、视频字幕生成等场景,提升工作效率并保障数据隐私安全。

#语音识别
免费开源!Qwen3-ASR-0.6B语音识别系统搭建指南

本文介绍了如何在星图GPU平台上自动化部署Qwen3-ASR-0.6B语音识别镜像,实现高效的多语言语音转文字功能。该镜像支持52种语言识别,可应用于会议实时转录、字幕生成等场景,大幅提升音频内容处理效率。

#语音识别
物流数据分析提速5倍:用MGeo镜像轻松实现地址标准化

本文介绍了如何在星图GPU平台上自动化部署MGeo地址相似度匹配实体对齐-中文-地址领域镜像,高效实现物流场景下的地址标准化与相似度匹配。通过预置环境一键启动,用户可快速将非结构化收货地址(如'杭州西溪湿地附近')自动解析并统一为标准行政区划格式,显著提升配送热力图生成与订单合并效率。

LangFlow与物流路径优化结合:降低运输成本与时间

通过LangFlow可视化编排技术,结合大语言模型与地图API,实现物流路径的智能决策与动态优化。业务人员无需编码即可构建多目标成本模型,提升调度效率、降低运输成本,并增强决策透明度与执行协同。

    共 351 条
  • 1
  • 2
  • 3
  • 36
  • 请选择