logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

通义千问2.5-7B显存不足?低成本RTX 3060部署案例详解

本文介绍了基于星图GPU平台自动化部署通义千问2.5-7B-Instruct镜像的完整方案。通过该平台,用户可在配备RTX 3060等消费级显卡的设备上高效运行模型,支持本地化AI应用开发与模型微调,适用于长文本处理、代码生成及AI Agent构建等场景,实现低成本、高性能的大模型落地。

通义千问1.5-1.8B-Chat-GPTQ-Int4进阶教程:使用SolidWorks API进行自动化设计文档生成

本文介绍了如何在星图GPU平台上自动化部署通义千问1.5-1.8B-Chat-GPTQ-Int4镜像,并利用其与SolidWorks API结合,实现自动化设计文档生成。该方案通过AI模型智能处理三维设计数据,可自动生成设计说明、物料清单等专业文档,有效提升机械设计领域的工作效率。

为 Claude Code 编程助手配置 Taotoken 作为后端模型服务

对于习惯使用 Claude Code 进行编程辅助的开发者来说,直接接入多个大模型提供商往往意味着需要管理多个 API Key 和不同的服务端点。Taotoken 平台提供了统一的 Anthropic 兼容 API 通道,允许你将 Claude Code 的后端服务指向 Taotoken,从而通过一个入口调用平台聚合的多种模型。本文将指导你完成这一配置过程。

使用Taotoken为Claude Code配置稳定API通道避免封号困扰

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。👉。

教育机构搭建AI编程实验室如何借助Taotoken管控学生用量与成本

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。👉。

初次接触大模型api如何阅读taotoken文档并运行示例代码

Taotoken官方文档采用模块化设计,主要分为以下几个核心部分。首次访问时,建议先浏览左侧导航栏的整体框架,对平台能力建立基本认知。文档顶部通常会有搜索框,支持关键词快速定位。对于API开发者而言,最常使用的是「API接入」和「控制台指南」两大板块。前者包含各协议兼容接口的技术规范,后者则详细说明如何在控制台创建和管理API Key、查看用量数据等操作流程。文档中的代码示例均经过验证,可直接复制

保姆级教程:用Ollama在普通电脑上部署GPT-OSS-20B,完全免费离线使用

本文介绍了如何在星图GPU平台上自动化部署GPT-oss:20b镜像,实现本地化AI应用。通过该平台,用户可快速搭建私有化大模型服务,并将其应用于文本生成、代码辅助、内容创作等场景,享受离线、免费的智能助手体验。

ollama下载模型太慢?试试vLLM本地缓存加速技术

本文介绍如何使用vLLM解决ollama模型重复下载和推理性能低的问题。通过PagedAttention、连续批处理和本地缓存技术,实现高吞吐、低延迟的本地大模型部署,支持多并发、快速切换与企业级应用。

#vLLM
gpt-oss-20b词表设计解析:对中文支持做了哪些优化?

本文深入解析GPT-OSS-20B模型在中文支持上的核心创新,重点探讨其预分词增强、双通道词表融合与动态合并策略如何提升中文切分效率,并减少35% token消耗。同时介绍harmony格式训练机制对结构化输出的优化,以及低资源部署的系统级协同设计。

DeepSeek-R1-Distill-Qwen-1.5B惊艳效果:二元方程求解+Python代码生成双案例展示

本文介绍了如何在星图GPU平台上自动化部署DeepSeek-R1-Distill-Qwen-1.5B 本地智能对话助手 (Streamlit 驱动)镜像,实现数学推理与代码生成一体化的本地AI服务。用户可快速启动具备思维链能力的轻量级对话系统,典型应用于二元方程求解教学演示和Python脚本即时生成等场景。

    共 592 条
  • 1
  • 2
  • 3
  • 60
  • 请选择