logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Qwen3-1.7B性能压测报告:TPS/QPS实测数据分享

本文介绍了如何在星图GPU平台上自动化部署Qwen3-1.7B镜像,实现高并发、低延迟的轻量级大语言模型推理服务。基于A10单卡即可稳定支撑近50 QPS,适用于智能客服兜底、移动端AI后端及RAG重排等典型场景,显著提升资源利用率与响应体验。

Llama3-8B + vLLM 高效推理部署:吞吐量提升技巧实战

本文介绍了如何在星图GPU平台上自动化部署Meta-Llama-3-8B-Instruct镜像,结合vLLM实现高效推理服务。通过优化参数配置,可显著提升吞吐量,适用于英文邮件撰写、代码生成等文本生成任务,助力开发者低成本构建稳定可用的AI对话系统。

#vLLM
Qianfan-OCR实战案例:OCR结果接入LangChain构建企业专属文档RAG系统

本文介绍了如何在星图GPU平台上自动化部署Qianfan-OCR开源的4B参数端到端文档智能多模态模型,实现高效OCR识别与文档结构化处理。该镜像特别适用于企业文档RAG系统构建,能够自动提取合同、发票等关键信息,并与LangChain结合实现智能问答,大幅提升文档处理效率。

为Claude Code编程助手配置Taotoken作为国内稳定接入渠道

Claude Code作为基于Anthropic技术的编程助手,能够为开发者提供代码补全、错误检测和自然语言解释等功能。通过Taotoken平台接入Claude Code服务,开发者可以获得更稳定的国内访问体验。Taotoken提供的Anthropic兼容API端点经过优化,能够减少网络延迟对交互体验的影响。这种集成方式特别适合需要频繁与Claude Code交互的开发者群体。无论是进行日常代码编

vLLM-v0.17.1在教育科技中的应用:个性化习题生成与批改系统

本文介绍了如何在星图GPU平台上自动化部署vLLM-v0.17.1镜像,构建个性化习题生成与批改系统。该平台支持快速搭建教育科技应用,通过AI技术实现智能习题生成、作业自动批改等功能,显著提升教学效率与个性化学习体验。

#vLLM
企业级安全审核怎么搭?Qwen3Guard-Gen-WEB给出标准答案

本文介绍了基于星图GPU平台自动化部署Qwen3Guard-Gen-WEB镜像的高效方案。该平台支持一键拉取镜像并快速启动Web服务,适用于企业级AI内容安全审核场景。通过集成Qwen3Guard-Gen-WEB,用户可实现对AIGC内容的实时风险识别与分级管理,广泛应用于社交、电商等高交互业务的内容治理。

SGLang-v0.5.6实战:5分钟搭建智能工单处理系统,效率提升3倍

本文介绍了如何在星图GPU平台上自动化部署SGLang-v0.5.6镜像,快速搭建智能工单处理系统。该方案利用SGLang框架的高效推理和原生结构化输出能力,实现工单的自动分类、优先级判断与处理指令生成,可显著提升客服与运维场景的工单处理效率。

手把手教你用Ollama部署Phi-3-mini-4k-instruct:保姆级教程

本文介绍了如何在星图GPU平台自动化部署【ollama】Phi-3-mini-4k-instruct镜像,实现高效的本地AI对话与文本生成。该轻量级模型特别适用于编程辅助、内容创作和学习辅导等场景,用户可通过简单配置快速获得代码生成、文本写作和问题解答等智能服务。

#Ollama
DeepSeek-R1-Distill-Llama-8B与LangGraph的知识图谱构建

这个模型有个很特别的地方:它是通过蒸馏技术从更大的DeepSeek-R1模型学来的推理能力。简单说,就是“大老师教小学生”,把复杂的推理模式教给了这个相对较小的模型。数学和逻辑推理能力强:处理“A是B的供应商,B是C的客户,那么A和C是什么关系?”这类问题时,它能准确推理出间接关系。代码理解不错:对于技术文档中的代码片段,它能理解功能和作用,这在构建技术知识图谱时特别有用。上下文长度够用:32K的

GLM-4-9B-Chat-1M实现Python爬虫数据智能处理:自动化采集与清洗

本文介绍了如何在星图GPU平台自动化部署GLM-4-9B-Chat-1M镜像,实现智能化的Python爬虫开发。该镜像能自动生成爬虫代码、处理反爬机制并完成数据清洗,广泛应用于电商数据采集等场景,大幅提升数据处理的效率与智能化水平。

    共 444 条
  • 1
  • 2
  • 3
  • 45
  • 请选择