logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

IntelliJ IDEA插件开发初探:打造专属的通义千问代码补全助手

本文介绍了如何利用星图GPU平台,自动化部署通义千问1.5-1.8B-Chat-GPTQ-Int4镜像,以开发IntelliJ IDEA智能编码插件。该插件能集成大模型能力,实现代码智能补全、自动生成方法注释等核心功能,显著提升Java开发者的编程效率与体验。

一键切换艺术风格:千问16Bit模型多风格对比

本文介绍了如何在星图GPU平台上自动化部署千问图像生成 16Bit (Qwen-Turbo-BF16)镜像,实现高效AI艺术创作。该平台简化了部署流程,用户可快速利用该镜像生成高质量图片,例如一键生成赛博朋克风格的城市夜景图,显著提升内容创作效率。

通义千问3-4B为何能对标30B?架构设计揭秘与部署实践

本文介绍了如何在星图GPU平台上自动化部署通义千问3-4B-Instruct-2507镜像,充分发挥其4B参数下媲美30B模型的推理能力。该镜像原生支持256K长上下文与指令感知优化,典型应用于RAG法律合同智能解析、Agent自动周报生成等真实业务场景,显著提升AI落地效率与响应确定性。

#RAG
通义千问2.5-7B-Instruct性能实测:C-Eval基准测试全流程详解

本文介绍了如何在星图GPU平台上自动化部署通义千问2.5-7B-Instruct镜像,快速构建高性能中文大模型推理服务。该镜像支持零样本问答、多轮对话与文件解析,典型应用于高校课程思政案例生成、技术文档辅助编写及跨语言商务邮件处理等真实业务场景,兼顾精度、速度与易用性。

WuliArt Qwen-Image Turbo在创意设计中的应用:电商海报/头像/壁纸快速生成

本文介绍了如何在星图GPU平台上自动化部署🎨 WuliArt Qwen-Image Turbo镜像,实现高效的AI图像生成。该平台简化了部署流程,用户可快速利用该镜像的核心功能,例如通过输入文字描述,在几秒内生成适用于电商海报、个性化头像或高清壁纸的视觉素材,极大提升了创意设计的效率。

RTX4090加速GPT-4多语言翻译优化电商推荐系统实战经验

本文探讨了基于RTX 4090硬件加速GPT-4多语言翻译在电商推荐系统中的实战应用,涵盖模型架构、推理优化、服务部署与性能评估,提出融合翻译增强特征的跨语言推荐方法。

Qwen3-ASR-1.7B模型微调:法律文书语音转录专项优化

本文介绍了如何在星图GPU平台上自动化部署🎙️ Qwen3-ASR-1.7B高精度语音识别工具,并针对法律文书语音转录场景进行专项优化。通过该平台,用户可快速构建法律语音识别服务,应用于庭审录音转写、法律讲座转录等场景,显著提升法律文书处理的准确性和效率。

#语音识别
Matlab科学计算环境调用Python部署的BERT模型混合编程

本文介绍了如何在星图GPU平台上自动化部署BERT文本分割-中文-通用领域镜像,并将其集成至Matlab科学计算环境。通过将BERT模型部署为云端API服务,用户可在Matlab中直接调用,实现自动化文本分割,典型应用于高效分析实验日志、调研问卷等长文本,从而提升工程与科研场景下的数据处理效率。

Fun-ASR系统设置优化指南:GPU加速、内存清理,让识别速度翻倍

本文介绍了如何在星图GPU平台上自动化部署Fun-ASR钉钉联合通义推出的语音识别大模型语音识别系统(构建by科哥),并对其进行系统设置优化。通过配置GPU加速与内存清理等关键参数,可显著提升语音识别速度,典型应用于高效处理会议录音、访谈等长音频文件的转写任务。

#语音识别
GLM-4-9B-Chat-1M镜像权限管理:RBAC角色控制、API Key分级、审计日志开启

本文介绍了如何在星图GPU平台上自动化部署【vllm】glm-4-9b-chat-1m镜像,并构建企业级权限管理体系。通过整合RBAC角色控制、API Key分级与审计日志,该方案能有效保障大模型服务的安全访问,适用于构建内部知识问答、智能客服等需要精细化权限管控的对话应用场景。

    共 333 条
  • 1
  • 2
  • 3
  • 34
  • 请选择