logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Qwen3.5-27B镜像交付标准:符合OCI规范的多模态模型容器封装

本文介绍了如何在星图GPU平台上自动化部署千问3.5-27B镜像,实现多模态AI交互功能。该镜像支持文本对话与图片理解双重能力,特别优化中文场景,可快速搭建智能客服、内容审核等应用场景,提升多模态任务处理效率。

Qwen3-4B-Thinking-2507-Gemini-2.5-Flash-Distill Chainlit A/B测试框架

本文介绍了如何在星图GPU平台上自动化部署Qwen3-4B-Thinking-2507-Gemini-2.5-Flash-Distill镜像,构建高效的文本生成模型。该镜像专为模拟Gemini 2.5 Flash的输出风格设计,适用于金融、健康、法律等专业领域的智能问答和内容生成场景,通过Chainlit前端和A/B测试框架可快速验证模型性能。

开源类Claude大模型本地部署:从架构解析到实战调优

大型语言模型(LLM)作为当前人工智能领域的核心技术,通过Transformer架构实现了对海量文本数据的深度理解与生成。其工作原理基于自注意力机制,能够捕捉长距离语义依赖,从而在对话、创作、编程等多种任务中展现出强大能力。从技术价值看,开源LLM打破了闭源模型的垄断,为开发者提供了可定制、可审计、可私有化部署的AI基础设施,显著降低了技术门槛与应用成本。在实际应用场景中,企业可将开源大模型部署于

Qwen3-4B-Thinking-2507-Gemini-2.5-Flash-Distill推理可控性探索:温度/Top-p/重复惩罚实测

本文介绍了如何在星图GPU平台上自动化部署Qwen3-4B-Thinking-2507-Gemini-2.5-Flash-Distill镜像,探索其推理可控性参数(温度/Top-p/重复惩罚)的优化配置。该模型特别适用于多领域文本生成任务,如技术文档编写、营销文案创作等,通过参数调整可平衡输出的一致性与创造性。

Taotoken 用量看板如何帮助个人开发者清晰掌控 API 成本

Taotoken 用量看板为个人开发者提供了多维度的 API 调用数据分析能力。控制台默认展示最近 30 天的累计用量概览,包括总 token 消耗量、请求次数和费用支出。数据每小时更新一次,开发者可以随时查看近期的调用趋势。在用量详情页面,系统会按模型类型自动分类统计消耗量。例如 Claude 系列模型与 GPT 系列模型的 token 使用情况会分别汇总,方便开发者对比不同模型在实际项目中的资

使用Taotoken后API调用延迟与稳定性的实际观测体验

本次观测基于一个中等规模的对话应用开发项目,持续7天通过Taotoken平台调用多种主流模型API。测试期间平均每天发起约5000次请求,涉及文本生成、代码补全等典型场景。测试覆盖了claude-sonnet-4-6、gpt-4-turbo-preview等常见模型,请求分布在每天的不同时段,以模拟真实使用场景。所有请求均通过基地址发出,使用标准OpenAI兼容接口格式。

解决ClaudeCode频繁封号与Token不足问题转向稳定聚合平台

通常需要修改其配置文件。在macOS或Linux系统上,配置文件路径一般为。

解锁AI超级能力:Phi-4-mini-reasoning多智能体(Agent)协作框架设计

本文介绍了如何在星图GPU平台上自动化部署Phi-4-mini-reasoning镜像,构建多智能体协作框架。该框架通过规划者、执行者和校验者的角色分工,高效完成复杂任务如软件开发,显著提升代码质量和开发效率。典型应用场景包括从零开发Markdown编辑器等需要多阶段协作的项目。

从零构建轻量级AI智能体:微架构设计与运维自动化实践

智能体(Agent)作为人工智能领域的关键技术,其核心原理是让大型语言模型(LLM)具备感知、决策与执行能力。通过将LLM的认知能力与具体工具函数(Tools)相结合,智能体能够理解用户指令、调用外部API或执行代码,从而完成自动化任务,其技术价值在于将AI从单纯的对话交互升级为可自主行动的“数字员工”。在应用场景上,智能体特别适用于运维监控、数据抓取、报告生成等需要重复性判断与操作的领域。本文以

#AI智能体
Parlant对话控制层:构建可靠AI智能体的动态上下文工程实践

在构建面向生产环境的AI智能体时,如何确保其行为可控、合规且一致是核心挑战。传统方法如冗长的系统提示词容易导致模型忽略关键指令,而僵化的状态机流程图则难以应对自然对话的非线性跳跃。其根本原理在于需要将动态的对话逻辑从大语言模型的生成过程中解耦出来。Parlant框架通过引入“动态上下文工程”这一技术范式,提供了一个运行时匹配引擎,在每轮对话中实时扫描用户输入与历史,精准匹配并组装当前最相关的行为规

    共 348 条
  • 1
  • 2
  • 3
  • 35
  • 请选择