logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Open Claw:YAML驱动的大模型服务编排与动态路由框架

大模型服务编排是指将多个异构大模型(如Qwen2、Llama 3、DeepSeek-V2)统一纳管、按需调度的技术范式。其核心原理在于抽象推理引擎(vLLM/llama.cpp/Ollama)差异,通过声明式配置实现模型注册、端点暴露与智能路由。技术价值体现在降低AI中台运维复杂度、支撑RAG/Agent多模型协同、保障金融政务级灰度发布与合规审计。典型应用场景包括私有AI中台建设、意图驱动的模型

PySpark+AI:用自然语言驱动分布式数据分析

自然语言接口正重塑大数据处理范式——它将传统基于语法的 PySpark DataFrame 编程,升级为以业务意图为核心的交互方式。其核心原理是 LLM(如 GPT)作为意图解析器,LangChain 提供结构化推理与上下文编排,PySpark 则承担执行与实时校验双重角色。这种‘理解-生成-执行-反馈’闭环,显著提升分析效率与可解释性,尤其适用于快速探索、低代码平台构建及跨职能协作场景。pysp

vLLM显存优化实战:AWQ量化与PagedAttention调优指南

大语言模型推理框架vLLM以高性能著称,但其核心机制——如PagedAttention内存管理与AWQ权重量化——高度依赖GPU显存的高效利用。理解显存分配原理(如预加载、KV Cache动态增长、CUDA Graphs隐式开销)是突破本地部署瓶颈的关键。AWQ通过激活感知压缩模型权重,显著降低参数显存占用;而PagedAttention则借鉴操作系统虚拟内存思想,实现KV缓存的离散化分页复用,提

#vLLM
AI Agent Runtime 正在成为新的操作系统层

AI Agent Runtime 是指支撑大语言模型智能体(Agent)可靠、安全、可追溯执行的底层基础设施,其核心在于解耦状态管理、执行逻辑与沙箱环境。它借鉴操作系统对进程、内存和I/O的抽象思想,通过事件日志(session)、无状态执行器(harness)和凭证隔离沙箱(sandbox)实现工程稳定性与合规可验证性。这一层的技术价值不在于加速单次调用,而在于保障多步骤、长周期、跨工具链任务的

基于Claude与MCP协议实现App Store与Google Play自动化发布

在DevOps与持续交付实践中,应用发布自动化是提升研发效能的关键环节。传统方案通常依赖官方命令行工具或直接调用REST API,但面临着维护成本高、脚本脆弱且需处理复杂认证等挑战。Model Context Protocol(MCP)作为一种新兴的模型上下文协议,通过将复杂的平台API操作封装成标准化的“工具”,显著降低了自动化集成的技术门槛。其技术价值在于,开发者无需深入理解苹果JWT签名或谷

C程序编译链接全流程解析:从源代码到可执行文件的完整旅程

编译与链接是计算机程序从高级语言源代码转换为机器可执行代码的核心过程,涉及预处理、编译、汇编和链接等多个阶段。预处理阶段负责宏展开、条件编译和头文件包含等文本处理工作,为后续编译做准备。编译阶段则进行词法分析、语法分析、语义分析,并生成中间代码进行优化,最终转换为目标平台的汇编指令。链接器将多个目标文件及库文件合并,完成符号解析、地址分配和重定位,生成最终的可执行文件或共享库。理解编译链接原理对于

别再只盯着EDF和RR了:深入解读实时调度算法对WCET分析的隐藏影响与避坑指南

本文深入探讨了实时调度算法对WCET(最坏情况执行时间)分析的隐藏影响,揭示了调度算法与WCET交互产生的复杂效应,如优先级反转、资源竞争等。通过对比主流调度算法的实际成本,提供系统级WCET分析的避坑指南和优化策略,帮助开发者在嵌入式实时系统设计中实现更精确的时间预测和性能优化。

Launchpad容器化GPU云平台:开箱即用的LLM推理与微调实践

容器化GPU是当前AI工程落地的关键范式,它通过Docker镜像固化CUDA、cuDNN、PyTorch及模型服务栈,实现环境可复现与秒级部署。其核心原理在于利用NVIDIA Container Toolkit直通GPU设备,兼顾裸金属性能与容器轻量优势。技术价值体现在显著降低LLM推理和模型微调的运维门槛,让开发者聚焦算法而非驱动兼容性问题。典型应用场景包括快速验证大模型效果、批量微调领域适配器

Claude Code in Cursor:代理式AI编程的可审查实践

在现代AI编程实践中,'agentic(代理式)'架构正逐步替代传统对话式代码生成,其核心在于将‘思考’与‘执行’解耦,实现可计划、可审查、可回溯的工程化协作。Claude Code 以 plan-first 设计范式,结合 CLAUDE.md 项目宪法与 MCP 协议,构建起面向微服务重构、遗留系统治理、多仓库协同等高风险场景的深度编程工作流。它不追求交互速度,而专注上下文感知精度、修改粒度控制

为oracle 的保留字,Oracle基础之保留字和关键字

Oracle基础之保留字和关键字在Oracle之中,有分为保留字和关键字,所谓关键字就是Oracle中有实际意义的,而保留字(比如DESC、ORDER等等)是Oracle中不能随便使用的,比如不能随便用来做表的列名,当然关键字(比如KEY等等)也是不推荐的,不过使用的话是不会报错的,而保留字被使用不当的话是会报错的然后如何区分保留字和关键字?Oracle中可以通过查询v$reserved_word

    共 18 条
  • 1
  • 2
  • 请选择