logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Django+React客户管理系统:Ubuntu 18.04生产部署实战

客户信息管理(CIM)是企业数字化转型的基础能力,其核心在于数据一致性、多角色协作与实时交互体验。基于Django的成熟ORM、权限体系和REST API能力,结合React的组件化状态管理与响应式UI,可构建高内聚、低耦合的前后端分离架构。该方案特别适配中小团队在资源受限环境下的快速交付需求——Django降低后端开发复杂度,React提升前端可维护性,而Ubuntu 18.04凭借LTS支持、

GPT-4的1.8万亿参数与2%激活率:MoE架构原理与工程实践

混合专家(MoE)是一种突破传统稠密模型算力瓶颈的关键架构,其核心在于将模型容量与计算量解耦——通过动态路由机制,使每个Token仅激活少量专家子网络,从而在保持高参数总量的同时控制前向计算开销。这种稀疏激活并非简单线性缩减,而是依赖路由器网络、负载均衡损失和专家通信协同实现的系统级优化。MoE的技术价值体现在显存效率提升、训练吞吐增强及推理延迟降低,广泛应用于千亿级大模型部署、多领域异构任务建模

OpenClaw本地Agent部署指南:飞书+Ollama全链路实战

本地Agent是运行在用户设备上的智能体运行时,其核心原理在于将大模型能力与本地环境深度耦合,实现数据不出域、响应低延迟、逻辑可编程的技术价值。相比云端Bot服务,本地Agent更强调隐私可控、技能可编排、上下文可感知,适用于企业内部协作、个人知识管理、自动化办公等强安全与高定制化场景。本文围绕OpenClaw这一轻量级Agent运行时,结合Ollama本地大模型和飞书消息平台,系统解析反向代理配

#Ollama
Sphero机器人开发全解析:从硬件协议到Python实战与高级项目

可编程机器人平台是连接数字世界与物理世界的关键载体,其核心在于通过传感器感知环境,并由控制器执行算法指令,实现自主行为。这种技术在教育、科研和快速原型验证中具有重要价值,能够将抽象的编程逻辑转化为直观的物理运动反馈。本文以Sphero这一球形可编程机器人为具体案例,深入剖析其硬件架构与蓝牙通信协议,并详细演示如何利用Python SDK进行环境搭建、基础控制及传感器数据采集。通过结合计算机视觉与数

OpenClaw与Hermes:本地AI智能体操作系统的部署与工程实践

AI智能体(Agentic System)是继大语言模型之后的关键演进方向,其核心在于状态管理、工具编排与工作流自动化,而非单纯文本生成。OpenClaw和Hermes正代表了这一范式的底层基础设施——它们提供类操作系统级的运行时能力,包括进程调度、内存持久化、事件监听与容错恢复。这种确定性、可嵌入、可服务化的特性,使其成为个人知识自动化与中小企业轻量级AI中台的理想选择。本文聚焦于生产就绪的本地

#AI智能体
Lunar Lake NPU原生运行LLaMA 3.2:x86边缘AI推理实战指南

大语言模型(LLM)在边缘端的高效部署,正从依赖GPU加速转向异构硬件协同优化。其核心在于模型架构、编译器与专用AI加速单元(如NPU)的深度对齐——而非简单移植。INT4量化、RoPE位置编码硬件支持、统一内存架构(UMA)等关键技术,显著降低KV Cache开销与数据搬运延迟,使轻量级模型(如LLaMA 3.2-1B)可在35W TDP的x86平台实现稳定12+ tokens/s吞吐。Open

Claude语义压缩层蒸发:从可控推理到结果可验证的范式迁移

语义压缩层是大语言模型中用于中间推理状态提炼与降噪的关键技术组件,其核心原理在于对用户查询、上下文及生成痕迹进行不可逆的语义蒸馏,以提升输出一致性与安全性。该技术显著增强模型在合规审计、教育解释、安全分析等强可控性场景中的工程价值,但同时也带来调试困难、定制能力下降与中间态不可见等挑战。随着Anthropic将该层‘蒸发’,系统性转向基于推理摘要哈希(Reasoning Digest Hash)的

GPT-5.5事故复盘:智能体编码与Glacier计算块实战指南

智能体编码(agentic coding)正从概念走向工程现实,其核心是模型从被动响应工具升级为具备任务分解、自主执行与结果交付能力的计算主体;这背后依赖新型架构范式——如Glacier所代表的模块化‘计算块’(cy-block)设计,通过状态机驱动与专用单元编排,实现跨模态任务的低延迟、高确定性处理。该范式显著降低显存碎片、提升复合任务吞吐,并推动开发流程从写代码转向定义任务契约与运行时契约。对

Qwen3.6-Plus协议级兼容Claude Code与OpenClaw解析

API协议兼容是大模型工程落地的核心瓶颈,其本质是HTTP语义归一、请求/响应Schema对齐与事件流编排的系统性问题。当前主流方案如OpenAI Function Calling存在解析脆弱、串行阻塞、结果回传缺失等企业级集成痛点;而Claude Code的结构化tool_use事件流与OpenClaw定义的tool_result、parallel_tool_use等标准化机制,已成多模型Age

向量数据库与嵌入:AI Agent的语义神经系统

向量数据库和嵌入技术是现代AI Agent实现语义理解、长期记忆与跨模态关联的核心基础设施。其本质并非简单文本转数字,而是构建高维语义空间中的坐标映射,支撑RAG增强、对话记忆、工具调用等关键范式。在LangChain与LangGraph工程实践中,嵌入模型的领域适配性、向量库的实时语义导航能力(如Qdrant的HNSW索引与元数据过滤)、以及cosine相似度的物理意义,共同决定了Agent能否

    共 91 条
  • 1
  • 2
  • 3
  • 10
  • 请选择