logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Claude Code Agent Skills:可编排、可验证的AI编程原子技能协议

在AI编程工具泛滥的今天,开发者真正需要的不是更‘聪明’的补全助手,而是能封装重复性认知劳动的确定性工作单元——这正是AI Agent Skills的核心价值。它基于声明式契约(intent/input/output/tool/permission),通过沙箱化sub-agent调度实现跨工具链的自动化任务执行,兼具可组合性、可审计性与私有化演进能力。作为AI时代的‘package.json’,S

GLM-5+Ollama量化部署实战:国产大模型生产落地指南

大语言模型本地化部署正从技术验证迈向真实业务闭环,核心挑战在于长上下文稳定性、工具链集成效率与资源受限环境下的推理可用性。稀疏注意力架构显著降低KV Cache显存开销,使128K上下文处理在单卡A100上成为可能;而Ollama通过硬件自适应二进制分发、进程内API服务与标准化Tool Calling协议,将模型调用降维为类Linux命令操作;量化则不再是精度妥协,而是基于任务特性的精度再分配—

#Ollama
Gemini免费办公提效21招:零基础搞定表格校验、会议纪要、PPT设计等高频场景

大语言模型正深度融入日常办公,成为继Excel和邮件之后的第三类生产力基础设施。其核心价值在于将非结构化信息(如会议录音、技术文档、聊天记录)转化为可执行任务,通过语义理解替代机械操作,显著降低重复性脑力劳动门槛。Gemini作为当前对中文办公场景适配度高、零成本即用的代表性工具,尤其擅长表格逻辑校验、待办事项提取、技术文档降维、跨文化邮件润色等真实职场任务。本文聚焦‘免费版Gemini网页端与A

#办公提效
vLLM与Ollama本地部署实战:高并发、低延迟、国产化落地指南

大模型推理引擎是AI工程化落地的核心基础设施,其性能、稳定性与部署效率直接决定企业级应用成败。vLLM凭借PagedAttention机制显著提升GPU显存利用率与吞吐量,成为高并发低延迟场景的首选;Ollama则以极简命令封装模型下载、量化与API服务,大幅降低轻量验证门槛。二者并非替代关系,而是分层协作:vLLM负责生产级性能压测,Ollama支撑快速POC与边缘交付。结合Docker容器化保

#vLLM#Ollama
Ollama+GLM-4.7+Claude Code本地开发闭环真相

大模型本地化部署正从‘能跑通’迈向‘可交付’的关键阶段。Ollama并非原生支持Anthropic协议,而是通过HTTP语义重写实现兼容;GLM-4.7在Ollama中实际运行的是FP16微调版本,其tokenizer映射、RoPE缩放与量化策略均存在隐式行为偏差;Claude Code CLI则因硬编码别名、缺失anthropic-version头及流式解析缺陷,常触发错误回退至云服务。这些协议

#Ollama
别再只盯着GPT了!手把手教你用ChatGLM-6B在本地电脑跑个中文大模型

本文详细介绍了如何在本地电脑上部署和运行ChatGLM-6B中文大模型,包括环境配置、模型加载、交互对话和API部署等步骤。ChatGLM-6B作为清华大学开源的中文对话模型,具有数据隐私保护、成本可控和离线可用等优势,适合开发者进行本地研究和项目开发。文章还提供了硬件要求、Python环境搭建、量化模型选项以及进阶应用案例,帮助用户快速上手并优化模型性能。

GPT-4提示词驱动地理可视化:Streamlit零代码交互地图实战

地理可视化是空间数据分析的核心呈现方式,其本质是将位置、属性与业务逻辑转化为可交互的地图表达。传统实现依赖GIS库、坐标转换和前端框架,门槛高、周期长;而大语言模型(LLM)凭借强大的结构化输出与语义理解能力,正重塑这一流程——尤其当GPT-4作为地理数据生成引擎,结合Streamlit轻量级交互框架,可实现自然语言到GeoJSON的端到端映射。该方案不替代专业空间计算,但显著降低原型验证与业务看

别再只会调角度了!用STM32 HAL库玩转MG90S舵机,从PWM配置到避坑全指南

本文详细介绍了如何使用STM32 HAL库驱动MG90S舵机,从CubeMX的PWM配置到精准角度控制,涵盖了硬件准备、PWM参数设置、角度校准、多舵机同步控制及异常处理等实战技巧。特别针对MG90S舵机的特性,提供了避坑指南和高级控制方法,帮助开发者实现高效稳定的舵机控制。

MCP服务器监控:填补AI可观测性盲区的实战指南

在微服务与云原生架构中,可观测性已成为保障系统稳定性的基石,其核心在于通过指标、日志、链路追踪三大支柱实现对应用状态的全面洞察。其原理是通过数据采集、聚合与分析,快速定位性能瓶颈与故障根因,技术价值在于提升运维效率、保障服务SLA。随着AI能力通过模型上下文协议深度集成至各类应用,传统的监控体系面临新的挑战:MCP服务器作为连接AI模型与应用的核心桥梁,其内部状态如模型加载、上下文管理、令牌消耗等

ESP32+MPU6050避坑指南:从I2Cdev库安装到Processing 3D可视化,新手也能一次成功

本文详细介绍了ESP32与MPU6050的硬件连接、开发环境搭建、姿态解算及Processing 3D可视化的全流程实战指南。从I2Cdev库安装到DMP姿态解算,再到3D模型渲染,帮助开发者避开常见陷阱,实现高效稳定的运动数据采集与可视化。特别适合物联网和嵌入式系统开发者参考。

    共 54 条
  • 1
  • 2
  • 3
  • 6
  • 请选择