logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从零开始:用TensorFlow 2.0和NumPy手搓一个CNN,我踩过的坑你别再踩了

本文详细介绍了如何使用TensorFlow 2.0和NumPy从零开始构建卷积神经网络(CNN),并分享了实战中的常见陷阱与解决方案。通过底层实现,读者可以深入理解CNN的核心原理,包括卷积层、池化层的实现,以及梯度消失、激活函数选择等关键问题。文章还提供了环境配置、数据准备和性能优化的实用技巧,帮助开发者避免常见错误,提升模型训练效率。

#深度学习#神经网络
别只看参数大小!实测对比:2.4B的MiniCPM在代码和数学任务上到底比7B模型强在哪?

本文通过实测对比,揭示了2.4B参数的MiniCPM在代码生成和数学任务上超越7B大模型的技术优势。MiniCPM凭借精准的代码生成能力、结构化数学思维及中文场景特化优势,成为端侧大语言模型的佼佼者,特别适合移动端部署和应用开发。

基于AI智能体的企业收件箱自动化分诊系统设计与实现

在数字化转型浪潮中,自动化流程与智能决策成为提升企业运营效率的关键。其核心原理在于通过模块化设计和结构化数据流,将复杂任务分解为可独立优化、协同工作的子任务。这种技术架构的价值在于显著提升系统的可预测性、可调试性及与现有工具的集成能力,广泛应用于客户服务、工单管理和内部协作等场景。本文聚焦于如何利用大语言模型(LLM)和外部工具链,构建一个能够自动理解客户咨询、进行公司背景调研、生成具体行动建议并

#AI智能体
保姆级教程:用Docker Compose一键部署Ollama + ChatGPT-Web,5分钟拥有本地AI聊天室

本文提供了一份详细的Docker Compose教程,指导用户如何在5分钟内快速部署Ollama和ChatGPT-Web,打造本地AI聊天室。通过简单的命令和配置,即使是新手也能轻松实现本地部署,享受快速响应和隐私保护的AI对话体验。

#Ollama
GLM-5.1架构深度解析:多粒度稀疏注意力与动态RoPE实战指南

大语言模型的长文本理解能力,本质取决于位置编码精度与注意力计算效率这对核心矛盾。传统RoPE在超长序列下易失真,全量稠密Attention则导致大量无效计算,尤其在中文医疗病历、法律合同、金融研报等高信息密度长文档场景中尤为突出。GLM-5.1通过动态RoPE偏移校准位置感知,结合多粒度稀疏注意力实现语义驱动的计算聚焦——既保留关键跨段落依赖,又大幅压缩KV Cache与显存开销。其工程价值直接体

Azure OpenAI异步任务并行化实战:高并发低延迟优化指南

异步编程是应对AI服务高延迟、IO密集型特性的基础技术范式,其核心在于通过事件循环与非阻塞IO实现资源高效复用;在Azure OpenAI场景中,因API固有网络延迟、动态配额限制及流式响应特性,单纯使用async/await远不足以保障SLA——必须结合任务依赖建模、HTTP/2连接池精细控制与实时配额感知限流;该技术方案显著提升QPS、降低P95延迟并抑制CPU空转,广泛适用于智能客服、RAG

Gemini官方报告深度解读:从性能数据到工程落地的决策逻辑

大模型基准测试不是单纯比拼分数,而是反映模型在真实场景中的能力边界与工程取舍。理解多模态对齐、长上下文建模等核心能力的技术原理,有助于识别其在延迟、成本、鲁棒性约束下的实际价值。Gemini官方报告摒弃综合排名,采用分层能力矩阵设计,直指金融风控、医疗影像理解、工业质检等典型应用场景的需求本质。尤其在细粒度定位、工具调用兜底、安全过滤机制等方面,隐藏着影响部署成败的关键技术细节。本文基于一线生产实

OpenClaw 2.6.4:Windows本地AI智能体一键部署实战指南

AI智能体是面向任务自动化的下一代人机协作范式,其核心在于将大语言模型(LLM)与工具调用(Tool Calling)、工作流编排(Workflow Orchestration)深度集成,实现对本地文件、办公软件和系统API的自主操作。相比云端服务,本地化部署保障数据主权、离线鲁棒性与低延迟响应,尤其适合行政、财务、运营等高频重复文档处理场景。OpenClaw 2.6.4正是这一理念的工程化落地—

#AI智能体
RVQ驱动的对话语音模型CSM:重构语音交互新范式

对话语音建模正从传统ASR流水线迈向端到端统一表征时代。Residual Vector Quantization(RVQ)作为核心使能技术,不再仅用于音频压缩,而是构建具备声学保真与对话语义双重能力的离散化特征空间。其分层残差量化机制,使模型能在低延迟下同步捕获语音中的意图切换、情感倾向与对话状态变化,显著缓解错误传播问题。该技术已落地于智能硬件、客服系统与教育App等实时交互场景,尤其适合需兼顾

Rufus制作可启动U盘的核心原理与实战避坑指南

可启动U盘并非简单复制ISO文件,而是涉及UEFI/Legacy引导协议适配、GPT/MBR分区表重建、ESP分区配置及引导加载器注入的系统级工程。其技术本质是启动环境翻译——在固件碎片化(如老款BIOS与新式UEFI共存)、硬件差异(Phison/群联主控兼容性)、ISO结构多样性(官方镜像vs定制版)等现实约束下,实现跨平台可靠启动。Rufus通过智能检测ISO引导能力、动态匹配目标设备固件类

    共 49 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择