吃素的小动物个人主页

@weixin_30654419

吃素的小动物

2023-09-20 09:31:11 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

从零开始：用TensorFlow 2.0和NumPy手搓一个CNN，我踩过的坑你别再踩了

本文详细介绍了如何使用TensorFlow 2.0和NumPy从零开始构建卷积神经网络（CNN），并分享了实战中的常见陷阱与解决方案。通过底层实现，读者可以深入理解CNN的核心原理，包括卷积层、池化层的实现，以及梯度消失、激活函数选择等关键问题。文章还提供了环境配置、数据准备和性能优化的实用技巧，帮助开发者避免常见错误，提升模型训练效率。

#深度学习 #神经网络

别只看参数大小！实测对比：2.4B的MiniCPM在代码和数学任务上到底比7B模型强在哪？

本文通过实测对比，揭示了2.4B参数的MiniCPM在代码生成和数学任务上超越7B大模型的技术优势。MiniCPM凭借精准的代码生成能力、结构化数学思维及中文场景特化优势，成为端侧大语言模型的佼佼者，特别适合移动端部署和应用开发。

基于AI智能体的企业收件箱自动化分诊系统设计与实现

在数字化转型浪潮中，自动化流程与智能决策成为提升企业运营效率的关键。其核心原理在于通过模块化设计和结构化数据流，将复杂任务分解为可独立优化、协同工作的子任务。这种技术架构的价值在于显著提升系统的可预测性、可调试性及与现有工具的集成能力，广泛应用于客户服务、工单管理和内部协作等场景。本文聚焦于如何利用大语言模型（LLM）和外部工具链，构建一个能够自动理解客户咨询、进行公司背景调研、生成具体行动建议并

#AI智能体

保姆级教程：用Docker Compose一键部署Ollama + ChatGPT-Web，5分钟拥有本地AI聊天室

本文提供了一份详细的Docker Compose教程，指导用户如何在5分钟内快速部署Ollama和ChatGPT-Web，打造本地AI聊天室。通过简单的命令和配置，即使是新手也能轻松实现本地部署，享受快速响应和隐私保护的AI对话体验。

#Ollama

GLM-5.1架构深度解析：多粒度稀疏注意力与动态RoPE实战指南

大语言模型的长文本理解能力，本质取决于位置编码精度与注意力计算效率这对核心矛盾。传统RoPE在超长序列下易失真，全量稠密Attention则导致大量无效计算，尤其在中文医疗病历、法律合同、金融研报等高信息密度长文档场景中尤为突出。GLM-5.1通过动态RoPE偏移校准位置感知，结合多粒度稀疏注意力实现语义驱动的计算聚焦——既保留关键跨段落依赖，又大幅压缩KV Cache与显存开销。其工程价值直接体

Azure OpenAI异步任务并行化实战：高并发低延迟优化指南

异步编程是应对AI服务高延迟、IO密集型特性的基础技术范式，其核心在于通过事件循环与非阻塞IO实现资源高效复用；在Azure OpenAI场景中，因API固有网络延迟、动态配额限制及流式响应特性，单纯使用async/await远不足以保障SLA——必须结合任务依赖建模、HTTP/2连接池精细控制与实时配额感知限流；该技术方案显著提升QPS、降低P95延迟并抑制CPU空转，广泛适用于智能客服、RAG

Gemini官方报告深度解读：从性能数据到工程落地的决策逻辑

大模型基准测试不是单纯比拼分数，而是反映模型在真实场景中的能力边界与工程取舍。理解多模态对齐、长上下文建模等核心能力的技术原理，有助于识别其在延迟、成本、鲁棒性约束下的实际价值。Gemini官方报告摒弃综合排名，采用分层能力矩阵设计，直指金融风控、医疗影像理解、工业质检等典型应用场景的需求本质。尤其在细粒度定位、工具调用兜底、安全过滤机制等方面，隐藏着影响部署成败的关键技术细节。本文基于一线生产实

OpenClaw 2.6.4：Windows本地AI智能体一键部署实战指南

AI智能体是面向任务自动化的下一代人机协作范式，其核心在于将大语言模型（LLM）与工具调用（Tool Calling）、工作流编排（Workflow Orchestration）深度集成，实现对本地文件、办公软件和系统API的自主操作。相比云端服务，本地化部署保障数据主权、离线鲁棒性与低延迟响应，尤其适合行政、财务、运营等高频重复文档处理场景。OpenClaw 2.6.4正是这一理念的工程化落地—

#AI智能体

RVQ驱动的对话语音模型CSM：重构语音交互新范式

对话语音建模正从传统ASR流水线迈向端到端统一表征时代。Residual Vector Quantization（RVQ）作为核心使能技术，不再仅用于音频压缩，而是构建具备声学保真与对话语义双重能力的离散化特征空间。其分层残差量化机制，使模型能在低延迟下同步捕获语音中的意图切换、情感倾向与对话状态变化，显著缓解错误传播问题。该技术已落地于智能硬件、客服系统与教育App等实时交互场景，尤其适合需兼顾

Rufus制作可启动U盘的核心原理与实战避坑指南

可启动U盘并非简单复制ISO文件，而是涉及UEFI/Legacy引导协议适配、GPT/MBR分区表重建、ESP分区配置及引导加载器注入的系统级工程。其技术本质是启动环境翻译——在固件碎片化（如老款BIOS与新式UEFI共存）、硬件差异（Phison/群联主控兼容性）、ISO结构多样性（官方镜像vs定制版）等现实约束下，实现跨平台可靠启动。Rufus通过智能检测ISO引导能力、动态匹配目标设备固件类

共 49 条

请选择