man One 个人主页

@weixin_29045001

man One

2023-08-16 11:37:11 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

本地大模型部署：llama.cpp与Ollama实战指南

模型量化技术是当前AI工程领域的关键突破，通过降低模型参数精度来显著减少计算资源消耗。其核心原理包括权重量化和激活值量化，能在保持模型性能的同时将体积压缩75%以上。这种技术在边缘计算和本地化部署场景中尤为重要，特别是对于大型语言模型(LLM)的消费级硬件适配。以llama.cpp为代表的轻量级框架结合GGUF量化格式，配合Ollama的容器化部署方案，构成了当前最成熟的本地大模型运行技术栈。典型

Qwen2.5-VL-7B 本地部署实战：RTX 4090 24G 显存配置与 3 种推理脚本对比

本文详细介绍了Qwen2.5-VL-7B视觉语言模型在RTX 4090 24G显存环境下的本地部署实战，包括硬件配置、软件栈优化和显存管理策略。通过对比三种推理脚本（原生Transformers、vLLM加速和Gradio Web Demo）的性能表现，帮助开发者选择最优方案，提升图像理解、文本识别等任务的效率。

国内开发者实战指南：从零部署OpenAI Codex AI编程助手

AI编程助手正成为提升开发效率的关键工具，其核心原理是基于大语言模型理解自然语言指令并生成代码。这类技术通过分析项目上下文、理解编程逻辑，能够实现代码补全、重构建议和自动化任务执行，为开发者提供智能辅助。在实际工程应用中，AI编程代理的价值在于减少重复性编码工作、加速原型开发和降低学习成本。特别是在处理复杂配置和网络环境受限的场景下，掌握正确的部署方法至关重要。本文聚焦OpenAI Codex的实

vLLM 0.8.5 部署 Qwen2.5-7B：3个关键参数调优，吞吐量提升 40%

本文详细介绍了如何在vLLM 0.8.5环境下部署Qwen2.5-7B大模型，并通过调整max-model-len、gpu-memory-utilization和max-num-batched-tokens三个关键参数，实现吞吐量提升40%的实战经验。文章提供了环境配置、基准测试脚本和参数调优策略，适用于高吞吐聊天机器人、长文档处理和多租户SaaS服务等场景。

GPT-1/2/3 模型架构演进对比：从1.5亿到1750亿参数的Transformer Decoder优化

本文深入解析了GPT系列模型从1.5亿到1750亿参数的架构演进，重点对比了GPT-1、GPT-2和GPT-3在Transformer Decoder优化上的关键技术突破。从GPT-1的预训练微调范式，到GPT-2验证规模效应实现Zero-Shot能力，再到GPT-3引入稀疏注意力和Few-Shot学习，揭示了参数爆炸背后的技术精妙之处。

#语言模型

AI智能体系统架构设计：从核心组件到生产部署的工程实践

AI智能体作为当前人工智能应用落地的关键技术形态，其核心在于通过工程化架构封装大模型的不确定性，构建稳定可靠的服务。其原理通常围绕分层架构展开，涵盖大脑层（模型编排与上下文管理）、感知执行层（工具抽象与安全沙箱）、记忆状态层（向量存储与会话管理）等核心模块。该架构的技术价值在于将前沿的LLM能力转化为可维护、可观测、可扩展的生产级系统，有效支撑智能客服、自动化数据分析、旅行规划等复杂场景的落地。本

#AI智能体 #系统架构

基于OpenAI Codex的AI代码审查：从原理到GitHub Actions实战

代码审查是软件开发中确保代码质量的关键环节，其核心原理在于通过系统化检查发现潜在问题。传统人工审查面临效率瓶颈，而AI技术为代码审查带来了新的解决方案。OpenAI Codex作为专门处理代码任务的AI模型，基于Transformer架构理解代码语法和语义，能够实现自动化的代码质量评估。这种AI驱动的代码审查技术价值在于显著提升审查效率，将耗时从数小时缩短到分钟级，同时保持审查标准的一致性。在实际

主流开源OCR模型实战评测：从PaddleOCR到Qwen-OCR

本文对主流开源OCR模型进行了实战评测，包括PaddleOCR、EasyOCR、Qwen-OCR、DeepSeek-OCR和RapidOCR。通过详细的技术对比和性能测试，分析了各模型在精度、速度、显存占用等方面的表现，并提供了针对不同业务场景的选型建议和优化技巧，帮助开发者选择最适合的OCR解决方案。

AI Agent如何革新蛋白-小分子可视化分析

在结构生物学和药物研发领域，蛋白-小分子相互作用可视化是一项关键技术，传统工具如PyMOL和ChimeraX虽然功能强大，但操作复杂且学习曲线陡峭。AI Agent通过融合结构生物学知识、计算机视觉智能渲染和工作流自动化引擎，显著提升了分子可视化的效率和精度。其核心技术包括智能数据预处理、结合位点分析算法和三维交互优化，适用于科研作图和药物设计中的SAR分析。AI Agent的微服务架构和强化学习

AI智能体安全实战：五层纵深防护体系构建与落地指南

在人工智能技术，特别是大语言模型（LLM）驱动的AI智能体（AI Agent）日益普及的背景下，其安全风险成为企业应用的核心挑战。AI智能体通过工具调用（Tool Calling）和检索增强生成（RAG）等技术扩展能力，但也模糊了传统安全边界，使其面临提示词注入（Prompt Injection）、权限提升和数据泄露等新型威胁。其安全防护需从单一措施转向体系化纵深防御，核心价值在于确保自动化流程在

共 56 条

请选择