logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CS285 深度强化学习(一):开篇——强化学习的世界观

Google DeepMind 开发的围棋 AI,击败了世界冠军李世石。围棋的状态空间比宇宙中的原子还多(约1017010^{170}10170),传统的搜索算法根本无法穷举。AlphaGo 通过强化学习,从自我对弈中不断提升棋力。:在 Dota2 这款复杂的团队竞技游戏中击败了职业战队。这个游戏需要 5 个 AI 协同作战,每秒做出数十个决策,信息还是不完全的——比围棋难得多。ChatGPT 的

#深度学习#机器学习
CS285 深度强化学习(六):Value-based 方法——DQN 家族

本文介绍了深度强化学习中的价值基方法(Value-based Methods),重点解析了DQN(Deep Q-Network)及其改进算法。主要内容包括: 从Q-learning基础出发,阐述了最优Q函数和表格型Q-learning的局限性,指出神经网络函数逼近的必要性。 详细分析了DQN的两大核心技术: 经验回放(Experience Replay):通过存储和随机采样经验打破数据相关性 目标

YOLO系列12:YOLOv10详解——端到端实时目标检测的新范式

YOLOv10是清华大学团队提出的新一代端到端实时目标检测模型,核心创新在于实现了真正的无NMS检测。通过一致性双重分配策略,训练时同时使用One-to-Many和One-to-One标签分配,推理时仅需One-to-One分支即可直接输出结果,消除了NMS后处理。模型还从效率和精度两个维度进行优化:采用大核卷积、PSA模块提升性能,同时减少计算冗余。在COCO数据集上,YOLOv10系列模型(N

#目标检测#目标跟踪#深度学习 +3
【深度学习】U-Net系列(一):U-Net网络架构详解

U-Net是一种经典的图像分割网络架构,其核心创新在于对称的编码器-解码器结构和跳跃连接机制。编码器通过下采样提取特征,解码器通过上采样恢复分辨率,而跳跃连接将编码器的高分辨率特征与解码器对应层融合,有效解决了传统分割方法边界模糊和上下文信息丢失的问题。该网络特别适用于医学图像等小样本场景,通过弹性变形等数据增强策略提升泛化能力。U-Net的全卷积设计和端到端训练方式使其成为语义分割领域的里程碑式

#深度学习#网络#人工智能 +1
极简LLM入门指南 7

本文介绍了如何开发基于LLM的智能Agent系统。主要内容包括: 最简Agent实现:使用LangChain快速构建具备搜索引擎功能的Agent ReAct框架实现:详细展示了思考-行动-观察循环的完整代码实现 工具开发与集成:演示如何创建自定义工具(如天气查询和代码执行工具)并进行工具编排 文章提供了可直接运行的代码示例,帮助开发者快速上手Agent开发,构建能够自主决策、调用工具完成复杂任务的

#transformer#大数据#python
从零到一:个人开发者的LLM训练实战指南(一)

本文介绍了个人开发者训练对话大模型(LLM)的可行方案。随着开源模型(如Llama 4、Qwen 3)和高效微调技术(LoRA、QLoRA)的成熟,7B参数模型已成为性价比最优的选择。训练流程包括预训练、监督微调(SFT)和对齐(如GRPO方法),个人开发者可跳过昂贵的预训练阶段,直接基于开源基座模型进行微调。使用消费级显卡(如RTX 5090)训练10万条数据的成本仅约8元,使个人训练LLM成为

#RAG#transformer
多Agent编排:构建Autonomous开发团队

文章摘要: 本文深入探讨如何构建多Agent系统来实现从代码提交到生产部署的全流程自动化。核心观点在于通过专业化Agent的协作编排,创建真正自主的智能系统,其整体能力远超单个Agent。文章详细分析了系统架构演进路径(从单Agent到去中心化集群)、三层架构设计(编排层-执行层-工具层)以及Agent间通信机制(消息传递模式和共享状态管理)。关键优势包括:90%任务自动化率、部署时间从2小时缩短

#ci/cd#自动化#运维
在CI/CD中集成Claude:自动化审查与测试

本文探讨了将Claude AI集成到CI/CD流水线中的实践方法,重点关注自动化代码审查、测试诊断和文档生成三大场景。文章详细介绍了如何在GitHub Actions和GitLab CI中安全地集成Claude,强调最小权限原则和敏感信息保护的重要性。通过对比传统流程与AI辅助流程的效率差异(交付周期从5-9小时缩短至3.5小时),展示了AI审查的价值。文章还提供了具体实现方案,包括API密钥管理

#ci/cd#自动化#运维
Claude Agent SDK:编程控制你的AI助手

Claude Agent SDK 编程控制AI助手摘要 核心价值:Agent SDK将Claude从交互式AI转变为可编程系统组件,实现AI驱动的自动化流程。 关键能力: 通过代码定义Agent行为、工具集和权限 支持Python/TypeScript两种主流开发语言 完整的生命周期管理(创建、配置、执行) 与外部系统深度集成能力 典型应用场景: 自动化代码修复系统 CI/CD流程中的智能审查 运

#人工智能
Skills + Subagents + MCP:系统级能力的完美融合

本文探讨了Skills、Subagents和MCP三者的系统级融合架构,展示如何通过分层协作实现开发工作流的90%自动化率。核心观点指出:Skills定义任务流程,Subagents负责专业执行,MCP提供工具支持,三者结合能构建完整的智能开发生态系统。文章详细分析了三者的分工模式、适用场景决策树,并推荐了分层和网状两种架构设计模式。通过PR审查工作流案例,展示了如何将复杂任务的自动化效率提升8-

#自动化#运维
    共 56 条
  • 1
  • 2
  • 3
  • 6
  • 请选择