
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
机器学习研究计算机系统如何利用经验(通常是数据)来提高特定任务的性能。它结合了统计学、数据挖掘和优化的思想。通常,它是被用作实现人工智能解决方案的一种手段。表示学习作为机器学习的一类,其研究的重点是如何自动找到合适的数据表示方式。深度学习是通过学习多层次的转换来进行的多层次的表示学习。深度学习不仅取代了传统机器学习的浅层模型,而且取代了劳动密集型的特征工程。最近在深度学习方面取得的许多进展,大都是
本文探讨了多模态理解生成一体化技术的最新进展,聚焦NanoBananaPro模型的原生多模态能力。该技术通过统一架构实现文本与图像的生成与理解,支持长上下文处理和对话式出图。研究分析了高质量数据生产、人类评估体系对模型性能的影响,并指出开源模型在物理规律遵循和意图理解方面的不足。技术脉络部分梳理了从CLIP到GPT-4等关键突破,框架设计则比较了生成外挂、极致统一和融合建模三种技术路线的优缺点。D
本文系统介绍了InfiniLM大模型推理框架的技术架构与工程实践。框架采用分层设计,包含Python接口层、C++核心层和设备运行时层,支持CPU/GPU多平台部署。重点讲解了内存管理、上下文管理和张量操作等核心组件,详细说明作业项目的环境配置、核心算子实现及Qwen-1.5B模型适配方法。同时提出了CPU加速、CUDA优化、聊天机器人实现等进阶方向,并介绍了国产GPU平台的兼容性优势。通过完整的
本文介绍了强化学习基础概念与DeepSeek架构演进。强化学习部分对比了监督学习与强化学习,详细讲解了马尔可夫决策过程、价值函数、贝尔曼方程等核心概念,以及Q-Learning、DQN、策略梯度、Actor-Critic和PPO等算法原理。DeepSeek架构部分概述了从V3到R1、V3.2的演进过程,重点介绍了MoE架构、MLA模块、RLVR训练方法和创新的DSA(稀疏注意力)技术,通过Top-
本文介绍了vLLM-ascend推理引擎的整体架构与核心技术。主要内容包括:1) 社区演进与华为昇腾技术路线,强调开源生态的重要性;2) 架构解析,包含计算架构层和框架Plugin层设计;3) 核心技术如PagedAttention内存管理、ContinuousBatching优化等;4) 推理精度与性能分析方法及工具使用;5) 部署流程与常用特性。重点展示了vLLM-ascend如何通过硬件适配
本文介绍了vLLM-ascend推理引擎的整体架构与核心技术。主要内容包括:1) 社区演进与华为昇腾技术路线,强调开源生态的重要性;2) 架构解析,包含计算架构层和框架Plugin层设计;3) 核心技术如PagedAttention内存管理、ContinuousBatching优化等;4) 推理精度与性能分析方法及工具使用;5) 部署流程与常用特性。重点展示了vLLM-ascend如何通过硬件适配
本文介绍了vLLM-ascend推理引擎的整体架构与核心技术。主要内容包括:1) 社区演进与华为昇腾技术路线,强调开源生态的重要性;2) 架构解析,包含计算架构层和框架Plugin层设计;3) 核心技术如PagedAttention内存管理、ContinuousBatching优化等;4) 推理精度与性能分析方法及工具使用;5) 部署流程与常用特性。重点展示了vLLM-ascend如何通过硬件适配
天数智芯通过适配Triton框架实现了国产GPU的高效AI计算,主要优势包括:1)基于LLVM生态的无缝兼容;2)GPGPU架构的高度契合;3)支持Triton Kernels零改写复用。适配工作聚焦编译器层优化,在FlashAttention算子中实现了Block Tiling、MMA指令优化和延时归约等技术,使V2版本性能显著提升。该方案支持开发者直接迁移现有Triton代码,为国产AI芯片生
本文探讨了九齿与Triton在AI算子开发中的核心价值和应用。首先区分了Kernel与算子的概念,指出九齿和Triton专注于底层计算优化。相比厂商库,它们在新型算子验证、算子融合和边缘场景优化方面具有优势,并提供更高的开发效率。通过Roofline模型分析了算子性能评估方法,并以RMSNorm算子为例展示了九齿的优化效果,相比PyTorch原生实现可获得数倍性能提升。文章还介绍了九齿提供的完整工
大模型自主智能体技术对 AI 应用边界的重塑,指出大模型随参数量增长实现智能涌现,却存在专业技能欠缺、自主与协作能力不足的局限。课程介绍了智能体的核心能力、ReAct 框架及模仿、教程、强化三阶段工具学习路径,讲解 XAgent、RepoAgent 等典型应用和工作流自动化案例,阐述多智能体协作的原理、实现方式与核心要素,以及 AutoForm 提升交互效率的作用,指明该技术突破大模型局限,推动








