logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

西瓜书《机器学习》全网最详细解读 第五章:神经网络

神经网络是一种模仿生物神经元结构和功能的人工智能模型。它由大量的节点(神经元)和连接这些节点的边(突触)组成,这些节点和边共同构成了一个复杂的网络结构。

文章图片
#机器学习#神经网络#人工智能 +4
西瓜书《机器学习》全网最详细解读 第三章:线性模型

机器学习》,又称西瓜书,是南京大学教授周志华教授编著的一本机器学习领域的经典教材。《机器学习》系统地介绍了机器学习的基本理论、常用算法及其应用。全书内容丰富,涵盖了机器学习的多个重要方面,包括监督学习、无监督学习、强化学习等主要学习范式。《机器学习》适合计算机科学、人工智能、数据科学等相关专业的本科生、研究生以及对机器学习感兴趣的自学者。无论是初学者希望系统地学习机器学习的基础知识,还是有一定基础

文章图片
#机器学习#人工智能#线性回归 +3
Deepseek新架构:Engram全面解析(论文代码详解)

稀疏性” 是贯穿生物神经网络(如人脑神经元的稀疏激活)和现代大语言模型(LLMs)的关键设计思路 —— 核心是 “不激活所有参数,仅用部分资源完成任务”,从而在提升模型容量的同时控制计算成本。当前 LLM 中,稀疏性主要通过混合专家模型(MoE)实现:MoE 将模型拆分为多个 “专家网络”,每个 token 仅激活少数专家(如 Top-6),实现 “参数规模暴涨但计算量不按比例增加”。正因如此,M

文章图片
#架构#人工智能#自然语言处理 +3
强化学习入门(2):DQN、Reinforce、AC、PPO

本文介绍了深度强化学习中的几种主流算法及其实现。首先详细解析了DQN及其改进算法DoubleDQN和DuelingDQN,它们通过引入经验回放、目标网络和动作价值分解等机制提升了性能。其次阐述了DDPG算法,该算法采用Actor-Critic框架和软更新技术处理连续动作空间。然后介绍了REINFORCE策略梯度算法及其蒙特卡洛更新方式。接着重点分析了SAC算法,它通过最大熵框架和自动温度调节实现高

#人工智能#深度学习#机器学习 +3
RPT:预训练新范式,用强化学习做预训练!

这篇文章提出了一种创新的预训练方法,旨在通过强化学习提升大型语言模型(LLMs)在下一个词元预测任务中的表现。该方法的核心在于将下一个词元预测重新定义为一个推理任务,激励模型在预测之前进行深入的思考,并通过可验证的奖励信号来评估预测的正确性。这种方法不仅显著提高了下一个词元预测的准确性,还为后续的强化微调提供了更强大的预训练基础。

文章图片
#深度学习#AIGC#nlp
SAGE:基于SAM进行二级蒸馏的多模态图像融合新方法,CVPR2025

目前将SAM整合用于低级任务的方法通常需要在推理时使用完整的SAM,这在实际应用中显得过于不切实际。为了解决这些问题,作者提出了融合方法SAGE,该方法完全整合并提炼了来自SAM的语义先验。

文章图片
#人工智能#python#计算机视觉 +1
Hunyuan-video:混元视频生成模型,开源最强视频生成模型(包含论文代码详解)

缩小闭源和开源视频基础模型之间的差距,加速社区探索。”——混元团队Hunyuan-Video是由腾讯推出的一款高质量的中文通用视频生成模型,它以其卓越的性能和开源的特性,成为了目前开源视频生成基座模型中的佼佼者。该模型支持中文输入提示(Prompt),采用了图像-视频联合训练策略,并通过一系列精细的数据过滤技术,确保了视频的技术质量和审美吸引力。Hunyuan-Video的开源,为视频内容创作者、

文章图片
#音视频#开源
RoboFactory:多具身智能体协同框架(论文代码详解)

这篇文章提出了一种创新的框架,旨在通过引入组合约束来解决多智能体系统中的协作问题,并自动生成安全、高效的训练数据。文章的核心贡献在于设计了一种能够有效管理多智能体协作的框架——RoboFactory,该框架通过逻辑、空间和时间三个维度的约束,确保智能体在执行任务时的行为既安全又高效。RoboFactory框架包含两个核心模块:RoboBrain和RoboChecker。RoboBrain负责根据全

文章图片
#人工智能#深度学习#计算机视觉 +3
Qwen3-VL:开源最强多模态大模型(架构解析及使用代码)

Qwen3-VL是阿里巴巴开发的新一代视觉语言模型,支持256K tokens的交错上下文处理,包含稠密型和混合专家型变体。其核心优势包括强大的文本理解能力、稳健的长上下文处理以及先进的多模态推理能力。模型通过增强型交错MRoPE、DeepStack集成和文本基视频时间对齐三大升级优化时空建模。训练采用四阶段预训练和SFT、知识蒸馏、RL后训练流程,在多模态任务中表现卓越。评估显示Qwen3-VL

文章图片
#人工智能#深度学习#语言模型 +2
Seedance:字节发布视频生成基础模型新SOTA,能力全面提升

Seedance 1.0 是由字节跳动推出的高性能视频生成基础模型,旨在突破当前视频生成模型在指令遵循、运动合理性与视觉质量平衡方面的瓶颈。该模型通过多源数据整合与精准视频字幕生成,实现了跨多样化场景的全面学习;采用高效的架构设计,支持多镜头生成以及文本到视频和图像到视频任务的联合学习;通过细粒度监督微调和多维度奖励机制的强化学习,显著提升了模型性能;并借助多阶段蒸馏策略和系统级优化,实现了 10

文章图片
#人工智能#计算机视觉#视频生成 +3
    共 92 条
  • 1
  • 2
  • 3
  • 10
  • 请选择