logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

NIPS2025,小红书新研究提出图像InstanceAssemble 算法

小红书AIGC团队在NIPS2025提出创新性InstanceAssemble算法,解决布局可控图像生成(L2I)的核心难题。该算法采用两阶段级联架构,先生成全局背景再通过实例组装注意力模块(Assemble-Attn)实现局部精准控制,同时利用LoRA技术仅增加3%参数即实现DiT扩展。实验表明,即使在密集布局场景下(每图18个目标),该方法仍能保持高精度的位置对齐和语义一致性,同时参数开销减少

文章图片
#算法#机器人#深度学习 +2
华为发布 WorldGrow 世界模型:单卡 30 分钟生成 272㎡场景

华为联合高校推出世界模型WorldGrow,实现室内3D场景生成技术突破。该模型能在单张A100显卡上30分钟生成272㎡高质量连贯场景,解决了传统AI建模中边缘断裂、逻辑混乱等问题。通过"双生成器搭档"和三线性插值算法,WorldGrow实现了高精度细节与逻辑化布局,测试指标FID值仅7.52。值得注意的是,这项由华为实习生主导研发的技术,已通过论文公开并集成至华为云盘古大模

文章图片
#深度学习#人工智能#python +1
深度剖析 Grok2 开源:技术原理与创新洞察

2025年8月24日,马斯克宣布xAI开源Grok-2.5(实际为Grok-2)模型,采用混合专家(MoE)架构,参数量达2680亿,包含42个分片约500GB。开源采用受限许可证,仅允许非商业和年收入低于100万美元的商业使用,禁止用于训练其他基础模型。Grok-2技术亮点包括:64层Transformer结构、8192隐藏维度、支持128k token的超长上下文处理能力,以及混合精度训练和分

文章图片
#人工智能#AIGC#深度学习
DeepSeekV3.1发布!新版本冲上huggingface排行榜第4

DeepSeek V3.1突破性实现128k上下文处理能力 摘要:DeepSeek于2025年8月发布V3.1版本,核心突破是将上下文处理能力扩展至128k字符。该版本采用混合稀疏注意力机制,结合局部注意力和周期性全局注意力,有效解决了传统Transformer模型在处理长文本时的计算瓶颈问题。通过分块处理、并行计算和优化的内存管理技术,在保证计算效率的同时显著提升了长文本处理能力。新版本保持AP

文章图片
#人工智能#深度学习#语言模型 +1
扩散模型一文讲解

摘要 扩散模型(Diffusion Model)是近年来兴起的一种生成模型,通过逐步加噪和去噪的过程实现高质量图像生成。其核心包括前向扩散过程和反向生成过程:前向过程逐步向图像添加高斯噪声,反向过程则通过训练神经网络学习去噪。模型采用类似UNet的网络结构,结合正弦位置编码和时间条件机制,能够预测并去除噪声。训练时随机采样时间步计算噪声预测损失,生成时从随机噪声逐步去噪还原图像。该模型在图像和视频

文章图片
#人工智能#深度学习#业界资讯 +2
小鹏人形机器人到底是不是真人?

小鹏汽车发布新一代IRON人形机器人引发"真人质疑",其高度拟真的行走姿态被众多网友怀疑"藏了真人"。CEO何小鹏发布视频展示内部结构,证实是团队7年研发成果:采集120位模特80万帧数据,376次算法迭代,实现0.3Hz误差的精准步态复刻。该机器人具备82个自由度、仿生肌肉和2250TOPS算力,计划2026年量产。何小鹏表示,推动机器人量产是当代创业者的

文章图片
#机器人#人工智能#深度学习 +1
FlowithOS 横空出世:AI Agent 操作系统

AI应用初创企业Flowith推出全球首款专为AI Agent设计的操作系统FlowithOS。该系统具有自进化、记忆驱动和高性能特点,通过"代码+视觉"双模态引擎实现97.7%的任务成功率,能精准处理动态界面和复杂操作。其核心创新在于"技能+记忆"系统,可将成功任务固化为可复用技能,并通过长期记忆学习用户习惯。实测显示,FlowithOS能自动完成内容生产

文章图片
#人工智能
谷歌嵌套学习:突破 LLM 遗忘瓶颈,让 AI 实现人脑式持续进化

谷歌提出"嵌套学习"新范式破解AI持续学习难题 谷歌研究团队在NeurIPS 2025发表论文提出"嵌套学习"(Nested Learning)新范式,通过将架构和优化视为统一的嵌套优化系统,解决大模型持续学习中的"灾难性遗忘"问题。该研究将传统分离的模型架构与训练算法统一处理,构建了包含多级优化问题的连续体记忆系统(CMS),使AI能像

文章图片
#算法#机器人#深度学习 +1
小鹏人形机器人到底是不是真人?

小鹏汽车发布新一代IRON人形机器人引发"真人质疑",其高度拟真的行走姿态被众多网友怀疑"藏了真人"。CEO何小鹏发布视频展示内部结构,证实是团队7年研发成果:采集120位模特80万帧数据,376次算法迭代,实现0.3Hz误差的精准步态复刻。该机器人具备82个自由度、仿生肌肉和2250TOPS算力,计划2026年量产。何小鹏表示,推动机器人量产是当代创业者的

文章图片
#机器人#人工智能#深度学习 +1
    共 37 条
  • 1
  • 2
  • 3
  • 4
  • 请选择