logo
publist
写文章

简介

百度百科帮助人次300万+,脉脉影响力全网第一,微软亚研10周年纪念勋章,全国机器人大赛亚军、季军,5篇EI索引论文,5年+机器人老兵,10年+移动互联网老兵,10年+地图老兵。CSDN码龄17年。丰富的客户端、服务端和大数据研发经验。 兴趣爱好:听书(得到3679小时,喜马拉雅3107小时,极客时间845小时)、影视(豆瓣标记看过影视2477部)、散步(一天最多3万步) 。ars longa, vita brevis. @Z731

擅长的技术栈

可提供的服务

暂无可提供的服务

Diffusion十年演进

摘要:扩散模型十年演进(2015-2025) 2015-2025年,扩散模型从理论萌芽发展为AIGC核心底座,彻底颠覆生成式AI格局。基于非平衡热力学原理,扩散模型通过加噪和去噪过程实现高质量生成,解决了GAN的痛点。十年演进分为四个阶段:2015-2017年理论奠基,效果不及GAN;2018-2020年DDPM突破,超越GAN;2021-2023年Stable Diffusion开源引爆产业,扩

#microsoft#网络#自动驾驶 +3
SAM十年演进

2015-2025年,是SAM从传统图像分割的技术积累,到彻底重构计算机视觉分割范式的黄金十年。尽管正式诞生于2023年4月,但其核心思想“通用零样本分割”的技术脉络可追溯至2015年深度学习分割的启蒙阶段。这十年,SAM完成了,中国也从技术跟随者跃升为全球并跑、部分领域领跑的核心创新力量。SAM的核心本质,是Meta AI推出的。

#算法#人工智能#安全 +4
Vit十年演进

2015-2025年,是ViT(Vision Transformer)完成的范式革命十年。它不仅打破了卷积神经网络对CV领域的长期垄断,更实现了NLP与CV两大AI分支的架构统一,为多模态融合、通用人工智能的发展扫清了核心架构障碍。ViT的核心本质,是。十年间,ViT从仅能在超大规模数据集上勉强超越CNN的学术概念,成长为覆盖图像分类、目标检测、语义分割、视频理解、3D视觉、多模态生成全场景的通用

#算法#人工智能#安全 +4
世界模型十年演进

2015-2025年,是世界模型(World Model)完成跨越式发展的黄金十年。行业定义的,是AI通过自监督学习构建对物理/虚拟环境的内部表征,精准建模环境的动态转移规律、物理规则与因果关系,实现未来状态的长时序预测、交互结果的模拟推演,最终支撑智能体完成长周期规划、复杂决策与自主行动的AI体系。它让AI拥有了类似人类的“想象力”与“预判能力”,彻底打破了传统AI“被动反应”的局限,是通往通用

#大数据#机器人#microsoft +4
多模态大模型十年演进

多模态大模型十年演进(2015-2025):从学术萌芽到产业变革 2015-2025年是多模态大模型(MLLM)实现跨越式发展的黄金十年,其核心是以大语言模型(LLM)为统一底座,通过跨模态对齐技术融合文本、图像、视频等多模态数据,完成感知、理解、推理、生成的全链路闭环。十年间,MLLM经历了四次范式跃迁: 启蒙萌芽期(2015-2017):CNN+RNN架构实现双模态单任务探索,聚焦图像描述、视

#大数据#人工智能#机器人 +4
VLM十年演进

视觉大语言模型(VLM)十年演进(2015-2025) VLM在2015-2025年间经历了从单任务学术研究到通用AI核心技术的跨越式发展。通过统一语义空间实现视觉与语言的深度融合,以LLM为推理底座,VLM完成了从图像理解到决策执行的闭环,成为AGI的关键路径。 四大发展阶段: 启蒙期(2015-2017):CNN+RNN架构实现简单图文对齐,海外垄断核心技术; 成长期(2018-2020):T

#microsoft#网络#自动驾驶 +4
视觉大语言模型十年演进

视觉大语言模型十年演进(2015-2025)摘要: 过去十年见证了视觉大语言模型(VLM)从单任务学术研究到通用人工智能核心技术的跨越式发展。2015-2017年为启蒙期,基于CNN+RNN架构实现简单图文对齐;2018-2020年Transformer架构和多模态预训练兴起,实现通用图文表征学习;2021-2023年大模型融合期,LLM成为VLM核心底座,GPT-4V等通用模型爆发;2024-2

#语言模型#人工智能#自然语言处理 +4
视觉大语言模型十年演进

视觉大语言模型十年演进(2015-2025)摘要: 过去十年见证了视觉大语言模型(VLM)从单任务学术研究到通用人工智能核心技术的跨越式发展。2015-2017年为启蒙期,基于CNN+RNN架构实现简单图文对齐;2018-2020年Transformer架构和多模态预训练兴起,实现通用图文表征学习;2021-2023年大模型融合期,LLM成为VLM核心底座,GPT-4V等通用模型爆发;2024-2

#语言模型#人工智能#自然语言处理 +4
视觉大语言模型十年演进

视觉大语言模型十年演进(2015-2025)摘要: 过去十年见证了视觉大语言模型(VLM)从单任务学术研究到通用人工智能核心技术的跨越式发展。2015-2017年为启蒙期,基于CNN+RNN架构实现简单图文对齐;2018-2020年Transformer架构和多模态预训练兴起,实现通用图文表征学习;2021-2023年大模型融合期,LLM成为VLM核心底座,GPT-4V等通用模型爆发;2024-2

#语言模型#人工智能#自然语言处理 +4
深度强化学习十年演进

深度强化学习十年演进(2015-2025)摘要 2015-2025年是深度强化学习(DRL)实现跨越式发展的黄金十年,完成了从学术突破到产业落地的完整演进。这十年间,DRL经历了四次范式跃迁:2015-2017年的范式革命启蒙期(DQN、AlphaGo突破游戏场景)、2018-2020年的工程化稳定成长期(PPO、SAC算法成熟,产业试水)、2021-2023年的大模型融合重构期(RLHF成为大模

#算法#人工智能#安全 +4
    共 1070 条
  • 1
  • 2
  • 3
  • 107
  • 请选择