
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
由于机器人需要通过多种传感器感知环境状态,然后执行实际动作,完成任务,因此训练用于机器人的大模型需要用到大量机器人在真实世界中与环境进行交互的数据集。盘古大模型旨在提升机器人泛化操作能力。而AI大模型的渗透被视为人形机器人产业发展的一道分水岭,具备强大泛化能力的大模型出现,使人形机器人有了大幅跃升的现实基础,它让人形机器人拥有感知、思考、决策等方面的能力。随着新技术、新产品、新业态的快速发展,人形

智猩猩GenAI2024年11月27日 17:52北京01为什么我要写这个?系统化的学习大模型,除了知道大模型是什么,也得知道大模型是如何训练的,对大模型的实际应用有更加定量的认知,该文章也算是一篇分布式训练的学习过程总结,作为循序渐进学习分布式训练的总结。类似之前写过的LLM文章,本文也建议读者先定性有个宏观认知,然后再细化到某个概念定量了解,遇到不太清楚的概念深度递归去学习02为什么需要分布式

DeepSeek R1 系列模型采用了先进的强化学习技术进行训练,使得推理过程不仅包含大量的反思和验证,而且思维链长度可达数万字。这一特性使得该系列模型在数学、代码以及各种复杂逻辑推理任务上,取得了与知名模型 o1-preview 相媲美的推理效果,并为用户呈现了 o1 未曾公开的完整思考过程。

(2022 年)中国计算机学会*** 标黄:表示现在 2019 年第五版目录中,升级至 A/B*** 红字:表示不在 2019 年第五版目录中, 直接申请 A/B/C*** 删掉:表示从 2019 年第五版目录中移除。
原创 Aitrainee2024年07月19日 07:43湖南Aitrainee | 公众号:AI进修生🌟用于开发 AI Web 代理的大型行动模型框架。Hi,这里是Aitrainee,欢迎阅读本期新文章。,这是一个用于开发AI网页应用的框架,它现在有了一些很酷的新更新,比如可以构建一个能够根据你的简历PNG自动申请工作的代理,这太疯狂了。以前它只能做一些简单的任务,但现在似乎变得更好了,不仅能
我们这支集合工业界老兵和高密度科学家的战队,拥有完整的技术栈,将在具身智能的前沿打造软硬一体的综合解决方案,拓展在先进制造,商超物流及2B服务业等场景中的应用场景,快速实现数据闭环,商业化落地。业切入,以头部客户的高价值场景需求为指引,开发整合技能集,实现商业落地,并快速迭代硬件,算法,数据系统,不断提升具身智能整体解决方案的泛化性,灵巧性和成功率,给出具身领域“不可达三角”的最优解。地的全能团队

此模型结合了代码工具,在 MATH 基准测试中能达到 58.8% 的准确率。虽然目前仍有较多团队未公开具体方案,但很高兴通过开源模型的方式推动了技术交流与模型能力探索,这也是最初我们选择开源的重要动力,并且这一竞赛结果也很好地佐证了 DeepSeekMath 的能力。我们使用了未经微调的 DeepSeek-Math-7B-RL 模型,并通过我们制定的评分规则使用多数投票的策略选择正确答案。未来,我

写到结束天也快亮了,deepseek也是所知的第一家能训出fp8 loss的厂,还记得前两年讨论int8和fp8优劣的时候(那会还没有H100,没有fp8 tensorcore)记得看到知乎有个老哥留言,如果fp8训练成功走通的话。无缝衔接fp8推理一定会很顺滑。那会还在想fp8训练遥遥无期。没想到一眨眼就有人能做到了。deepseek对训练fp8量化的观察和解决方法都很有启发,希望能看到fp8训

2025年01月19日 23:14日本博客来源:https://pytorch.org/blog/accelerating-gemms-triton/ 这里做了翻译。这篇博客主要讲了如何用 Triton 来优化 Float8 格式的矩阵乘法(GEMM)运算。文章提出了一个叫 GridQuant 的方法,通过把大矩阵分成 256x256 的小块,然后再把每个小块分成更小的 32x32 的格子来处理数
AI在整个过程中完全与你同步。Windsurf的创新之处就是它能够在AI与开发者之间建立实时的协同关系,不需要开发者不断向AI提供工作范围的上下文信息,AI可以根据开发者的最新操作,自动获取上下文,保持同步。而到了2024年11月,Windsurf 推出了工作流概念,使得开发者与AI的实时协作更加流畅,AI能够根据开发者的工作调整自己的行为,而无需重新适应工作范围。与此相比,Cursor的Pro计
