李元豪个人主页

@bvip911

李元豪

2023-05-17 07:48:04 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Isaac-Sim/MuJoCo genie 仿真对比【具身智能学习俱乐部】

一句话总结。

#学习

qwen 多模态预训练流程步骤详细介绍

Qwen 多模态系列（包括 Qwen-VL、Qwen2-VL、Qwen2.5-VL）的预训练流程采用三阶段渐进式训练策略，逐步融合视觉与语言模态，并通过数据优化提升模型性能。• 视觉-语言适配器：单层交叉注意力模块，使用 256 个可学习查询向量（learnable queries）压缩图像特征序列至固定长度（256），并注入 2D 绝对位置编码保留空间信息。• 规模：35 万指令数据（Qwen-

#人工智能

如果vla数据集数据在 vla模型强化学习训练中有效果，能不能推出这些数据在 vla模型预训练中也有效果？【具身智能学习俱乐部】

我需要先查看这个文件扫描工具的脚本内容，然后为您生成扫描文件夹的命令。我需要继续查看脚本的更多内容，特别是了解如何正确使用这个文件扫描工具。现在我已经了解了这个文件扫描工具的基本用法。让我为您生成扫描文件夹的命令。让我为您生成几个不同用途的扫描命令：我已经为您生成了扫描文件夹的命令集合，并保存到了文件中。

#学习 #linux #运维

强化学习在大型语言模型训练中的最新进展：开源项目深度分析报告

AReaL-boba²是由清华大学交叉信息院和蚂蚁技术研究院联合团队开发的全异步强化学习训练系统，作为AReaL里程碑版本AReaL-boba的重磅升级。该项目坚持"全面开源、极速训练、深度可定制"的开发理念，以全异步RL为核心，发布SOTA代码模型，全面奔向Agentic RL[0DeepSeek-R1是由DeepSeek团队于2025年1月20日发布的开源推理大模型，在数学、编程和推理等多个任

#语言模型 #开源 #人工智能

error: could not create ‘build\bdist.win-amd64\wheel\.\vllm\model_executor\layers\fused_moe\configs

cd vllm。

#人工智能

没有docker-compose命令,只有docker compose(两个单词中间是空格)命令因为docker-compose版本比较新,已经去掉了较老的docker-compose命令兼容,官

因为docker-compose版本比较新,已经去掉了较老的docker-compose命令兼容,官方也建议使用较新的docker compose。没有docker-compose命令,只有docker compose(两个单词中间是空格)命令。

#docker #java #容器

深度思考和搜索研究最新的GSPO强化学习算法

阿里Qwen团队在强化学习领域的创新主要体现在 GSPO 算法和大规模强化学习模型的开发上。GSPO 算法通过序列级优化提升了训练效率和稳定性，而 Qwen3 系列模型则通过强化学习显著增强了代码能力、代理能力和通用智能水平。如果需要进一步了解 GSPO 算法或 Qwen 模型的具体技术细节，可以访问阿里 Qwen 的官方公告或技术文档。GSPO通过群体相对优化范式，重新定义了大语言模型强化学习的

#算法

我用提示词A 对qwen3-4b大模型进行 nl2sql 任务 grpo 强化学习，评估的时候换新提示词，会影响nl2sql测评准确率吗？

正确SQL明确统计。

#java #前端 #服务器

agent 循环，自己迭代自己

Python是一种高级、解释型、通用编程语言，语法简洁易读，适合初学者入门。它拥有丰富的标准库和第三方模块，广泛应用于Web开发、数据分析、人工智能、自动化脚本等领域。Python支持多种编程范式，包括面向对象、函数式和过程式编程，具有强大的社区支持和跨平台特性。"name": "三云服务","definition": "指取证服务云、搜索云服务和公证云服务，是美亚柏科从产品销售向服务转型的核心战

#人工智能 #数据库 #运维

Isaac-Sim/MuJoCo genie 仿真对比【具身智能学习俱乐部】

一句话总结。

#学习

共 40 条

请选择