logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Skywork-R1V3-38B论文速读:一种先进的开源视觉 - 语言强化学习模型(VLM、RL)

Skywork-R1V3是一种先进的开源视觉-语言模型,通过强化学习框架将文本模型的推理能力迁移到视觉任务中。该模型采用独特的三阶段训练方法:冷启动微调、强化学习和连接器唯一微调。关键创新包括精心设计的奖励函数、GRPO算法优化以及连接器模块的针对性训练。在多个基准测试中,Skywork-R1V3表现出色,特别是在数学和逻辑推理任务上,达到与闭源模型相当的性能。研究还揭示了强化学习对提升多模态推理

文章图片
#人工智能#语言模型#大数据 +2
QwenLong-L1-32B论文速览:趋向长上下文大 推理模型与强化学习

本文提出QWENLONG-L1框架,通过强化学习提升大型推理模型在长文本(120K tokens)场景下的推理能力。该框架采用渐进式上下文扩展方法,包含预热监督微调、分阶段RL训练和难度感知回溯采样三个核心技术,解决了长文本RL训练效率低和优化不稳定的问题。实验在7个长文本问答基准上,QWENLONG-L1-14B/32B模型表现优异,与Claude-3.7-Sonnet相当。消融研究验证了各技术

文章图片
#人工智能#算法#机器学习 +1
分布式异步强化学习框架训练32B大模型:INTELLECT-2

INTELLECT-2 是一个拥有 320 亿参数的语言模型,基于 qwen2 架构构建,与 vllm 和 sglang 等推理引擎兼容。该模型通过社区贡献的分布式 GPU 资源进行强化学习训练,采用 prime-rl 框架和基于可验证奖励的 GRPO 方法,特别强调长度控制预算。训练数据集主要包括数学和编码任务,模型在 AIME24、AIME25 和 LiveCodeBench 等基准上表现优于

文章图片
#分布式#人工智能#深度学习 +1
docker创建容器添加启动--restart选项

推荐优先使用 docker update 命令,简单高效且兼容性强。修改配置文件适用于调试或特殊环境,但需谨慎操作以避免配置冲突。可通过 docker inspect 验证参数是否生效。★★★★★★★★★★★★★★★★★★如何在启动时就配置好?

文章图片
#docker
pycharm ssh 远程连接docker 容器 进行debug调试代码

启动:docker run -itd -p 3216:3210 --name=新容器名 刚保存的镜像名 /bin/bash。保存镜像:docker commit 95a567f82e38 new_image_name。pycharm ssh 远程连接docker 容器 进行debug调试代码。进入:docker exec -it 95a56 /bin/bash。查看状态:service ssh s

文章图片
#pycharm#ssh#docker
主流大模型加速推理框架对比表(vllm、tensorRT、llama.cpp、Ollama)

主流大模型加速推理框架对比表(vllm、tensorRT、llama.cpp、Ollama)

文章图片
vllm的技术核心、安装流程和使用教程,以及注意事项

vLLM技术通过PagedAttention内存管理、Continuous Batching连续批处理和分布式推理优化,显著提升了大规模语言模型的推理效率和资源利用率。PagedAttention采用分页思想管理KV缓存,提升内存利用率2-4倍;Continuous Batching动态调整批次大小,提升GPU利用率3倍;分布式推理通过张量并行和流水线并行优化多GPU负载均衡。安装流程包括环境准备

#人工智能#深度学习
vllm 大模型部署 参数说明

请注意,以上信息可能会随着vLLM引擎的后续版本更新而发生变化。

#开发语言#语言模型#python
linux 使用阿里云盘 阿里网盘

阿里网盘拉取网盘数据

#阿里云
小红书开源混合专家模型速览:dots.llm1.inst

小红书开源混合专家模型速览:dots.llm1.inst

文章图片
#开源#语言模型#人工智能 +2
    共 345 条
  • 1
  • 2
  • 3
  • 35
  • 请选择