logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于docker的vLLM服务部署

简单记录一下docker 部署vllm 服务, 为什么呢,因为我就是记不住啊

文章图片
#docker#容器#运维
通过自蒸馏的Reinforcement Learning

大型语言模型正越来越多地通过强化学习在可验证领域(如代码和数学)进行后训练。然而,当前基于可验证奖励的强化学习方法(RLVR)仅依赖每次尝试的标量结果奖励进行学习,这导致了严重的信用分配问题(credit assignment bottleneck)。实际上,许多可验证环境能够提供丰富的文本反馈,例如运行时错误或评审打分,这些信息能够解释一次尝试为何失败。本文将这一情境形式化为一种带有丰富反馈的强

文章图片
#人工智能
经典多模态模型

传统多模态模型以及一些笔记vilt,clip, albef, vlmo, blip, coca, beit v3

文章图片
#深度学习#人工智能
UNETR:用于三维医学图像分割的Transformer

我们将体积(3D)医学图像分割任务重新制定为序列到序列的预测问题。我们引入了一种新的架构,称为UNEt-TRansformer(UNETR),它利用Transformer作为编码器来学习输入体积的序列表示并有效捕获全局多尺度信息,同时也遵循编码器和解码器的成功“u形”网络设计也能很好的提取到局部特征。

文章图片
#计算机视觉#深度学习#人工智能 +1
深度学习模型推理速度/吞吐量计算(附代码)

模型推理速度和吞吐量,算Inference Speed (in ms)的!

文章图片
#深度学习#人工智能
基于谐波参数空间的卷积神经网络自动三维牙齿分割

牙齿三维模型的自动分割是正畸CAD系统的一个重要步骤。三维牙齿分割是一项网格实例分割任务。由于三维牙齿模型表面复杂的几何特征常常导致牙齿边界检测失败,传统的网格分割方法难以实现自动准确的分割。我们提出了一个解决这个问题的新方法。我们将三维牙齿模型同构映射到二维谐波参数空间,并将其转换成图像。这使得我们可以使用CNN学习高度鲁棒的图像分割模型来实现3D牙齿模型的自动准确分割。最后,我们将图像分割掩码

文章图片
#cnn#人工智能#神经网络
人工智能的未来:探索大型概念模型的潜力

Meta引入了大型概念模型(Large Concept Models, lcm),代表了传统的基于令牌的框架的重大转变。lcm使用概念作为理解的基本单位,支持更复杂的语义推理和上下文感知决策。鉴于这一新兴技术的学术研究有限,我们的研究旨在通过收集、分析和综合现有的灰色文献来弥补知识差距,以提供对lcm的全面了解。具体来说,我们(i)识别和描述LCM与llm的区别特征,(ii)探索LCM在多个领域的

文章图片
#人工智能
深度学习模型参数量/计算量(附计算代码)

介绍了FLOPS,FLOPs和Params并附上了计算代码

文章图片
#深度学习#人工智能
SR-Scientist: 利用 ai agent 进行科学公式的发现

在本文中,我们介绍了 SR-Scientist 框架,该框架将大型语言模型从被动的方程提出者转变为用于符号回归的自主科学家。通过分析数据、评估和优化方程,该智能体通过主动与环境交互生成并优化假设。我们的实验表明,SR-Scientist 在精度、泛化能力、对噪声的鲁棒性以及符号准确性方面显著优于现有方法。此外,我们开发了一个完整的强化学习管道,使智能体能够自我进化并增强其发现能力。

文章图片
#人工智能#算法
Agent Laboratory: 利用 LLM Agent 作为研究助手

一个自动生成论文的agent, 该框架以人类提供的研究想法为起点,依次经历文献综述、实验实施与报告撰写三个阶段,最终产出完整的科研成果,包括代码仓库与研究报告。是启发性工作,效果难以达到实际学术需求水准,所以主要分析和思考了一下Method 部分。

文章图片
#intellij-idea
    共 57 条
  • 1
  • 2
  • 3
  • 6
  • 请选择