logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

ArXiv 2603 | 用神经元胞自动机训练语言模型:合成数据能超越自然语言吗?

作者认为,LLMs 中涌现的推理能力(few-shot learning、chain-of-thought 等),其本质依赖的是自然语言的底层计算结构,而非其语义内容本身。自然语言文本之所以有用,不是因为它谈论的是人类世界,而是因为它蕴含了从推理轨迹到程序性指令的多样结构——next-token prediction 迫使模型内化支持这些结构的潜在计算过程。

文章图片
#语言模型#人工智能#自然语言处理
ArXiv:2603 | Neural Thickets: Diverse Task Experts Are Dense Around Pretrained Weights

摘要: 本文提出了一种新颖视角,将预训练模型视为参数空间中的“专家灌木丛”(Neural Thickets),而非单一权重起点。研究发现,大型预训练模型周围的参数邻域内存在高密度的任务专家,这些专家可通过简单随机采样和集成获得。作者提出的RandOpt方法仅需随机采样参数扰动并集成最优解,无需梯度优化,即可达到与PPO、GRPO等复杂强化学习微调方法相当的性能。实验表明,模型规模与专家密度、多样性

文章图片
#深度学习#集成学习
PyTorch之分布式操作中的Barrier

PyTorch的多卡程序中你可能讲过Barrier,这篇文章会展现更多的细节。

文章图片
#pytorch#分布式#人工智能
图像分割之SegFix: Model-Agnostic Boundary Refinement for Segmentation

SegFix: Model-Agnostic Boundary Refinement for Segmentation原始文章: https://www.yuque.com/lart/papers/nfkhhz说在开头后处理算法本文提出了一种后处理算法,想要对标DenseCRF[Efficient inference in fully connected crfs with gaussian ed

#计算机视觉#人工智能#深度学习
图像分割之Dense Prediction with Attentive Feature Aggregation

Dense Prediction with Attentive Feature Aggregation原始文档: https://www.yuque.com/lart/papers/xnqoi0偶然间从 arxiv 上翻到的论文, 可以看做是对之前工作 Hierarchical multi-scale attention for semantic segmentation 的一个扩展.从摘要读论文

文章图片
#计算机视觉#深度学习#人工智能
卷积神经网络之早期架构

早期的重要CNN架构: LeNet

显著性目标检测之Selectivity or Invariance: Boundary-Aware Salient Object Detection

Selectivity or Invariance: Boundary-Aware Salient Object Detection文章目录Selectivity or Invariance: Boundary-Aware Salient Object Detection主要贡献针对问题主要方法实验细节参考链接原始文档: https://www.yuque.com/lart/papers/...

#计算机视觉
卷积神经网络之NiN(2013)

文章目录Network-in-network(2013)论文概要新奇点MLP Convolution Layers(MLP卷积层)全局平均池化(GAP)层输出作为可信度构思细节训练细节训练结果架构代码Network-in-network(2013)文档存放更新地址:https://github.com/lartpang/ML_markdown文章书写匆忙,有些使用了网上其他朋友的文字以...

文章图片
#人工智能#深度学习#神经网络 +1
显著性目标检测之Global Context-Aware Progressive Aggregation Network for Salient Object Detection

Global Context-Aware Progressive Aggregation Network for Salient Object Detection文章目录Global Context-Aware Progressive Aggregation Network for Salient Object Detection主要工作主体结构FIASRHAGCF损失函数实验细节相关链接原始文档

#人工智能#深度学习#计算机视觉
使用Docker为无网络环境搭建深度学习环境

原始文档:https://www.yuque.com/lart/blog/nxomkhFrom unsplash前言最近需要在一个特殊的环境下训练模型, 虽然硬件设备都不错, 也可以向服务器拷贝东西, 但是重要的一个问题是, 服务器端没有连接外网, 这导致搭建深度学习模型训练环境的时候, 不能自动通过网络来安装特定的软件了. 虽然说, 可以将代码用到的所有的包都下载好, 将其安装传输到服务器中安装

文章图片
#docker#深度学习
    共 33 条
  • 1
  • 2
  • 3
  • 4
  • 请选择