logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

京东:基于多类目MoE模型的电商搜索引擎

每天给你送来NLP技术干货!来自:SUFE AI Lab标题:Adversarial Mixture Of Experts with Category Hierarchy Soft Constraint期刊:ICDE 2021商品搜索引擎是电商平台满足用户购物需求的一个重要系统,它根据用户输入的搜索词,返回个性化的排序列表。商品一般会被归为某一大类下某个小类目,例如电子产品,在电子产品这个大类目下

AI安全的过去与未来:从大模型到智能体 | 预约

在 NeurIPS、ICLR、CVPR、AAAI、ACL、EMNLP, T-ITS、TCSVT 等会议期刊上发表论文二十多篇。目前,NICE已构建起覆盖中、美、欧的国际化团队,正加速在硅谷、纽约、香港等地落地,致力于打造连接学术、产业与未来的全球化AI前沿社区。他的研究方向包括可信大模型/智能体,对话系统,贝叶斯学习,语音识别等,分别于苏黎世联邦理工学院和伦敦大学学院进行学术交流,以一作身份在 A

#人工智能#安全
【干货】基于pytorch的CNN、LSTM神经网络模型调参小结

Demo这是最近两个月来的一个小总结,实现的demo已经上传github,里面包含了CNN、LSTM、BiLSTM、GRU以及CNN与LSTM、BiLSTM的结合还有多层多通道CNN、LSTM、BiLSTM等多个神经网络模型的的实现。这篇文章总结一下最近一段时间遇到的问题、处理方法和相关策略,以及经验(其实并没有什么经验)等,白菜一枚。Demo Site: https://github....

#深度学习#pytorch
直播预约 | LUFFY:让推理模型实现“即学即用”的强化学习训练方法

然而,现有的零强化学习(zero-RL)方法本质上是"同策略"(on-policy)的,这限制了模型只能从自身输出中学习,无法获得超出其初始能力的推理能力。分析表明,LUFFY不仅能有效模仿,还能探索超越示范的空间,为使用离策略指导训练可泛化的推理模型提供了一条可扩展的路径。每周进行学术分享,形式包括圆桌会议、主题分享、单篇论文深度分享等,内容覆盖论文分享、科研小白入门、PhD择业等所有学术领域。

浙大联合小红书发布大模型翻译最新研究成果:MT-R1-Zero,强化学习驱动机器翻译新范式!

针对这些难题,我们提出了MT-R1-Zero,首次将R1-Zero范式成功扩展到机器翻译领域的实现。格式错误将受到固定惩罚,激励模型优先学习正确格式。MT-R1-Zero证明了,即使在评估复杂、输出灵活的机器翻译任务上,纯粹的、基于度量的强化学习也是一条很有潜力的技术路径,希望这项工作能启发更多将RL应用于复杂自然语言生成任务的研究。在OOD(分布外)测试中,仅在英汉数据上训练的MT-R1-Zer

#机器翻译#人工智能#自然语言处理
大模型训练加速之FlashAttention系列:爆款工作背后的产品观

知乎:方佳瑞原文:https://zhuanlan.zhihu.com/p/664061672纯学术分享,侵删FlashAttention(FA)是一系列针对Transformer模型训练和推理加速方案。自从发布以来,历经了多次迭代,并借着其节省显存、加速计算、使用简单的特性,目前已经是大模型训练必备之良药。FA的论文,一年多就有242个引用,作为一个做底层优化的论文,也是前无古人了。不过仔细研究

介绍几篇EMNLP'22的语言模型训练方法优化工作

每天给你送来NLP技术干货!来自:圆圆的算法笔记点击这里进群—>加入NLP交流群今天给大家介绍3篇EMNLP 2022中语言模型训练方法优化的工作,这3篇工作分别是:针对检索优化语言模型:优化语言模型训练过程,使能够生成更合适的句子表示用于检索——RetroMAE: Pre-training Retrieval-oriented Transformers via Masked Auto-En

ICLR2019 | 模型训练会发生了大量的、反复的样本遗忘现象,如何解决?

每天给你送来NLP技术干货!来自:SimpleAI标题:An Empirical Study of Example Forgetting during Deep Neural Networ...

#大数据#算法#机器学习 +2
图神经网络:Graph Neural Networks

每天给你送来NLP技术干货!来自:Smarter本文参照以下两篇blog,这两篇应该是目前介绍GNN和GCN最好的blog了。https://distill.pub/2021/gnn-in...

#神经网络#大数据#python +2
炼丹侠必知的11大神经网络结构​汇总!

点击下面卡片,关注我呀,每天给你送来AI技术干货!基础时晴,文章框架源于引文[1]来自:炼丹笔记炼丹侠必知的11大神经网络结构汇总!简 介随着深度学习的快速发展,目前已经出现了海量的不同结...

#神经网络#算法#深度学习 +2
    共 1377 条
  • 1
  • 2
  • 3
  • 138
  • 请选择