logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型中文内容安全评测发布,幻方DeepSeek-67B模型夺魁,谷歌7B模型表现亮眼...

©作者 | 魏鸿鑫单位 | 南方科技大学助理教授研究方向 | 机器学习引言为了全面探究当前大语言模型在中文环境下的内容风控能力,南方科技大学 “Data+AI” 数据智能实验室魏鸿鑫课题组联合北京滴普科技有限公司发布了中文内容安全评测数据集(ChineseSafe),并对当前主流的大语言模型进行了详细的评测,有望为众多科研机构与企业提供开源模型和 API 在中文内容安全能力上的参考。我们将尽快在

#安全
缓存与效果的极限拉扯:从MHA、MQA、GQA到MLA

©PaperWeekly 原创 ·作者 | 苏剑林单位 | 科学空间研究方向 | NLP、神经网络前几天,幻方发布的 DeepSeek-V2[1] 引起了大家的热烈讨论。首先,最让人哗然的是 1 块钱 100 万 token 的价格,普遍比现有的各种竞品 API 便宜了两个数量级,以至于有人调侃“这个价格哪怕它输出乱码,我也会认为这个乱码是一种艺术”;其次,从模型的技术报告看,如此便宜的价格背..

北京内推 | 深度求索DeepSeek招聘LLM4Math方向实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!深度求索DeepSeek是一家探索通用人工智能(AGI)本质的公司,以开源汇聚更多的创造力和生产力,并致力于将研究、工程和商业三者融为一体。我们相信,AGI 是数据x算法x算力的完美实践,科研+工程+组织的优雅艺术。我们正在寻找并长期培养优秀的数据研发人才,与我们一起进行高水平

从ACL 2024录用论文看混合专家模型(MoE)最新研究进展

©PaperWeekly 原创 ·作者 |杨远航单位 |哈尔滨工业大学(深圳)研究方向 |自然语言处理最近 ACL 2024 论文放榜,扫了下,SMoE(稀疏混合专家)的论文不算多,这里就仔细梳理一下,包括动机、方法、有趣的发现,方便大家不看论文也能了解的七七八八,剩下只需要感兴趣再看就好。下面是列表,顺序大抵是个人兴趣程度排序。1. DeepSeekMoE: Towards Ultima...

北京内推 | DeepSeek AI招聘多模态理解与生成统一模型方向算法实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!DeepSeekDeepSeek是一家探索通用人工智能(AGI)本质的公司,以开源汇聚更多的创造力和生产力,并致力于将研究、工程和商业三者融为一体。我们相信,AGI 是数据x算法x算力的完美实践,科研+工程+组织的优雅艺术。如果你对人工智能有浓厚的兴趣,如果你想在一个充满挑战和

#人工智能
对抗训练浅谈:意义、方法和思考(附Keras实现)

©PaperWeekly 原创 ·作者|苏剑林单位|追一科技研究方向|NLP、神经网络当前,说到深度学习中的对抗,一般会有两个含义:一个是生成对抗网络...

漫谈度量学习(Distance Metric Learning)那些事儿

©作者 | 黄春喜单位| 香港科技大学研究方向 | 智能交通前言上图为 2018 年 4 月在杭州阿里中心听 Michael Jordan 讲座时所摄,他本人也是 distance me...

#python#机器学习#人工智能 +2
图神经网络设计中的算子融合策略

©作者 |刘曜齐单位|北京邮电大学硕士生来源|北邮GAMMA Lab本文主要的描述基于消息传递机制的图神经网络设计中应用的算子融合策略,带领读者了解有关算子融合的相关问题以及方法。引言目前,图神经网络(GNN)的程序编写主要依赖 GNN 框架,例如 PyG,DGL 等,并从中享受到高效的设计。现有的 GNN 设计大多基于消息传递机制,包括三大步骤:消息创建,消息聚合,特征更新。假定图...

目标检测-定位蒸馏:logit蒸馏与feature蒸馏之争

定位蒸馏 (LD, CVPR 2022)先上我们文章和代码:论文标题:Localization Distillation for Dense Object Detection论文地址:https://arxiv.org/abs/2102.12252代码地址1:https://github.com/HikariTJU/LD地址代码2:https://github.com/o...

#计算机视觉#机器学习#人工智能 +1
博士申请 | 香港科技大学(广州)李佳老师招收数据挖掘方向全奖博士生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港科技大学(广州)香港科技大学是世界上发展最快的大学之一,2021年位列QS世界大学排名第34位和泰晤士高等教育世界年轻大学排名第3位。香港科技大学(广州)与香港科技大学在“港科大一体,双校互补”的框架下开展合作,地位平等,在学术规范、师资水平、课程质量等方面保持一致,实现资

#数据挖掘#人工智能
    共 122 条
  • 1
  • 2
  • 3
  • 13
  • 请选择