logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

样本量极少如何机器学习?最新Few-Shot Learning综述

作者丨鼓动衣衫的晚风来源丨极市平台导读本文首先介绍了用小样本训练模型会导致的问题,再介绍了Few-Shot Learning的基本原理即三大思路下的方法:增多训练数据,缩小模型需要搜索...

#机器学习#人工智能#深度学习 +2
万字详解提示学习(Prompt Learning )和微调 (Prompt Tuning)

作者:爱吃牛油果的璐璐,北京大学电子与通信工程硕士后台留言『交流』,加入 NewBee讨论组前言Self-Attention 和 Transformer 自从问世就成为了自然语言处理领域的新星。得益于全局的注意力机制和并行化的训练,基于 Transformer 的自然语言模型能够方便的编码长距离依赖关系,同时在大规模自然语言数据集上并行训练成为可能。但由于自然语言任务种类繁多,且任务之间的差别不.

#学习
堪比ChatGPT!Meta华人提出「牧羊人」Shepherd,LLaMA 70亿参数微调,评估模型生成给出建议...

源|新智源大家好,这里是 NewBeeNLP。大模型生成内容还需自我改进。Meta提出的Shepherd模型,能够评估模型生成,给出建议。近日,Meta AI最新研究,提出了语言模型Shepherd,专门用于评估模型响应并提出改进建议。对此,研究人员通过社区反馈和人工标注,整体出一个高质量的反馈数据集,大约有70亿参数。论文地址:https://arxiv.org/pdf/2308.04592..

#人工智能
他山之石:京东电商知识图谱与AIGC落地实践

后台留言『交流』,加入NewBee讨论组导读本文将分享如何将知识图谱应用到电商场景下的 AIGC。文章将围绕下面五个方面进行分享:1.导言2.基于领域知识图谱的商品文案生成3.基于通用知识图谱的商品文案生成4.基于领域知识图谱的 LLM5.基于通用知识图谱的 LLM分享嘉宾|李浩然博士京东科技言犀大模型算法负责人出品社区|DataFun01导言首先介绍一下京东在电商场景下 AIGC...

#知识图谱#人工智能
SeqGPT: 开箱即用的开放域自然语言理解大模型

论文链接:SeqGPT: An Out-of-the-box Large Language Model for Open Domain Sequence Understanding(https://arxiv.org/abs/2308.10529)GitHub链接:https://github.com/Alibaba-NLP/SeqGPT体验地址:https://www.modelscope.cn

Twitter 是怎么做推荐的?开源代码详细解读

作者|上衫翔二整理|NewBeeNLP大家好,这里是 NewBeeNLP。马斯克最近开源了大部分Twitter的代码,截止目前已经有接近50K star,但网上大多数的文章都属于相对宽泛的介绍,于是我们计划对整个框架的每个模块进行深入解读,包括模型细节paper以及code。今天这篇作为整个项目的开篇,会从整体介绍 twitter 的推荐系统框架和模块。另外,如果你也对此感兴趣,想要一起...

#twitter
详解各种LLM系列|LLaMA 1 模型架构、预训练、部署优化特点总结

作者|Sunnyyyyy整理|NewBeeNLPhttps://zhuanlan.zhihu.com/p/668698204后台留言『交流』,加入 NewBee讨论组LLaMA 是Meta在2023年2月发布的一系列从 7B到 65B 参数的基础语言模型。LLaMA作为第一个向学术界开源的模型,在大模型爆发的时代具有标志性的意义。为了更深入地理解LLaMA的技术特点,特地在此整理了LLa...

自动驾驶算法工程师基本技术要求

今天将重点介绍关于BEV感知算法的经典研究成果——BEVFormer。研梦非凡请来了国内一线车企研究院资深算法工程师Frank导师,在3月7日晚20点与大家深入探讨自动驾驶中的视觉感知算法,系统地讲解这些算法的原理、应用和未来发展,并介绍单目相机感知算法和BEV(Bird's Eye View,鸟瞰视角)感知算法的发展历程和核心思想。扫描二维码预约直播课再领课程ppt和30多个自动驾驶开源代码数据

#自动驾驶#人工智能#机器学习
Open-Sora全面开源!

源|机器之心后台留言『交流』,加入NewBee讨论组不久前 OpenAI Sora 以其惊人的视频生成效果迅速走红,在一众文生视频模型中突出重围,成为全球瞩目的焦点。继 2 周前推出成本直降 46% 的 Sora 训练推理复现流程后,Colossal-AI 团队全面开源全球首个类 Sora 架构视频生成模型 「Open-Sora 1.0」,涵盖了整个训练流程,包括数据处理、所有训练细节和模型权..

熬了几个大夜,学完一套985博士总结的Pytorch学习笔记(20G高清/PPT/代码)

作为一名AI工程师,掌握一门深度学习框架是必备的生存技能之一。自 TensorFlow 从 Google 中脱颖而出以来,它在研究和商业领域成为最受欢迎的开源深度学习框架,紧接着 从 Fa...

#算法#神经网络#人工智能 +2
    共 40 条
  • 1
  • 2
  • 3
  • 4
  • 请选择