logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深度学习刷SOTA有哪些trick?

对深度学习而言,不论是学术研究还是落地应用都需要尽可能提升模型效果,这往往需要trick进行支撑。这些trick有的是广泛适用的(如循环学习率、BN等等),有的是任务特定的(比如cv里的数据增强,nlp里的mask,推荐里的降采样)这些trick有的能够提升网络精度,有的能够加速收敛,有的甚至比模型提升更加显著。在同学们各自的领域中,有哪些常遇到的、易实践的、易推广的trick呢?Gordon L

#机器学习#深度学习#神经网络 +2
并行科技即将上线超万P超算架构大模型算力

资源“及时雨”解决“算力荒”5月以来,不少用户向微软反馈:集成ChatGPT聊天功能的New Bing搜索引擎回答速度正在变慢。即便是与OpenAI进行深度合作的微软也只能无奈回应“该情况因GPU资源补充速度跟不上用户增长速度所导致”。国内互联网公司在打响“百模大战”的同时,也在不妨碍原有业务的前提下,尽可能腾挪手中算力资源,以满足大模型训练刚需。为缓解GPU卡资源紧张问题,并行科技将在2023年

#科技#架构
算法工程师是不是一个「越老越吃香」的岗位?

霍华德(向着成为人工智能训练大师前进)回答:是时候讨论一下越老越吃香这个话题了!越老越吃香第一定律:一个经验可以反复使用,反复创造价值,才有可能越老越吃香。如果你仔细思考所有职业所积累的经验,能符合越老越持续第一定律的职业其实非常稀少。医生和律师是其中最典型的两个。医生看病的经验,用到一个病人身上产生一次价值,而且随着经验增长,慢慢积累出看疑难杂症的能力,产生的价值进一步...

#算法#java#人工智能 +2
三十多岁就别转行做算法了

大家好,今天和大家聊聊转行的事情。首先声明,今天这篇是一篇劝退文,想要劝一劝那些不是非常合适,或者说没有想清楚的同学。我倒不是站着说话不腰疼,而是真的觉得外界对于我们这行的看法可能有一点问...

#算法#人工智能#大数据 +2
0顶会入场大厂算法岗的正确姿势(干货总结)

伴随着秋招开始,知乎上又开始出现各种算法岗劝退的消息。虽然算法确实很卷,但说要有顶会才能入场这就“离谱”。今天咱们就来澄清一下事实,先拿数据说话!以NLP四大顶会ACL,NAACL,EMN...

#算法#编程语言#人工智能 +1
长远看算法岗真的比开发岗香吗?

开发岗的基础技术体系比较成熟,行业线性前进,你看得到技术发展的目标,不用去做研究,在公司工作就可以推进行业发展。反观算法岗,尤其是人工智能技术,发展还不稳定,现有的神经网络是有天花板的,不太可能在现有技术上线性发展到AI 2.0,可能5年后现有这套方法就完全失效了,所有你在现有基础上做的炼丹技巧都可能都会失效,而人工智能技术大多数理论不够深入,现在的积累真的可以顺利迁移到新一代ai技术上吗?是不是

#算法#人工智能
深度学习之父Hinton:下一代神经网络

作者 |青暮、陈大鑫编辑 | 丛 末SIGIR是一个展示信息检索领域中各种新技术和新成果的重要国际论坛,若非疫情影响,今年本定于中国西安市举行。7月25日-7月30日,第43届SIG...

#神经网络#大数据#算法 +2
最强Zero-Shot视觉应用:Grounding DINO+Segment Anything+Stable Diffusion

借着Meta发布的Segment Anything视觉大模型,跟朋友们做了一个最强Zero-Shot视觉应用:最强的Zero-Shot检测器,最强的Zero-Shot分割器,最强的Zero-Shot生成器,三合一模型简称为Grounded-SAM。代码地址如下:https://github.com/IDEA-Research/Grounded-Segment-Anything三种类型的模型可以分开

Qwen2-VL:让我们先把视觉理解干上去!(一)

作者:林俊旸(阿里巴巴 多模态&NLP)编辑:AI椰青正值前几天发布Qwen2-VL,大家应该在我们的博客或者各个公众号看到我们模型的表现,并且看到我们开源了Qwen2-VL-7B和Qwen2-VL-2B以及推出了Qwen2-VL-72B的API。如果你还没看过,请点击下面几个链接:Blog:https://qwenlm.github.io/blog/qwen2-vl/GitHub:htt

24届视觉算法岗(AIGC方向)秋招经验分享

作者:沉迷单车@知乎个人背景博主北邮AI渣硕,研究方向是视觉AIGC,具体来说就是Diffusion图像生成;暑期实习在阿里巴巴,发过一顶会+水会若干。秋招拿了达摩院、淘天、快手、美团、小红书、腾讯、小米、B站等10+ offer,绝大部分是ssp,小部分sp,无白菜,无头部计划offer。时间线暑期实习:一般过年后一些大厂核心部门开始抢人了(例如阿里云),这时候招聘系统还没开放,所以面评一般不会

#算法#AIGC#经验分享
    共 412 条
  • 1
  • 2
  • 3
  • 42
  • 请选择