
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
对深度学习而言,不论是学术研究还是落地应用都需要尽可能提升模型效果,这往往需要trick进行支撑。这些trick有的是广泛适用的(如循环学习率、BN等等),有的是任务特定的(比如cv里的数据增强,nlp里的mask,推荐里的降采样)这些trick有的能够提升网络精度,有的能够加速收敛,有的甚至比模型提升更加显著。在同学们各自的领域中,有哪些常遇到的、易实践的、易推广的trick呢?Gordon L
资源“及时雨”解决“算力荒”5月以来,不少用户向微软反馈:集成ChatGPT聊天功能的New Bing搜索引擎回答速度正在变慢。即便是与OpenAI进行深度合作的微软也只能无奈回应“该情况因GPU资源补充速度跟不上用户增长速度所导致”。国内互联网公司在打响“百模大战”的同时,也在不妨碍原有业务的前提下,尽可能腾挪手中算力资源,以满足大模型训练刚需。为缓解GPU卡资源紧张问题,并行科技将在2023年
霍华德(向着成为人工智能训练大师前进)回答:是时候讨论一下越老越吃香这个话题了!越老越吃香第一定律:一个经验可以反复使用,反复创造价值,才有可能越老越吃香。如果你仔细思考所有职业所积累的经验,能符合越老越持续第一定律的职业其实非常稀少。医生和律师是其中最典型的两个。医生看病的经验,用到一个病人身上产生一次价值,而且随着经验增长,慢慢积累出看疑难杂症的能力,产生的价值进一步...
大家好,今天和大家聊聊转行的事情。首先声明,今天这篇是一篇劝退文,想要劝一劝那些不是非常合适,或者说没有想清楚的同学。我倒不是站着说话不腰疼,而是真的觉得外界对于我们这行的看法可能有一点问...
伴随着秋招开始,知乎上又开始出现各种算法岗劝退的消息。虽然算法确实很卷,但说要有顶会才能入场这就“离谱”。今天咱们就来澄清一下事实,先拿数据说话!以NLP四大顶会ACL,NAACL,EMN...
开发岗的基础技术体系比较成熟,行业线性前进,你看得到技术发展的目标,不用去做研究,在公司工作就可以推进行业发展。反观算法岗,尤其是人工智能技术,发展还不稳定,现有的神经网络是有天花板的,不太可能在现有技术上线性发展到AI 2.0,可能5年后现有这套方法就完全失效了,所有你在现有基础上做的炼丹技巧都可能都会失效,而人工智能技术大多数理论不够深入,现在的积累真的可以顺利迁移到新一代ai技术上吗?是不是
作者 |青暮、陈大鑫编辑 | 丛 末SIGIR是一个展示信息检索领域中各种新技术和新成果的重要国际论坛,若非疫情影响,今年本定于中国西安市举行。7月25日-7月30日,第43届SIG...
借着Meta发布的Segment Anything视觉大模型,跟朋友们做了一个最强Zero-Shot视觉应用:最强的Zero-Shot检测器,最强的Zero-Shot分割器,最强的Zero-Shot生成器,三合一模型简称为Grounded-SAM。代码地址如下:https://github.com/IDEA-Research/Grounded-Segment-Anything三种类型的模型可以分开
作者:林俊旸(阿里巴巴 多模态&NLP)编辑:AI椰青正值前几天发布Qwen2-VL,大家应该在我们的博客或者各个公众号看到我们模型的表现,并且看到我们开源了Qwen2-VL-7B和Qwen2-VL-2B以及推出了Qwen2-VL-72B的API。如果你还没看过,请点击下面几个链接:Blog:https://qwenlm.github.io/blog/qwen2-vl/GitHub:htt
作者:沉迷单车@知乎个人背景博主北邮AI渣硕,研究方向是视觉AIGC,具体来说就是Diffusion图像生成;暑期实习在阿里巴巴,发过一顶会+水会若干。秋招拿了达摩院、淘天、快手、美团、小红书、腾讯、小米、B站等10+ offer,绝大部分是ssp,小部分sp,无白菜,无头部计划offer。时间线暑期实习:一般过年后一些大厂核心部门开始抢人了(例如阿里云),这时候招聘系统还没开放,所以面评一般不会







