夕小瑶个人主页

@xixiaoyaoww

夕小瑶

2022-09-29 17:09:40 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Apple intelligence 正式开启测试！第一波文本工具测试体验来啦！

这个功能最恐怖的地方在于，

#人工智能

经典！工业界深度学习与故障诊断必读论文汇总

随着现代工业的不断发展，传统的故障诊断技术已经很难满足生产需要，而深度学习以其强大的特征提取能力和在模式识别上的独特优势，为解决这类工业需求提供了一种可能。因此，基于深度学习技术的智能故障诊断(IFD) 被提出。目前该技术已被大量研究，各种新的组合创新模型层出不穷，因此需要发掘新的领域，寻找突破口，解决新的问题。工业故障诊断就是当下热门的领域之一，这个研究方向创新点多，直观且易上手，对于想要快速入

#深度学习 #人工智能 #机器学习 +2

全球最火的视觉AI「YOLO」首次来到中国，告诉我们视觉AI的下一站

YOLO Vision 2025（YV25）在深圳华侨城创意文化园首次亮相中国。本次大会吸引了 200 多名与会者亲临现场，还有许多的伙伴们通过 Bilibili 和 YouTube 在线参加了活动，在 Bilibili 共计有 2w+ 的观看量。

#人工智能 #科技 #大数据

最新版《神经网络和深度学习》中文版.pdf

获取最新版《神经网络和深度学习》最新版PDF和PPT的方法：1.扫码关注“Python与机器智能”公众号2.后台回复关键词：神经网络注：此处建议复制，不然容易打错▲长按扫描关注，回复...

#python #人工智能 #神经网络 +2

大模型时代，我们真的不再需要分词了吗？

文 | 付奶茶编 | 小轶分词是NLP的基础任务，将句子、段落分解为字词单位，方便后续的处理的分析。不知道NLPer有没有思考过这个问题:我们在各项研究工作中想要建模的文本单位究竟是什么?...

#算法 #自然语言处理 #python +2

复旦发布多模态大模型AnyGPT，文图语乐样样行

1. AnyGPT模型的核心理念与架构AnyGPT模型是一个新颖的多模态语言模型，它通过离散表示来统一处理文本、图像、音乐等多种模态的数据。这种模型的设计允许它在不改变现有大型语言模型（LLM）架构或训练范式的情况下稳定训练。AnyGPT的核心是一系列多模态分词器，这些分词器将原始的多模态数据压缩成离散的语义标记序列，然后通过LLM进行自回归处理，实现感知、理解、推理和生成等任务。在生成过程中，去

#自然语言处理

为大模型而生！顶流大佬发起成立学术会议 COLM，或成为未来 NLP 最强顶会？！

前段时间，ACL 2024 的主席公开抨击称“ arXiv是科研的毒瘤”，这引发了大范围的争论。一时间，大家对 *CL 的抵触情绪愈发高涨，绝大多数学界都在这场辩论中站在了支持 arXiv+Twitter 的一方。

#自然语言处理 #人工智能

降本提效！阿里提出大模型集成新方法

本文通过实验证明了，所提出的 ZOOTER 方法在平均水平上超越了最佳单一模型，甚至可以胜过通过奖励模型排名集成的模型，并且有着明显较小的计算开销。在如今追求高效、节能的时代，本文的方法为我们开辟了一个新的探索方向，探讨如何更有效地集成 LLM，为解决高计算开销问题提供了一种创新性的解决方案。

#人工智能

文心一言用户达3亿！文心大模型4.0 Turbo发布，支持API，真GPT-4 Turbo国产来了！

从笔者的视角来看，百度显然是在AI生态中构建护城河最深的玩家，从自研的深度学习框架、海量多样的互联网数据积累到深厚的AI算法和工程积累，加之搜索引擎从诞生那一天起就在为理解和满足国内数亿网民的需求而持续迭代，因此文心一言成为国内最早破圈到如今如此大体量用户的AI应用，也就很好理解了。而拆开来看的，一方面数据决定模型的效果上限，数据的规模和质量同步提升是一定的，在此基础上，SFT、RLHF等大模型训

调参侠的自我修养——深度学习调参秘籍

这是一篇写给萌新的“科学炼丹”手册前言近期在订阅号后台和文章评论区review了一下大家的问题，发现很多小伙伴现在已经把机器学习、深度学习的理论基础打好了，但是真正要解决一个现实中的算法问题的时候经常两手抓瞎，一顿毫无目的乱试，甚至认为模型表现不好一定是调参不够仔细。新手最大的问题在于解决问题的逻辑不够清晰，喜欢使用“蛮力法”，因此很容易陷入一个“找到一份开源代码““跑...

共 794 条

请选择