深度学习入门个人主页

@2501_91695603

深度学习入门

2025-04-16 19:55:36 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习模型代码汇总

CNN ：卷积神经网络，用于处理图像问题，如图像的识别分类等，主要包括LetNet，AlexNet，EfficientNet，DenseNet等。给自己一个成长的机会吧，给自己一个证明你也可以的机会，从现在开始，提升自己的代码能力或者任何一件你觉得有意义的事情。图像分割：图像分割将图像划分为多个有意义的区域或者对象，传统图像分割方法包括阈值分割，区域生长，分水岭算法等，瘆得慌学习中图像分割算法主要

#机器学习 #人工智能 #计算机视觉

CoT＋MLLM，突破传统单模态推理的局限性！

本文中，提出了一种图像合并的多模态思维链，名为 \textbf{Interleaved-modal Chain-of-Thought （ICoT）}，它生成由配对的视觉和文本基本原理组成的顺序推理步骤来推断最终答案。在现有的大规模视觉语言多模态模型中，对被遮挡物体的理解没有得到很好的研究。构建了大规模的多模态思维链数据集：为了支持上述复杂推理流程的训练，作者构建了一个包含11万个样本的大规模数据集

#人工智能 #计算机视觉 #深度学习

用AI写代码，怎么问问题啊！？

一位高级工程师描述，他有次带人用AI优化SpringBoot接口，实习生兴奋地说：“大模型生成CRUD这样的基础内容太强了！根本就不用人来干预。”但我注意到生成的代码缺少事务管理，问他为什么不用@Transactional注解，实习生居然反问："那个注解是干什么的？是的，现在哪怕基础不牢，也能完成一定规模的开发任务，但是这所带来的最大的问题就是越来越多的开发者遇到问题不知道具体该问什么，只能大段大

#java #人工智能 #机器学习 +3

大模型+小模型，原地起飞

大模型能力强但耗资源，小模型省资源但能力有限...有什么办法能将它们结合起来，发挥1+1>2的效果？今天就给大家分享几个常用的结合策略！为方便理解和学习，我还附上了每种策略相关的参考论文，共有17篇，包含开源代码，如果你对大模型结合小模型感兴趣，那强烈推荐阅读！

#人工智能 #集成学习 #迁移学习 +2

（IJCAI2025）傅里叶变换结合注意力机制，涨点起飞！

最近注意力机制又双叒叕火出圈了，和傅里叶变换的组合直接杀穿顶会！比如IJCAI25上的SRConvNet，在图像超分辨率任务里直接干出 SOTA 性能！为什么这种跨界操作如此之香？因为傅里叶变换能把数据拆成不同频率的“积木块”，而注意力机制能锁定最关键的部分，这对很多领域（尤其是信号处理）都是不可或缺！不过这方向目前还存在些老问题，比如计算量爆炸、泛化能力拉胯...但想想这不都是创新突破口？

#深度学习 #人工智能 #机器学习

这个方向超级好出论文！非常适合做大模型的同学

主要内容：当前音频大模型在输入音频的质量评估推理能力方向不足，所以作者提出了一种ALLD的蒸馏技术，通过meta info+prompt输入到LLM中获取LLM的response，然后对AudioLLM进行蒸馏，提高其在MOS得分预测和A/B test中的能力，实现过程其实并不复杂，重要的是这种思路以及实验设计挺值得借鉴的。主要内容：音频-语言模型（ALMs）是在音频-文本对上进行预训练的，这些

#人工智能 #深度学习

GPT-5真的不如4.5吗？GPT-5在科研中最好用的20个提示词~

作为OpenAI推出的最新版本，今天分享20个GPT在科研中最好用的提示词，包括①总结文章、②找参考文献、③写文献综述、④句子润色、⑤改格式、⑥写代码、⑦算法实现、⑧实验模拟数据处理、⑨科研辅助作图、⑩提供科研灵感等等！：“请根据以下数据生成一张折线图，并标明图例：{数据}”GPT不仅可以生成基本的图表，还能够帮助进行个性化调整，确保图表符合科研论文的要求。GPT能够帮助生成高效的代码，减少手动编

#人工智能 #算法 #神经网络 +1

这七本书，可以说是学习深度学习从科研到工作绕不开的巨作了！

📌 全面讲解 Transformer 架构及其变体（BERT、GPT、ViT 等）；📌 覆盖 CNN、RNN、Transformer、BERT、生成模型等主流结构；👥 没有完整数学基础的研究生、交叉背景（医学、生物、经济等）科研人员。📌 补齐 AI 学习所需的三大数理支柱：线性代数、概率论、优化方法；👥 NLP、多模态、生物信息、医学图像等前沿科研方向的硕博研究者。👥 要动手写代码、跑

#学习 #深度学习 #人工智能 +1

深度学习开端｜全连接神经网络

看到这里，可能很多人会疑惑，为什么要加上f(z)这个运算，这个运算的目的是为了将输出的值域压缩到（0，1），也就是所谓的归一化，因为每一级输出的值都将作为下一级的输入，只有将输入归一化了，才会避免某个输入无穷大，导致其他输入无效，变成“一家之言”，最终网络训练效果非常不好。三维图像就像一个“碗”，如图 4.6所示，它和二维空间的抛物线一样，存在极值，那我们只要将极值求出，那就保证了我们能求出最优的

#深度学习 #神经网络 #人工智能 +2

解锁新装备：快速理解神经网络、汇报画图必备

它以图像和动画的形式来解释深度学习是怎么一层层简化复杂事物的，我们可以设置数据分布类型、训练集和测试集的比例、批量大小、隐藏层、神经元个数、学习率、激活函数、正则化和任务类型等参数。——这绝对是深度学习初学者的福利，很多同学在学深度学习和神经网络的过程中，很容易被复杂的数学模型和公式劝退，但是这个网站不需要你懂任何复杂的数学运算就可以帮你掌握神经网络的概念。它展示了卷积神经网络（CNN）的所有实现

#神经网络 #人工智能 #深度学习 +2

共 19 条

请选择