logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

网络模型设计的想法、实践和探索

突破出现在2012年,成功可以归因于两个关键的因素:数据和硬件。2009年,ImageNet有100万个样本,1000个不同类别的对象。硬件上GPU的发展,庞大的GPU数量远远快于CPU的计算能力,GPU的带宽比CPU快10倍。在这个思路上一路狂奔,出现了ChatGPT,数据量超过万亿(数据),上万的GPU并行计算(算力),千亿甚至万亿参数的神经网络(算法),在今天,处于全球领先地位(the st

文章图片
#深度学习
商业与AIGC观察笔记1

GPT开创的商业模式:一开始数据积累可能不多,但通过更好的算法,吸引更多用户使用 GPT,并在使用过程中产生更多数据的语料库,可以用于深度学习和改进算法模型。通过优化算法模型,进一步吸引更多早期用户持续使用产品,贡献更多数据,增加用户粘性。这样的增长飞轮能够帮助创业公司快速建立自己的护城河,形成持续的商业优势。目前的投资热点:垂直领域的应用;未来,对算力和芯片的需求可能呈直线上涨的趋势,美国的一级

文章图片
#AIGC
深度学习大模型学习100tips

通过深入了解这些细节,并在实际项目中应用相关的知识,将能够更好地理解和利用大模型的潜力,不仅在学术研究中,也在工程实践中。通过不断探索新方法、参与项目和保持热情,并将其应用于各种领域,从自然语言处理到计算机视觉和自动驾驶。通过不断学习、实践和探索,可以不断提升自己在深度学习领域的技能和洞察力,同时也能为社会和行业带来创新和改进。从小规模的项目和模型开始,逐渐迭代和扩展到更大的模型,逐步积累经验,最

文章图片
#学习#人工智能#深度学习
Grad-CAM-模型可视化分析方法

Grad-CAM(Gradient-weighted Class Activation Mapping)是一种用于解释卷积神经网络(CNN)决策过程的方法,特别是在图像分类任务中。这种方法通过计算特定类别得分相对于网络最后一层卷积特征图的梯度,来确定哪些部分的图像对分类结果最为重要。具体来说,Grad-CAM利用梯度信息来定位图像中的关键区域,从而生成可视化图,帮助理解模型是如何做出分类决策的。

文章图片
#人工智能#深度学习
大模型的推理和搜索能力

推理和搜索问题,如定理证明和程序合成,一直是人工智能领域的长期挑战。组合搜索空间使得传统的基于搜索的方法难以处理。然而,即使在最数学化的领域中,人类也可以直观地操作,而AlphaGo等现有工作已经表明,深度神经网络可以有效地引导搜索空间。但人类也会在不同的任务之间传递知识,从而促进更有效的适应能力和更抽象的推理能力。基础模型提供了缩小这一差距的可能性:它们的多用途性质沿着其强大的生成和多模式能力,

文章图片
#人工智能
全球知名语音大模型介绍

语音大模型是一种基于人工智能技术构建的大型深度学习模型,主要用于处理复杂的语音相关任务。这些模型不仅在学术界引起了广泛的研究兴趣,也在商业应用中发挥了重要作用,为智能音箱、虚拟助手、自动驾驶汽车、电话客服等多个领域提供了强大的语音交互技术支持。随着技术不断进步,更多的先进语音大模型将会不断涌现。

文章图片
#深度学习#人工智能#语音识别
大语言模型的关键技术

经过漫长的发展,LLM 进化到了当前的状态——通用且有能力的学习者。在这个过程中,人们提出了许多重要的技术,大大提升了 LLM 的能力。在此,我们简要列举了几种重要的技术,这些技术(可能)是导致 LLM 成功的关键。

文章图片
多模态大模型最全综述

多模态基础模型已经从专用走向通用.它从目前已经完善的和还处于最前沿的两类多模态大模型研究方向出发,全面总结了五个具体研究主题:视觉理解视觉生成统一视觉模型LLM加持的多模态大模型多模态agent

文章图片
#人工智能
如何通过深度学习实践来理解深度学习的核心概念

通过深度学习实践可以更好地理解其核心概念,因为理论知识在实际应用中会面临复杂性和挑战。通过实践,不仅可以加深对深度学习概念的理解,还能发现理论与实际之间的差距,进而对模型进行改进和优化。实践中遇到的问题(如梯度消失、过拟合、训练效率低等)能促使你深入思考,进而更加全面地掌握深度学习的核心概念。

文章图片
#深度学习#人工智能
预训练(Pre-training)

预训练阶段在深度学习和自然语言处理(NLP)、计算机视觉(CV)等领域的模型构建中起着至关重要的作用。通过在大规模无标签数据集上进行预训练,模型可以学到丰富的语言结构、词汇关系、图像特征等通用知识,并将其编码为参数形式。这种预训练得到的模型能够提供高质量的初始化权重,这些权重包含了对世界广泛而深入的理解。总体来说,预训练和应用开发相辅相成,共同推动了AI技术的发展和落地应用。预训练大大提升了模型性

文章图片
#深度学习#人工智能#自然语言处理 +1
    共 52 条
  • 1
  • 2
  • 3
  • 6
  • 请选择