logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

让我们用 PyTorch 从头开始​​构建我们自己的 GPT 模型

我们希望从语料库中获取块大小(8)的随机句子,因此我们生成批量大小(32)的索引(ix),并且对于每个索引,我们取接下来的 8 个标记 id 并为批量(ix)中的每个索引堆叠,但是我们的目标(y)生成的索引比 x(i+1, i + block_size + 1)多一个,因为我们需要预测序列中的下一个标记。设置optimizer.zero_grad(),执行loss.backward(),并执行op

文章图片
#机器学习#深度学习#计算机视觉 +1
2025年高级计算机视觉工程师路线图

以下是一份全面的路线图,概述了您成为全栈计算机视觉工程师的旅程中应涵盖的关键步骤和主题。请记住,这是一个高级路线图,您可以根据自己的兴趣和目标进行自定义。计算机视觉工程师的工作涉及机器学习的交叉领域,模拟人类视觉。深度学习彻底改变了计算机视觉,使其在各种任务中实现了前所未有的性能。由于 Python 拥有丰富的库和框架,掌握 Python 对于实现复杂算法和高效处理大规模图像处理任务至关重要。Op

文章图片
#计算机视觉#人工智能#机器学习 +1
如何使用 Ollama 在本地运行 Llama 3.2-Vision:边缘 AI 的游戏规则改变者

无论您是 AI 研究人员、AI 开发者,还是仅仅喜欢尝试最新技术的人,此版本都将为您带来激动人心的全新可能。中的 Ollama 集成 Llama 3.2-Vision 的图像处理功能,下面提供了一个实际示例,将图像发送到模型进行分析。在这篇文章中,我将指导您将 Ollama 升级到 0.4.1 版本,提供一个实际演示来帮助您在系统上运行。Llama 3.2-Vision 为最令人兴奋的语言模型之一

文章图片
#人工智能#计算机视觉#深度学习
2025年高级计算机视觉工程师路线图

以下是一份全面的路线图,概述了您成为全栈计算机视觉工程师的旅程中应涵盖的关键步骤和主题。请记住,这是一个高级路线图,您可以根据自己的兴趣和目标进行自定义。计算机视觉工程师的工作涉及机器学习的交叉领域,模拟人类视觉。深度学习彻底改变了计算机视觉,使其在各种任务中实现了前所未有的性能。由于 Python 拥有丰富的库和框架,掌握 Python 对于实现复杂算法和高效处理大规模图像处理任务至关重要。Op

文章图片
#计算机视觉#人工智能#机器学习 +1
卷积神经网络各层的作用以及API的设计

1. 特征不变性,也就是我们在图像处理中经常提到的特征的尺度不变性,池化操作就是图像的resize,平时一张狗的图像被缩小了一倍我们还能认出这是一张狗的照片,这说明这张图像中仍保留着狗最重要的特征,我们一看就能判断图像中画的是一只狗,图像压缩时去掉的信息只是一些无关紧要的信息,而留下的信息则是具有尺度不变性的特征,是最能表达图像的特征。激活层最重要的便是激活函数,它的主要作用是加入非线性因素的,将

文章图片
#cnn#深度学习#计算机视觉 +2
从图像中提取结构化车辆数据

我们的流水线链由四个组件组成:图像加载组件、提示生成组件、MLLM 调用组件以及用于将 LLM 的输出解析为结构化格式的解析器组件。想象一下,在一个检查点,有一个摄像头监控车辆,你的任务是记录复杂的车辆细节——类型、车牌号、品牌、型号和颜色。这项任务极具挑战性——传统的计算机视觉方法难以处理各种模式,而监督式深度学习则需要集成多个专门的模型、大量的标记数据和繁琐的训练。在本教程中,我们将构建一个车

文章图片
#车辆识别#机器学习#深度学习 +2
使用 TensorFlow 和 Keras 构建 U-Net

假设起始数量为 64,那么对于你今天构建的 3 块 U-Net(根据你的模型配置),滤波器的数量将是 64、128 和 256。我更喜欢将它们定义在一个定义中,以便在整个模型中重复使用它们(如果我需要将模型部署到生产环境中,例如,我可以通过 JSON 环境变量提供我的配置,该变量可以轻松地以 的形式读入 Python。扩展路径中的每一步都包括对特征图进行上采样,然后进行 2x2 卷积(“上卷积”)

文章图片
#tensorflow#keras#人工智能 +2
深度学习-python猫狗识别tensorflow2.0

文件夹test1不变,新建一个文件夹validation,在文件夹train中分别拿出猫和狗的图像各2500张,存到文件夹validation中。文件夹train里面放着25000张图像,猫和狗的图像分别都是12500张,图像名称上都有标明类别。先读取文件夹test1中的图像,使用 model.predict() 进行预测,再根据预测结果把图像进行分类,分别存储到 猫 和 狗 的文件夹中。预测的图

文章图片
#人工智能#深度学习#计算机视觉
训练神经网络的批量标准化(使用 PyTorch)

即每个隐藏层输入数据分布的变化,意味着每一层都需要一些额外的时间来学习权重,从而使整个系统能够最小化整个神经网络的损失值。批量归一化通过将输入数据的分布缩减至 (0, 1),并逐层执行,理论上有望减少所谓的“内部协方差偏移”,从而加快学习速度。这就是为什么作者引入了一个具有一些参数 γ 和 β 的缩放和平移操作,利用这些参数可以在训练期间调整标准化,在极端情况下甚至可以“表示身份变换”(即输入的内

文章图片
#神经网络#pytorch#人工智能
卷积神经网络各层的作用以及API的设计

1. 特征不变性,也就是我们在图像处理中经常提到的特征的尺度不变性,池化操作就是图像的resize,平时一张狗的图像被缩小了一倍我们还能认出这是一张狗的照片,这说明这张图像中仍保留着狗最重要的特征,我们一看就能判断图像中画的是一只狗,图像压缩时去掉的信息只是一些无关紧要的信息,而留下的信息则是具有尺度不变性的特征,是最能表达图像的特征。激活层最重要的便是激活函数,它的主要作用是加入非线性因素的,将

文章图片
#cnn#深度学习#计算机视觉 +2
    共 14 条
  • 1
  • 2
  • 请选择