logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于CLIP的图像分类、语义分割和目标检测

OpenAI CLIP模型是一个创造性的突破;它以与文本相同的方式处理图像。令人惊讶的是,如果进行大规模训练,效果非常好。在线工具推荐:CLIP 将图像视为一系列不重叠的补丁,每个补丁都是一个视觉标记(类似于 NLP 中的文本标记或单词)。因此,图像只是一系列视觉标记,可以使用旧的转换器像文本一样进行处理。训练数据是从网络上抓取的图像标题对。CLIP 模型经过训练,可以使用对比损失将图像/文本转换

文章图片
#分类#目标检测#数据挖掘
基于文本提示的图像目标检测与分割实践

SAM 使用图像编码器(通常是视觉变换器 (ViT))来提取图像嵌入,作为掩模预测的基础。该模型还包含一个提示编码器,它对各种类型的输入提示进行编码,例如点坐标、边界框和低分辨率掩模输入。然后将这些编码的提示与图像嵌入一起输入掩码解码器以生成最终的对象掩码。上述架构允许对已编码的图像进行快速、轻松的提示。掩模:可以提供粗略的、低分辨率的二进制掩模作为初始输入来指导模型。点:用户可以输入 [x, y

文章图片
#目标检测#目标跟踪#人工智能
视觉语言模型详解【VLM】

视觉语言模型被广泛定义为可以从图像和文本中学习的多模态模型。它们是一种生成式模型,可以接受图像和文本输入并生成文本输出。大型视觉语言模型具有良好的零样本能力,具有良好的泛化能力,并且可以处理多种类型的图像,包括文档、网页等。用例包括谈论图像、通过指令进行图像识别、视觉问答、文档理解、图像字幕等。一些视觉语言模型还可以捕获图像中的空间属性。当系统提示检测或分割特定主题时,这些模型可以输出边界框或分割

文章图片
#语言模型#人工智能#自然语言处理
从零创建深度学习张量库,支持gpu并行与自动微分

多年来,我一直在使用 PyTorch 构建和训练深度学习模型。尽管我已经学会了它的语法和规则,但总有一些东西激起了我的好奇心:这些操作内部发生了什么?这一切是如何运作的?如果你已经到这里,你可能也有同样的问题。但是如果我问你这个后退步骤是如何工作的呢?或者,例如,当你重塑张量时会发生什么?数据是否在内部重新排列?这是怎么发生的?为什么 PyTorch 这么快?PyTorch 如何处理 GPU 操作

文章图片
#深度学习#人工智能
Babylon Native无头渲染3D场景

当我们说渲染时,我们通常谈论的是应用程序以 60fps 的速度渲染,无论是游戏还是其他使用 GPU 的应用程序。然而,在其他场景中,我们可能希望使用 GPU 来运行根本不显示任何内容的进程,例如处理视频、操作图像或渲染 3D 资源,也许所有这些都在服务器上运行。在本文中,我将描述如何使用 Babylon Native 来实现此类场景。具体来说,我将展示一个示例,说明如何使用 Babylon Nat

文章图片
#3d
WebGPU vs. 像素流

在构建 Bzar 之前,我们讨论过我们的技术栈是基于在云上渲染内容的像素流,还是基于使用设备自身计算能力的本地渲染技术。由于这种选择会极大地影响项目的成本、可扩展性和用户体验,因此在开始编写一行代码之前,从一开始就采取正确的做法是一个重要的方面。到目前为止,我们必须在质量和规模之间做出选择。WebGL 很便宜,但图形效果还有很多不足之处。另一方面,云渲染可以实现高端图形,但扩展成本太高。即使最近云

文章图片
多GPU并行AI推理

Hugging Face 平台拥有许多数据集和预训练模型,使使用和训练最先进的机器学习模型变得越来越容易。然而,扩展 AI 任务可能很困难,因为 AI 数据集通常很大(100 GB 到 TB),使用 Hugging Face Transformer 进行模型推理有时计算成本很高。Dask 是一个用于分布式计算的 Python 库,它可以通过将数据集分解为可管理的块来处理核外计算(处理内存中放不下的

文章图片
#人工智能
Numba + cuPy = GPU加速的NumPy

在数值计算领域,利用 GPU 的强大功能可以显著提高性能。虽然 NumPy 长期以来一直是 Python 中数组操作和数值运算的首选库,但它缺乏原生的 GPU 加速。幸运的是,cuPy 和 Numba 这两个库通过将 GPU 支持无缝集成到您的数值工作流程中,提供了引人注目的替代方案。在这篇博文中,我们将深入研究这些库并将它们与 NumPy 进行比较,重点介绍它们的独特功能和优势。

文章图片
#numpy
聊天机器人(Chatbot)开发:自然语言处理(NLP)技术栈

我相信在大多数情况下,聊天机器人的开发者构建自己的自然语言解析器,而不是使用第三方云端API,是有意义的选择。 这样做有很好的战略性和技术性方面的依据,我将向你展示自己实现NLP有多么简单。 这篇文章包含3个部分:为什么要自己做最简单的实现也很有效你可以真正用起来的东西那么要实现一个典型的机器人,你需要什么样的NLP技术栈?

#自然语言处理#nlp
小白的机器学习之路:Numpy探索

这是numpy教程系列的第二部分。 如果你还没有阅读过第一部分,我建议你先读一下。 在这个教程中,我将介绍Numpy中与数据科学和机器学习相关的重要知识点,也就是说,我不打算涵盖numpy所有的功能。

#机器学习#numpy
    共 550 条
  • 1
  • 2
  • 3
  • 55
  • 请选择