logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

人工智能的新商业模式

历史上最重要的事件往往会留在我们的记忆中。我们经常可以回想一下,当历史上发生重大事件时,我们做了什么或在哪里。也许我们还记得我们第一次接触人工智能和 ChatGPT。人工智能 (AI) 的概念可以追溯到几十年前。20 世纪 90 年代中期,关于人工智能的第一次讨论彻底改变了世界。例如,人工智能在《终结者》等电影中被残酷地描绘,其中有自我思考的机器将接管世界。但是,随着强大的机器(基于摩尔定律),人

文章图片
#搜索引擎
人工智能时代,软件开发人员还有未来吗?

人工智能 (AI) 时代已经到来,许多软件开发人员担心自己无法保持与时俱进。我们很容易将他们对职业未来的担忧视为卢德谬论的又一个例子,即简单地认为新技术不会摧毁就业,因为它只会改变经济中的就业结构,但有许多指标将软件开发人员的未来描绘得更加暗淡。

文章图片
#人工智能
阿尔法狗的秘密:人工智能中的强化学习

在强化学习中 ,虽然没有现成的答案,但是强化学习代理(`agent`)仍然必须决定如何行动(`action`)来完成它自己的任务。 在没有训练数据的情况下,代理从经验中学习。 它通过反复的试错来收集训练样本(“这个动作很好,那个动作很糟糕”),学习的目标就是使其长期奖励(`reward`)最大化 。

#人工智能
用Flutter开发Web应用

Flutter作为一个可移植的UI框架,已经支持现代Web应用开发了!我们很开心已经发布了SDK预览版,这样你可以在Web浏览器里直接运行你的Flutter UI代码。原文链接:Flutter Web - 目标全平台开发的Flutter再下一城!- 汇智网Flutter Web的目标从去年Beta版发布以来,客户们已经使用Flutter来创建可以运行在iOS和Android上的移动应用了...

FLUX.1 文生图模型微调指南

这些大型图像生成模型(如 FLUX.1 和 Stable Diffusion)在一堆添加了噪声的图像上进行训练,并学习“添加噪声”的反向功能。令人惊讶的是,这竟然是“创建图像”。他们怎么知道要创建哪幅图像?他们以 CLIP 和 T5 等转换器模型为基础,这些模型本身经过大量图像-标题对的训练。这些是语言到图像的编码器:它们学习将图像及其标题映射到高维空间中的相同形状。当您向他们发送文本提示时,例如

文章图片
#人工智能#计算机视觉
使用合成数据训练语义分割模型

计算机视觉应用现在在各个科技领域无处不在。这些模型高效且有效,研究人员每年都会尝试新想法。新的前沿是试图消除深度学习的最大负担:需要大量的标记数据。正如本文所述,此问题的解决方案是使用合成数据。从这些研究中获益最多的计算机视觉领域当然是语义分割领域,即预测图像每个像素的标签的任务,以便从图像中检索感兴趣的对象。正如人们所预料的那样,手动标记训练集是一个昂贵、耗时且容易出错的过程,因此有多种利用合成

文章图片
LoRA低秩自适应微调技术原理及实践

用于解决微调大型语言模型 (LLM) 的挑战。GPT 和 Llama 等模型拥有数十亿个参数,通常对于特定任务或领域进行微调的成本过高。LoRA 保留了预训练的模型权重,并在每个模型块中加入了可训练层。这显著减少了需要微调的参数数量,并大大降低了 GPU 内存需求。LoRA 的主要优势在于,它大幅减少了可训练参数的数量——有时最多可减少 10,000 倍——从而大大降低了 GPU 资源需求。

文章图片
#人工智能
几何深度学习 - 利用几何先验知识的深度学习

深度学习很难。虽然通用逼近定理表明足够复杂的神经网络原则上可以逼近“任何东西”,但不能保证我们可以找到好的模型。尽管如此,通过明智地选择模型架构,深度学习取得了巨大进步。这些模型架构对归纳偏差进行编码,为模型提供帮助。最强大的归纳偏差之一是利用几何概念,从而产生了几何深度学习领域。几何深度学习(geometric deep learning)这个术语最早是由该领域的先驱 Michael Brons

文章图片
#深度学习#人工智能#计算机视觉
基于CLIP的图像分类、语义分割和目标检测

OpenAI CLIP模型是一个创造性的突破;它以与文本相同的方式处理图像。令人惊讶的是,如果进行大规模训练,效果非常好。在线工具推荐:CLIP 将图像视为一系列不重叠的补丁,每个补丁都是一个视觉标记(类似于 NLP 中的文本标记或单词)。因此,图像只是一系列视觉标记,可以使用旧的转换器像文本一样进行处理。训练数据是从网络上抓取的图像标题对。CLIP 模型经过训练,可以使用对比损失将图像/文本转换

文章图片
#分类#目标检测#数据挖掘
基于文本提示的图像目标检测与分割实践

SAM 使用图像编码器(通常是视觉变换器 (ViT))来提取图像嵌入,作为掩模预测的基础。该模型还包含一个提示编码器,它对各种类型的输入提示进行编码,例如点坐标、边界框和低分辨率掩模输入。然后将这些编码的提示与图像嵌入一起输入掩码解码器以生成最终的对象掩码。上述架构允许对已编码的图像进行快速、轻松的提示。掩模:可以提供粗略的、低分辨率的二进制掩模作为初始输入来指导模型。点:用户可以输入 [x, y

文章图片
#目标检测#目标跟踪#人工智能
    共 549 条
  • 1
  • 2
  • 3
  • 55
  • 请选择