logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

改进卷积神经网络,你需要这14种设计模式(转载自机器之心微信号,mark一下当自己网络训练不好时可以看看)

自从 2011 年深度卷积神经网络(CNN)在图像分类任务中优于人类开始,它们就成为了计算机视觉任务中的行业标准,这些任务包括图像分割、目标检测、场景标记、跟踪以及文本检测等等。然而,训练神经网络的技巧并不容易掌握。与之前的机器学习方法一样,细节是最恐怖的地方,然而在卷积神经网络中有更多的细节需要去管理:你所用的数据和硬件的限制是什么?你应该以哪种网络作为开始呢?AlexNet

#机器学习#cnn#深度学习
Fast-LLM:加速大型语言模型训练的开源库

Fast-LLM是一个基于PyTorch和Triton构建的开源库,专为训练大型语言模型而设计。极速性能:优化的内核效率和降低的开销,使得训练速度极快。高度可扩展:支持在多个GPU和节点上进行分布式训练,使用3D并行(数据、张量和流水线)。灵活易用:兼容所有常见的语言模型架构,支持自定义模型架构、数据加载器、损失函数和优化器。真正的开源:在Apache 2.0许可下,完全开源,鼓励社区驱动的开发。

文章图片
#语言模型#开源#人工智能
SAM 2与SAM 1的对比及SAM 2的微调指南

SAM 2的推出标志着图像和视频分割技术的又一大进步。通过对比SAM 2与SAM 1,我们可以看到SAM 2在功能性和技术细节上的显著提升。此外,通过微调SAM 2,我们可以进一步增强其在特定领域的分割能力,为各种应用场景提供更准确的分割结果。随着技术的不断发展,SAM 2无疑将成为图像和视频处理领域的重要工具。

文章图片
#机器学习
Stagehand:简单可扩展的人工智能网页浏览框架

Stagehand 是一个由 Browserbase 团队维护的人工智能驱动的网页浏览框架,它是 Playwright 的后继者,提供了三个简单的 API(act、extract 和 observe),这些 API 提供了构建自然语言驱动的网页自动化操作的基础。Stagehand 的目标是提供一个轻量级、可配置的框架,没有过于复杂的抽象,同时模块化地支持不同的模型和模型提供商。它不会帮你订披萨,但

文章图片
#人工智能
浏览器自动化库Browser-Use:让大型语言模型与网站互动的新工具

Browser-Use是一个开源的网页自动化库,它通过提供一个简单的接口,让LLM能够与网站进行互动。这个库支持多标签管理、XPath提取和视觉模型处理,使得自动化网页操作变得更加简单和高效。

文章图片
#自动化#语言模型
可解释机器学习系列:第七章 全局模型无关方法

我们将深入探讨全局模型无关方法。这些方法专注于描述机器学习模型在整体数据集上的平均行为,为我们提供了一种理解模型如何做出预测的宏观视角。

文章图片
#机器学习#人工智能#大数据
Stagehand:简单可扩展的人工智能网页浏览框架

Stagehand 是一个由 Browserbase 团队维护的人工智能驱动的网页浏览框架,它是 Playwright 的后继者,提供了三个简单的 API(act、extract 和 observe),这些 API 提供了构建自然语言驱动的网页自动化操作的基础。Stagehand 的目标是提供一个轻量级、可配置的框架,没有过于复杂的抽象,同时模块化地支持不同的模型和模型提供商。它不会帮你订披萨,但

文章图片
#人工智能
AI实操Excel:在Excel中学习人工智能基础算法

AI实操Excel是由Imagine AI Lab开发的一个项目,它提供了一系列的Excel工作簿,每个工作簿都包含了不同的AI算法和概念的实操练习。通过这个工具,你可以在Excel中直接操作和观察AI算法的运行过程,从而更好地理解这些算法的工作原理。AI实操Excel是一个非常棒的资源,它让AI的学习变得更加直观和易于理解。通过亲手操作,你可以更快地掌握AI的核心概念和技能。无论你是AI的初学者

文章图片
#人工智能#学习
Fast-LLM:加速大型语言模型训练的开源库

Fast-LLM是一个基于PyTorch和Triton构建的开源库,专为训练大型语言模型而设计。极速性能:优化的内核效率和降低的开销,使得训练速度极快。高度可扩展:支持在多个GPU和节点上进行分布式训练,使用3D并行(数据、张量和流水线)。灵活易用:兼容所有常见的语言模型架构,支持自定义模型架构、数据加载器、损失函数和优化器。真正的开源:在Apache 2.0许可下,完全开源,鼓励社区驱动的开发。

文章图片
#语言模型#开源#人工智能
️ Vulnhuntr:利用大型语言模型(LLM)进行零样本漏洞发现的工具

Vulnhuntr 是世界上首款利用 LLMs 和静态代码分析来识别远程可利用漏洞的工具。它能够自动创建并分析整个代码调用链,从远程用户输入开始,到服务器输出结束,检测出复杂、多步骤、绕过安全防护的漏洞,这些漏洞的复杂性远远超出了传统静态代码分析工具的能力。

文章图片
#语言模型#人工智能#自然语言处理
    共 19 条
  • 1
  • 2
  • 请选择