数据派THU 个人主页

@tMb8Z9Vdm66wH68VX1

数据派THU

2022-07-08 17:31:35 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

主动学习（Active Learning）概述、策略和不确定性度量

来源：DeepHub IMBA本文约2400字，建议阅读9分钟主动学习是解决标注数据问题的一个方向，并且是一个非常好的方向。主动学习是指对需要标记的数据进行优先排序的过程，这样可以确定哪些数据对训练监督模型产生最大的影响。主动学习是一种学习算法可以交互式查询用户(teacher 或 oracle)，用真实标签标注新数据点的策略。主动学习的过程也被称为优化实验设计。主动...

#算法 #大数据 #python +2

基于声音信号的工业设备异常检测

来源：DeepHub IMBA本文约1400字，建议阅读5分钟本文将介绍基于声音信号的工业机械异常检测。异常检测主要目标是将异常事件与正常事件区分开来，因此才有了“异常”一词。本文将介绍基于声音信号的工业机械异常检测，使用的数据集是MIMII声音数据集，该数据集很容易在网上获得。异常检测的任务可以通过多种方式实现。其中最简单的一种方法是将问题作为监督学习任务，并对正常和异常声音训练分类器。这种..

R语言中的Theil-Sen回归分析

来源：拓端数据部落本文约1000字，建议阅读5分钟Theil-Sen估计器是一种在社会科学中不常用的简单线性回归估计器。在数据中所有点之间绘制一条线计算每条线的斜率中位数斜率是回归斜率用这种方法计算斜率非常可靠。当误差呈正态分布且没有异常值时，斜率与OLS非常相似。相关视频有几种获取截距的方法。如果关心回归中的截距，那么知道软件在做什么是很合理的。当我对异常值和异方差性有担忧时，请在上方针对Th.

#r语言 #回归 #开发语言 +2

从零复现Google Veo 3：从数据预处理到视频生成的完整Python代码实现指南（上）

Veo 3 的训练数据预处理，包括标注环节，均多次迭代进行，其中标注任务主要由 Gemini 模型完成。尽管在先前步骤中尝试使用开源模型以控制成本，但高质量的视频内容标注通常需要依赖具备强大视频理解能力的模型，如 Google 的 Gemini 系列。虽然存在大量公开的 Hugging Face 数据集，但考虑到本项目旨在学习和演示，我们将主要从 Pexels 等免费资源平台随机抓取视频，并存储于

#python #开发语言

原创 | 从席卷全球的“刷脸”乱象，看国内人脸识别立法方向

一、种族运动迫使美国弃用人脸识别近两年来，人脸识别技术引发的数据隐私问题一直备受公众讨伐。仅就2019年而言，全球范围内人脸识别技术使用相关的案件便层出不穷：瑞典数据保护机构（DPA）...

#人脸识别 #人工智能 #iot

时间序列异常检测：MSET-SPRT组合方法的原理和Python代码实现

MSET-SPRT是一种结合机器学习状态估计与统计假设检验的混合技术框架，通过其高精度和稳健性，被广泛应用于关键任务系统的监控与分析。分析结果表明，MSET-SPRT方法能够有效区分正常系统波动与异常行为，提供了一种可靠的多元时间序列异常检测方案。MSET-SPRT框架通过上述两种技术的协同作用，为多元数据异常检测提供了准确且高效的解决方案，特别适用于高维度、高相关性的时间序列数据分析。在异常检测

#python #开发语言

7个回归分析方法！建议收藏！

来源：爱数据LoveData本文约3900字，建议阅读7分钟本文为你介绍什么是回归分析并为你分享回归分析的七个方法。1、什么是回归分析？回归分析是一种预测性的建模技术，它研究的是因变量（目标）和自变量（预测器）之间的关系。这种技术通常用于预测分析、时间序列模型以及发现变量之间的因果关系。例如，司机的鲁莽驾驶与道路交通事故数量之间的关系，最好的研究方法就是回归。回归分析是建模和分析数据的重要工具。.

#回归 #数据挖掘 #人工智能 +2

【清华大学龙明盛副教授】迁移学习理论与算法

来源：专知本文多图，建议阅读5分钟本文重点介绍间隔泛化理论及其对抗学习算法。报告人简介：龙明盛，清华大学软件学院副教授，博士生导师，大数据系统软件国家工程实验室机器学习组组长。2008和...

#算法 #人工智能 #机器学习 +2

原创 | R的基础及进阶数据可视化功能包介绍

R 作为入门级编程语言，被经常运用在数据整理、数据可视化、以及机器学习中。本篇文章将主要介绍在R中如何可视化数据 (基础+进阶)。R绘图的原理使用R绘图，我们需要在脑海中明确几个必要元素。...

#python #数据可视化 #javascript +1

CVPR 2023 | 谷歌、MIT提出统一框架MAGE：表征学习超MAE，无监督图像生成超越 Latent Diffusion...

来源：机器之心本文约1400字，建议阅读5分钟在一篇 CVPR 2023 论文中，来自 MIT 和谷歌的研究人员提出了一种全新的框架MAGE，同时在图像识别和生成两大任务上实现了 SOTA。识别和生成是人工智能领域中的两大核心任务，如果能将二者合并到一个统一的系统中，这两个任务应该能实现互补。事实上，在自然语言处理中，像 BERT [1] 这样的模型不仅能够生成高质量的文本，还能够提取文本中的特.

共 1028 条

请选择