logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据挖掘之数据预处理

数据预处理是数据挖掘中的一个关键步骤,它的主要目的是对原始数据进行清洗、转换和格式化,以确保其质量和一致性,从而为后续的数据挖掘任务(如分类、回归、聚类等)提供可靠的数据基础。

文章图片
#数据挖掘#大数据#人工智能
【生物信息】如何使用 h5py 读取 HDF5 格式文件中的数据并将其转换为 NumPy 数组

这段代码展示了如何使用 h5py读取 HDF5 格式文件中的数据并将其转换为 NumPy 数组。

文章图片
#numpy#python#机器学习
【每天一个知识点】云计算算力单位

云计算计费单位解析 云计算服务采用多样化的计费单位:1)通用计算以vCPU-hour和内存(GiB/GB)为主,Kubernetes使用millicores配额;2)加速器按GPU/TPU核心时长计费,算力单位含FLOPS/TOPS;3)Serverless服务采用GB-second等内存时长组合;4)大数据服务多定义专属单位(如slot-hour、DBU-hour);5)网络存储关注带宽/IOP

文章图片
#人工智能#云计算#算力
【生物信息学】PyTorch 环境下的基因富集分析

在 PyTorch 中实现基因富集分析,不仅可以复用深度学习的强大功能,还能增强传统分析方法的灵活性和扩展性。降维高维组学数据;预测新的功能注释关系;提高富集分析的鲁棒性。PyTorch 环境为基因富集分析提供了更多的可能性,有助于深入挖掘基因组数据背后的生物学意义。

文章图片
#pytorch#人工智能#python +1
机器学习之交叉熵

交叉熵(Cross-Entropy)是机器学习中用于衡量预测分布与真实分布之间差异的一种损失函数,特别是在分类任务中非常常见。: 对于二分类任务,真实标签 y∈{0,1},模型预测 \hat{y} \in [0, 1]。交叉熵是分类任务中的核心损失函数之一,其优异的性质和强大的优化能力使其在机器学习的各个领域得到了广泛应用。其中 y_k 表示第 k 类的真实标签,\hat{y}_k 表示模型对第

文章图片
#人工智能#机器学习#算法
【深度学习】Graph Transformer Networks(GTN,图变换网络)

GraphTransformerNetworks(GTN)是一种用于异构图的深度学习模型,能自动学习元路径组合而非依赖人工设计。其核心是通过可学习的图变换操作,将原始多关系图组合成新邻接矩阵,再执行图卷积,适用于节点分类等任务。相比GCN/GAT,GTN支持异构图且自动构造路径,但计算成本较高。典型应用包括知识图谱和推荐系统。

文章图片
#深度学习#transformer#网络
【生物信息】h5py.File

h5py.File是 Python 中库提供的一个函数,用于读取和写入格式的文件。HDF5 是一种强大的数据格式,可以高效存储和管理复杂结构和大规模数据。

文章图片
#python#机器学习#数据挖掘
【机器学习】迁移学习(Transfer Learning)

迁移学习(Transfer Learning)作为一种机器学习方法,主要通过将源域中学到的知识迁移到目标域,解决目标域中数据不足或标注困难的问题,尤其在无监督学习如聚类任务中具有显著优势。迁移学习的关键思想包括领域适应、知识共享和避免负迁移。它通过不同方式将源域的学习成果迁移至目标域,从而提高目标域学习效果。

文章图片
#机器学习#人工智能#数据挖掘 +3
【数据挖掘】深度变分高斯过程

深度变分高斯过程结合了的层次非线性建模能力和的高效近似推断方法,是一种高效处理高维数据、复杂关系和多层非线性建模的强大工具。

文章图片
#数据挖掘#python#人工智能 +1
【机器学习】核方法

核方法通过引入核函数,使得机器学习算法能够有效地处理非线性问题,并且在许多实际应用中表现出优异的性能。通过核方法,机器学习算法可以在高维空间中实现更好的数据表示和模式识别,适用于分类、回归、降维等任务。然而,核方法也存在一定的计算复杂度和参数选择的挑战,因此在应用时需要综合考虑模型的复杂性和计算资源的限制。

文章图片
#机器学习#人工智能#python
    共 180 条
  • 1
  • 2
  • 3
  • 18
  • 请选择