logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习实战:Python基于K均值K-means进行聚类(九)

K均值(K-means)是一种基于距离度量的聚类算法,其主要思想是将数据集划分为k个不同的簇,每个簇代表一个相似度较高的数据组。该算法通过迭代优化来最小化所有数据点与其所属簇的欧氏距离之和,从而找到最佳的簇划分。需要区分一下,K-means和KNN是两种不同的机器学习算法,K-means和KNN都是基于距离度量的算法,但前者用于聚类问题,而后者用于分类问题K-means是一种聚类算法,它旨在将数据

文章图片
#聚类#机器学习#python
机器学习实战:Python基于K近邻KNN进行分类预测(四)

K近邻()是一种基本的分类与回归算法。其基本思想是将新的数据样本与已知类别的数据样本进行比较,根据K个最相似的已知样本的类别进行预测。具体来说,KNN算法通过计算待分类样本与已知样本之间的距离(欧式距离曼哈顿距离等),选取距离待分类样本最近的K个已知样本,再通过对这K个已知样本的类别进行投票、取平均等方式确定待分类样本的类别。KNN算法中,K的取值是一个重要的超参数,不同的取值可能会影响算法的性能

文章图片
#机器学习#python#分类
scRNA+bulk+MR:动脉粥样硬化五个GEO数据集+GWAS,工作量十分到位

CD69+CD103+组织驻留记忆T(TRM)细胞是炎症的重要驱动因素。为了解析它们在炎性关节炎中的作用,我们对银屑病性关节炎(PsA)或类风湿关节炎(RA)患者关节中的T细胞进行了单细胞、高维度分析。我们确定了三组滑膜CD8+CD69+CD103+ TRM细胞:细胞毒性和调节性T(Treg)-类TRM细胞存在于PsA和RA中,而具有促炎细胞因子特异性分泌(IL-17A+TNFα+IFNγ+)的C

文章图片
#数据挖掘#r语言
R语言:鉴于计算10亿以内训练模型记录for循环的加速

笔者主力机是MBAM1芯片(8+256),某个下午巩固循环突然思考到个问题,小循环很快就能run出来,中循环还勉勉强强,稍微上点强度就运行的很慢。虽然是CPU占用100%,8颗核心好像是偷着懒跑的,但是丢给我那台4核心8线程黑苹果,是跑满的,说明ARM在多线程的时候,有点东西下图是计算一个10亿内训练模型时的top。

文章图片
#人工智能#r语言
【Linux】jupyter简介,搭建和部署jupyter

Jupyter我们简称常指早出的Jupyter Notebook,用于创建Jupyter Notebook文档的基于Web的交互式计算环境。它支持多种语言,例如Python(IPython),Julia,R等,并且广泛用于数据分析,数据可视化以及进一步的交互式探索性计算。JupyterLab是最新的基于 Web 的笔记本、代码和数据交互式开发环境(例如HTML,Text,Markdowns等)作为

文章图片
#linux#jupyter#运维
生信自学路线|转录组bulkRNA-seq的处理与常见下机测序数据分析

本篇面向新入门的,转专业的,临床的,0基础的同学。学生信对于软件安装没问题了,环境搭建好了,开始了解一些数据挖掘的常见概念,以下是生信多组学数据挖掘四大金刚为首的,我们先讲哈,下一步才做!!还有很多未出现的名词,可以自行谷歌一下,或者看看,有经费的建议报班1对1还有售后那种。

文章图片
#数据分析#数据挖掘
NHANES数据挖掘|特征变量对死亡率预测的研究设计与分析

书接上回,应各位临床或在科室的小伙伴们需求,除了多组学和算法开发外,插播关于临床护理方向的数据挖掘,今天分享两篇的分析文献。

文章图片
#数据挖掘#人工智能
机器学习实战:Python基于NN神经网络进行分类(十一)

神经网络()机器学习是一种基于人工神经网络的机器学习方法,它模拟了人类神经系统的工作原理。神经网络是由多个人工神经元组成的网络结构,每个神经元都接收输入信号、进行计算并生成输出信号。首先了解一下神经元和层神经元Neuron是神经网络的基本单元,模拟了生物神经系统中的神经元的功能。每个神经元接收来自其他神经元的输入信号,并通过计算生成输出信号。神经元具有权重weights和偏置bias,它们用于调节

文章图片
#机器学习#python#神经网络
生信自学路线|转录组bulkRNA-seq的处理与常见下机测序数据分析

本篇面向新入门的,转专业的,临床的,0基础的同学。学生信对于软件安装没问题了,环境搭建好了,开始了解一些数据挖掘的常见概念,以下是生信多组学数据挖掘四大金刚为首的,我们先讲哈,下一步才做!!还有很多未出现的名词,可以自行谷歌一下,或者看看,有经费的建议报班1对1还有售后那种。

文章图片
#数据分析#数据挖掘
二区5分纯生信|单细胞+非负矩阵+AlphaFold+机器学习组合

背景: 增生性糖尿病视网膜病变(PDR)是失明的主要原因,其发病机制复杂。本研究整合单细胞 RNA 测序(scRNA-seq)、非负矩阵分解(NMF)、机器学习和 AlphaFold 2 方法,探索 PDR 的分子水平。方法: 我们分析了 PDR 患者和健康对照者的 scRNA-seq 数据,以确定不同的细胞亚型和基因表达模式。NMF 用于定义 PDR 中的特定转录程序。利用 Meta-Progr

文章图片
#机器学习#r语言#数据挖掘
    共 61 条
  • 1
  • 2
  • 3
  • 7
  • 请选择