logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

单细胞转录组 —— kb-python 原始数据处理

是一种用于预处理scRNA-seq数据的工作流程。readsUMIreadsreads使用有以下几点优势RNAsnRNA-seq10xinDropsDropseqCITE-seqREAP-seqMULTI-seqClicktagsQC。

文章图片
#python#windows#开发语言
TCGA 数据分析实战 —— GSVA、ssGSEA 和单基因富集分析

前面,我们介绍过了差异基因的功能富集分析,今天,我们对这部分的内容作一些补充主要介绍一下GEVAssGSEA和单基因的富集分析。

文章图片
#数据分析#算法#机器学习
R 数据可视化 —— 聚类热图 ComplexHeatmap(一)

使用pheatmap已经能够绘制满足大多数要求的聚类热图了。受pheatmap包的启发,提供了对热图更多更灵活的控制,如多数据热图的排列比较以及多种图形注释等。下面我们详细介绍包热图主体默认是由不同颜色填充的矩形框组成,我们姑且称之为单元格。我们可以使用cell_fun和layer_fun参数来自定义主体的图形样式cell_fun用于绘制每个单元格,layer_fun是其矢量化的版本,cell_f

文章图片
#r语言#聚类
R 数据可视化 —— 相关系数图

前面,我们介绍了如何使用ggplot2来绘制相关系数图,这节,我们将介绍用corrplot包绘制相关系数图corrplot主要用于图形化展示相关系数矩阵、置信区间,同时还包含一些矩阵排序算法。同时能够以简单的方式,选择颜色、文本标签和布局等安装导入if (!

文章图片
#r语言#信息可视化#开发语言
R 数据可视化 —— 聚类热图 pheatmap

在前面的章节中,我们介绍了如何使用ggplot2绘制热图ggplot2绘制热图的方式很多,如geom_tile等但通常仅仅绘制热图是不够的,还需要对数据进行聚类,即绘制聚类热图。例如,最常用的就是将差异基因的表达值绘制聚类热图,来查看基因在不同样本中的表达差异情况,或者比较不同聚类分组之间的差异。绘制聚类热图的包有很多,我们主要介绍pheatmap和。

文章图片
#r语言#信息可视化#聚类
R 数据可视化 —— ggplot2 分面

分面的作用是在一个页面上自动放置多幅图像,它先将数据划分为多个不同的子集,然后分别将每个子数据集绘制到页面的小图形面板中。ggplot2有两种分面类型:网格型 ——facet_grid生成一个2维面板网格,通过行列对应变量的不同level封装型 ——facet_wrap生成一个1维面板,然后按行或按列顺序添加子图进去,形成2维布局二者之间的区别,可以从下图中看出。

文章图片
#信息可视化#r语言#开发语言
R 数据可视化 —— ggplot 柱状图/条形图

ggplot2geom_bar()和geom_col()geom_bar()使条形的高度与每个组中的观察值的数目成正比,或者如果设置了weight参数,则为分组内指定的所有权重变量值之和如果你想直接使用条形图的高度来表示数据中的值,可以使用geom_col()geom_bar()默认使用的统计变换方法是count,而geom_col() 使用identity不做变换。

文章图片
#信息可视化#r语言#开发语言
R 数据可视化 —— ggplot 直方图与密度图

密度图是直方图的平滑版本,用于计算并绘制数据的核密度估计,能够更好的界定分布的形状。绘制堆积密度图,可能通常并不是想要看密度的堆积形式,而可能更想要看的是数量的堆积形式。适用于比较分类变量的不同水平之间的分布差异。直方图是将单个变量分隔成若干个区间,并对区间内的观测值进行计数。参数的值,所以只要设置其中一个参数就可以了。或者绘制密度曲线,来比较不同水平的分布情况。类似于直方图,我们也可以绘制镜像密

文章图片
#信息可视化#r语言#开发语言
R 数据可视化 —— ggplot 图例设置

坐标轴和图例被统称为 guides,通常使用标度函数来控制,如 limits, breaks 和 labels 参数。坐标轴与图例很类似,例如,坐标轴的轴标签与图例的标题都是对应到标度函数的 name 参数,而图例的标识(key label)和轴的刻度标签对应于标度函数的 break 参数除了可以在每个标度函数中分开设置,也可以使用 guides() 函数来进行统一设置,两种设置方式是等价的。例如

文章图片
#r语言#信息可视化#开发语言
到底了