logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Illumina Fastq Q-score

Illumina Nextseq500 Miseq HiseqXten 测序仪 Q-score均采用下面的编码格式,仅作简要介绍。Q-scoreQ-score 在fastq中每个序列的第4行,代表测序错误的概率。Quality Score Q(X)##Error Probability P(~X)Q40##

#python
【UCSC Genome Browser】比老东家还出名的基因组数据库

UCSC基因组浏览器,比老东家还出名的数据库对于生命科学从业者来讲,UCSC基因组浏览器可能并不陌生,这可是基因组的大百科全书,但是UCSC是什么呢…好像是加州大学。。什么。。什么。。分校。好吧,我们一起百度下 UCSC最先搜索出来的是UCSC Genome Browser,其次才是他的老东家 加州大学圣克什么。。分校(当然,这不重要…)果然是一款比老东家还要出名的基因组数据库。因为平时工作中经常

#big data#数据库
标准差(Standard Deviation) 和 标准误差(Standard Error)

本文摘自Streiner DL.Maintaining standards: differences between the standard deviation and standarderror, and when to use each. Can J Psychiatry 1996; 41: 498–502.http://www.07net01.com/program/306401.html

ggplot2-分面(facet) 一页多图

ggplot2的数据分面就是根据数据中的不同分组,绘制多个图形.

文章图片
一代、二代、三代测序技术原理与比较

从1977年第一代DNA测序技术(Sanger法)1,发展至今三十多年时间,测序技术已取得了相当大的发展,从第一代到第三代乃至第四代,测序读长从长到短,再从短到长。虽然就当前形势看来第二代短读长测序技术在全球测序市场上仍然占有着绝对的优势位置,但第三和第四代测序技术也已在这一两年的时间中快速发展着。测序技术的每一次变革,也都对基因组研究,疾病医疗研究,药物研发,育种等领域产生巨大的推动作用。在这里

【一起学生信】群体结构图形—structure堆叠图

1、structure图的由来图1 假设群体亚群数等于3(k=3)的情况下的structure分析结果“Structure图”名词本身来自这种图形的分析软件——STRUCTURE。这个软件是由斯坦福大学Pritchard实验室开发的一款群体结构分析软件,最早在2000年发表在《Genetics》上[1]。图2 structure惊人的引用次数Structure软件分析达到的目的...

【一起学生信】根据目标区域提取bam信息

测序完成得到的reads我们会比对到参考基因组得到bam文件,bam文件一般很大,很多时候我们只需要提取部分内容。根据参考基因组位置提取根据指定基因组区域的提取bam,可以使用以下命令。samtoolssamtools view -hb chr:start-endwgs.sort.bam > target.region.bam# 根据bed文件来提取samtools vie...

ggplot2-条形图和折线图

http://blog.csdn.net/tanzuozhev/article/details/50822204本文在 http://www.cookbook-r.com/Graphs/Bar_and_line_graphs_(ggplot2) 的基础上加入了自己的

【机器学习】分类性能度量指标 : ROC曲线、AUC值、正确率、召回率、敏感度、特异度

本文转自 http://zhwhong.ml/2017/04/14/ROC-AUC-Precision-Recall-analysis/在分类任务中,人们总是喜欢基于错误率来衡量分类器任务的成功程度。错误率指的是在所有测试样例中错分的样例比例。实际上,这样的度量错误掩盖了样例如何被分错的事实。在机器学习中,有一个普遍适用的称为混淆矩阵(confusion matrix)的工具,它可以帮助人们更

#机器学习
R语言-绘制ROC曲线

浅谈ROC曲线机器学习中很常见的一个大类就是二元分类器。很多二元分类器会产生一个概率预测值,而非仅仅是0-1预测值。我们可以使用某个临界点(例如0.5),以划分哪些预测为1,哪些预测为0。得到二元预测值后,可以构建一个混淆矩阵来评价二元分类器的预测效果。所有的训练数据都会落入这个矩阵中,而对角线上的数字代表了预测正确的数目,即True Positive+True Nagetive。同时可以相应算出

    共 14 条
  • 1
  • 2
  • 请选择