
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
细胞类型注释是单细胞RNA测序(scRNA-seq)数据分析中的关键步骤。目前注释方法的金标准依赖于人工专家,需要手动将每个细胞簇中高表达的基因与文献中的经典细胞类型标记基因进行比对。尽管如此,这一流程及其耗时,而且需要专业的生物知识。随着测序成本的下降,当数据集规模扩大到数百万个来自不同组织的细胞,手动注释的方法已变得难以实现。

探究复杂性状之间的因果关系并确定疾病的因果风险因素,对于揭示各种疾病的病因学至关重要。孟德尔随机化 (Mendelian Randomization, MR) 是一种利用遗传变异作为工具变量(IVs)推断暴露因素(如血脂)与结局(如心血管疾病)间因果关系的统计方法。MR 本质的目标是去判断暴露是否会影响结局,这与一些队列观察性研究的目标是一致的(探索血脂是否会影响心血管疾病)。其核心假设是工具变量

以6个数据集约10万细胞的人胚scRNA-seq为对象,作者把Carnegie阶段的文本描述变成查询,计算每日龄的平均分数,得到与受精后时间吻合的阶段性轨迹;②对圈选细胞可直接在聊天框请求“描述这些细胞”,系统基于选区的平均嵌入生成包含细胞类型、组织/发育信息与代表基因的文本报告;简单来讲,CellWhisperer 通过把转录组信号和自然语言文本放到同一个嵌入空间,再配一个能看得懂嵌入的聊天模型

调用硅基流动deepseekapi

GeneGPT的核心思想是通过大语言模型(如GPT-3.5)对基因信息进行嵌入,从而生成能够反映基因功能和细胞特征的嵌入向量(其他方法则是需要使用大规模的单细胞数据进行预训练,GeneGPT 属于是触类旁通、借花献佛了)。这些基因嵌入向量能够帮助我们在单细胞转录组学研究中更好地表示基因和细胞的生物学信息,被进一步用于细胞级别的嵌入表示。具体来说,基因嵌入通过提取NCBI基因数据库中的文本摘要,并利

TCGA 数据库基因表达数据的下载:最大的公开肿瘤数据库,可用于各种深度学习项目

生信碱移Recall 通过人工生成随机的噪声假基因判断细胞聚类簇是否拆得过细,如果过细就自动往回合并或者调整分辨率,从而得到优化的聚类。单细胞 RNA 测序(scRNA-seq)能够分析包含数千至数百万个单细胞转录组图谱的数据集。主流分析流程 seurat 与 scanpy 一般包括以下三个大步骤:预处理(质控、归一化、选 HVGs、PCA)无监督聚类(在 PCA 空间构建的邻接图上 执行Louv

该研究通过搭建单细胞整合评估平台(scIB),在13个整合任务(含2个模拟任务、5个 scRNA-seq 任务和6个 scATAC-seq 任务)上。为检验方法的准确性、可用性和可扩展性,研究设计了14个性能指标从批次效应移除与生物学变异保持两大维度进行量化评估;同时,考虑了多种输出格式(嵌入、矫正矩阵、集成图等)及不同的预处理策略(含/不含缩放与高变基因筛选)。

生信碱移TCMNP 包,一路打通网络药理学数据库与可视化分析。最近,小编冲浪的时候看到一个今年发表的网络药理学 R 包 TCMNP,据说整合了多个数据库以及多种可视化分析函数,一眼看下来确实够顶。具体来说,TCMNP 整合了几大类型的数据库:① 三大药物成分及靶点数据库TCMSP、DrugBank、ETCM;② 疾病基因数据库 DisGeNET 与 OMIM;③ 转录因子及其对应靶基因数据库 TR

生信碱移locuszoomr可视化GWAS结果locuszoomr 是由伦敦玛丽王后大学的研究者开发的R包,允许用户生成出版级别的基因组位点注释图,这可以用于可视化并解读 GWAS 分析结果。由 locuszoomr 生成的基因位点注释图通过 R 基础图形或 ggplot2 生成,简易使用的同时又附加了大量个性化参数设置。本文将介绍locuszoomr的使用方法,大家也可以根据官方文档探索更多的个








