GWAS解决时间批次效应 1. 识别批次效应 通过主成分分析(PCA)识别批次效应 原理:将高维基因型数据降维到低维空间(如前 2-3 个主成分),若样本在散点图中按批次聚集(同一批次样本紧密聚类,不同批次明显分离),则提示存在批次效应。 方法:基于基因型数据进行 PCA(用 PLINK 的--pca),提取前 10-20 个主成分(PCs); 分析:通过散点图(PC1 vs PC2)观察不同时间段的样本是否在主成分上 2025-08-13 Bioinformatics #Bioinformatics #GWAS
Gemma使用 GEMMA 是一款专门用于 GWAS 的高效软件,尤其擅长处理线性混合模型(LMM)。以下详细介绍如何在 GEMMA 中使用 LM、LMM、GLM 和 MLM 模型: 1. 数据准备(GEMMA 格式)1.1 基因型数据 将 PLINK 格式(.bed/.bim/.fam)转换为 GEMMA 支持的二进制格式: 1gemma -bfile your_data -gk 1 2025-08-13 Bioinformatics #Bioinformatics #GWAS #Gemma
连锁不平衡LD和遗传图谱中的连锁分析的区别和联系 连锁不平衡(LD) 概念:一条染色体上不同位置的等位基因由于物理位置、自然选择、群体混合等因素,多个位置的等位基因在染色体自由组合后,形成的基因频率明显比随机情况下组合的频率更大的现象。 下面介绍了造成连锁不平衡(LD)的几个主要原因: 物理连锁(紧密的物理位置): 这是最主要的原因。 当两个位点在染色体上靠得非常近时,它们之间发生重组交换(在减数分裂过程中)的概率就很低。 因此,如果祖先 2025-08-13 Bioinformatics #Bioinformatics #GWAS #LD
LD衰减图 LD衰减图就是利用曲线图来呈现基因组上分子标记间的平均LD系数随着标记间距离增加而降低的过程。 LD系数 不同基因座间的相关性,用一个数值来衡量就是D值。类似相关系数是标准化后的协方差,LD系数(r^2)则是标准化后的D值(图2中有计算公式),这个数值在0~1波动。r^2=0就是两个位点完全不相关,群体中单倍型分布是随机的(观测值=期望值)。r^2=1就是两个位点 2025-08-13 Bioinformatics #Bioinformatics #GWAS #LD
GCTA中遗传力的理解 一、GCTA遗传力结果解读(.hsq文件)核心关注指标 指标 含义 解读要点 h2 SNP遗传力估计值(h²_SNP) 核心结果:• 值范围 [0,1](如 0.25=25%)• 越高表示当前SNP解释的遗传力越强(常见于身高、生育性状等) SE h2的标准误 精度评估:• SE越小越可靠(如 0.25±0.03)• 95%置信区间 ≈ h2 ± 1.96×SE(区间宽 2025-08-13 Bioinformatics #Bioinformatics #GCTA
生信文件数据格式转化 在GWAS分析中,使用PLINK将文本格式文件(.ped和.map)转换为二进制文件(.bed/.bim/.fam)可显著提高处理效率并减少存储空间。以下是详细步骤: 转换步骤: 准备文件:确保你有一对PLINK文本格式文件: .ped文件:包含样本信息和基因型数据(空格分隔) .map文件:包含SNP的染色体和位置信息 执行转换命令: bash 1plink --fil 2025-08-13 Bioinformatics #Bioinformatics #GWAS
--assoc 和 --logistic 对比 一、核心功能对比表 维度 –assoc –logistic 统计方法 卡方检验 / Fisher 精确检验 逻辑回归(Logistic Regression) 适用场景 简单病例对照(无协变量) 需校正协变量(年龄、性别等) 协变量支持 ❌ 不支持 ✅ 支持(–covar参数) 基因 - 环境交互 ❌ 不支持 ✅ 支持(–interaction参数) 输出结果 2025-07-02 Bioinformatics #Bioinformatics #GWAS #Plink
--logistic和--adjust 1. 对比 参数 –logistic –adjust 用途 运行逻辑回归模型,分析 SNP 与二分类性状的关联(排除环境等技术因素) 校正多重检验导致的假阳性问题 统计方法 逻辑回归(Logistic Regression) 多重检验校正(如 Bonferroni、FDR) 解决的问题 处理混杂因素、基因 - 环境交互等复杂关系 控制全基因组范围内的假阳性率 输出结果 回归系 2025-07-02 Bioinformatics #Bioinformatics #GWAS #Plink
4个Python字典的循环遍历 一、遍历字典的key 借助keys()函数的调用 代码体验: 123dict1 = {'name': 'Rose', 'age': 30, 'sex': '女'}for key in dict1.keys(): print(key) 返回结果: 2025-07-02 python #python
BLAST+使用 本文主要介绍在Linux环境下blast+的安装以及使用 1. 安装 进入这个网址https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ 选择合适的Linux版本,然后复制链接 在Linux中拉取安装包 1wget https://ftp.ncbi.nlm.nih.gov/blast/executables/blast 2025-07-02 Bioinformatics #Bioinformatics #BLAST