--logistic和--adjust
1. 对比
参数 | –logistic | –adjust |
---|---|---|
用途 | 运行逻辑回归模型,分析 SNP 与二分类性状的关联(排除环境等技术因素) | 校正多重检验导致的假阳性问题 |
统计方法 | 逻辑回归(Logistic Regression) | 多重检验校正(如 Bonferroni、FDR) |
解决的问题 | 处理混杂因素、基因 - 环境交互等复杂关系 | 控制全基因组范围内的假阳性率 |
输出结果 | 回归系数(β)、OR 值、p 值 | 校正后的 p 值(如 Bonferroni p、FDR q) |
2. 为什么需要同时使用?
案例:研究吸烟与肺癌的关系
逻辑回归(–logistic)的必要性:
- 肺癌风险可能受年龄、性别、家族史等因素干扰,需在校正这些混杂变量后分析 SNP 与肺癌的真实关联。
多重检验校正(–adjust)的必要性:
若研究 100 万 SNP,即使无真实关联,按 α=0.05 标准也会有约 5 万假阳性。
–adjust通过 Bonferroni 或 FDR 等方法,将阈值严格化(如降至 5×10⁻⁸),减少假阳性。
3. 选择策略总结
是否需要–logistic?
若研究设计简单(无混杂因素),可用–assoc(卡方检验)。
若需校正协变量(如年龄、性别)或分析基因 - 环境交互,必须用–logistic。
是否需要–adjust?
- 只要涉及多 SNP 检验(如 GWAS),必须用–adjust校正多重检验,否则假阳性泛滥。
总结:建议两个同时使用
--logistic和--adjust
https://oldstory.cn/2025/07/02/logistic_he_adjust/