旧事手札
  • 首页
  • 归档
  • 分类
  • 标签
  • 关于

BLAST序列对比

源自豆包AI BLAST(Basic Local Alignment Search Tool)是生物学领域超实用的 “序列比对神器”,能快速找出核酸或蛋白质序列之间的相似性。 一、BLAST 的核心作用:像 “文字查重” 一样比对序列假设你有一段基因序列(比如 ATCGGTAC…),想知道它和已知的基因有啥关系: BLAST 就像拿这段序列去 “图书馆” 查资料:这个 “图书馆” 里存着全世
2025-07-02
Bioinformatics
#Bioinformatics #BLAST

EST序列

EST(Expressed Sequence Tag,表达序列标签)是基因研究中一个很实用的概念,下面用通俗的方式来解释它: EST 是什么?—— 基因的 “快递单号”如果把人体所有基因比作一个巨大的 “图书馆”,每个基因就是一本书。EST 就像这本书的 “快递单号” 或 “简短摘要”—— 它是从基因转录成的mRNA(信使 RNA) 上提取的一小段序列(通常长度为 200-500 个碱基)。
2025-07-02
Bioinformatics
#Bioinformatics

MAF质控和多重检验校正的对比

维度 MAF 质控 多重检验校正(必须步骤) 目标 过滤低频变异,提升数据质量(非变异或偶然变异不能作为参考目标的基因) 控制全基因组检验的假阳性率(排除不是目标性状的基因) 处理对象 变异(SNP)本身的频率特征 关联分析后的 p 值分布 阶段 关联分析前的预处理 关联分析后的结果处理 方法示例 设置 MAF>0.01 阈值排除低频变异 Bonferroni(p×N
2025-07-02
Bioinformatics
#Bioinformatics #GWAS #Plink

NCBI解读原核与真核基因一级核酸

本次我们将以NCBI的GenBank为例,分别通过浏览一个原核基因和一个真核基因,教给大家如何解读一级核酸数据库。 网站:https://www.ncbi.nlm.nih.gov/ 1 原核细胞基因我们首先浏览编码大肠杆菌(原核生物)dUTPase的基因。他在GenBank里的数据库编号是X01714。 1、从NCBI的主页选择GenBank数据库,这个Nucleotid
2025-07-02
Bioinformatics
#Bioinformatics #NCBI

RefSeq与其注释

如下图所示(第二张图是第一张的内容展开): 一、核心区别:概念的侧重点不同 维度 RefSeqs of Annotated Genomes RefSeqs maintained independently of Annotated Genomes 定义核心 所属关系:RefSeq 序列是 “注释基因组” 的组成部分,即经过注释的基因组中所使用的参考序列。 维护逻辑:RefSeq
2025-07-02
Bioinformatics
#Bioinformatics #NCBI

UCSC和Ensembl的异同

总结:如何选择? 选 UCSC:若需要直观的基因组可视化、整合多源数据展示,或使用历史版本数据(如 hg19)。 选 Ensembl:若需要系统的基因注释、变异功能分析,或通过编程接口批量处理数据。 实际研究中,两者常结合使用:例如用 UCSC 可视化基因组结构,用 Ensembl 的 VEP 分析变异影响,或通过 BioMart 获取跨物种注释数据。 一、相同点 核心目标均致力于存储、整
2025-07-02
Bioinformatics
#Bioinformatics

vim教程

一、先掌握「三大模式」:Vim 的灵魂!1.命令模式(默认启动进入) 作用:像「指挥官」,输入命令控制 Vim(不能直接打字)。 怎么进入:打开 Vim 就自动在这模式,按ESC键也会回到这模式(新手记不住就多按几次 ESC)。 2.插入模式(打字模式) 作用:像「打字机」,可以输入文字。 怎么进入:在命令模式按以下键: i:在当前位置插入(最常用) a:在光标后面追加 o:在当前行下方新开一行
2025-07-02
linux
#linux

四种 BLAST 工具

内容源自豆包AI 四种 BLAST 工具对比表格 工具名称 核心功能 工作方式 适用场景 举例 PSI-BLAST 找远亲蛋白质序列 1. 先做一次普通 BLAST,找出一批相似序列; 2. 把这些序列的共性整理成 “特征档案”(Profile); 3. 用 “特征档案” 再次搜索数据库,找到更多相似但更远缘的序列; 4. 重复步骤 2-3,直到找不到新序列为止。 发现新蛋白家族或研
2025-07-02
Bioinformatics
#Bioinformatics #BLAST

如何运行plink软件

软件配置首先是下载软件:https://www.cog-genomics.org/plink/1.9/ 下载到本地,解压即可。 比如windows系统,解压下如下: 第一种方法:直接调用很多人都是先在windows键找到cmd,然后再进入相关文件夹,其实有个简单的方法:直接在文件夹路径中输入cmd回车: 上面黑黑的框,就是cmd的终端,在里面运行plink软件。 如果输入plink.exe
2025-07-02
Bioinformatics
#Bioinformatics #GWAS #Plink

生信数据格式

生物信息学中常用的数据格式主要用于存储、处理和传输基因组、蛋白质等生物分子数据,以下是对它们的通俗描述: 一、核酸序列相关格式FASTA 格式 用途:存储核酸(DNA/RNA)或蛋白质的序列信息。 特点: 以>开头作为序列标识(后面跟名称和注释),例如:>human_gene1 接下来的每行是序列字符(A、T、C、G 等),可换行但无其他符号。 例子: plaintex
2025-07-02
Bioinformatics
#Bioinformatics
123456

搜索

Hexo Fluid
皖ICP备2021018016号-3