
详细介绍:
ConsensusPathDB
综合通路数据库详细介绍及使用攻略
集成分子相互作用网络的权威数据库 - 为生物信息学研究提供强大的分子网络分析工具
数据库概述
权威背景
核心使命
整合来自多个公共数据库的分子功能相互作用信息,为研究人员提供一个统一、全面的分子网络分析平台。
支持基因富集分析、通路分析、蛋白质相互作用网络构建等多种生物信息学分析需求。
数据库功能概览

ConsensusPathDB网页界面主要功能图形化概览
32+
集成数据源
百万级
相互作用数据
多物种
人类/小鼠/酵母
多功能
分析工具集
核心功能特色
相互作用查询
- 蛋白质-蛋白质相互作用
- 基因调控网络
- 代谢通路网络
- 信号传导网络
- 药物-靶点相互作用
富集分析
- 基因集过表达分析
- GO功能富集
- KEGG通路富集
- Reactome通路分析
- 自定义基因集分析
网络可视化
- 交互式网络图
- Cytoscape集成
- 模块化网络分析
- 重叠图表示
- 自定义网络布局
数据库内容与功能架构

ConsensusPathDB数据库内容与网页界面功能架构图
数据类型与覆盖范围
集成数据源
通路数据库
- • KEGG
- • Reactome
- • BioCarta
- • WikiPathways
- • SMPDB
相互作用数据库
- • STRING
- • BioGRID
- • IntAct
- • MINT
- • DIP
基因本体
- • Gene Ontology
- • OMIM
- • MGI
- • SGD
药物数据库
- • DrugBank
- • PharmGKB
- • STITCH
- • CTD
支持物种
人类 (Homo sapiens)
最完整的数据覆盖,包含所有类型的分子相互作用
小鼠 (Mus musculus)
模式生物数据,支持比较基因组学研究
酵母 (Saccharomyces cerevisiae)
经典模式生物,基础生物学研究的重要资源
相互作用类型
蛋白质相互作用
- • 二元相互作用(Binary interactions)
- • 复合物相互作用(Complex interactions)
- • 酶-底物关系
- • 结合伙伴关系
基因调控
- • 转录因子-靶基因关系
- • miRNA调控关系
- • 表观遗传调控
- • 遗传相互作用
代谢网络
- • 酶催化反应
- • 代谢物转化
- • 代谢通路连接
- • 辅因子依赖性
信号传导
- • 激酶-底物关系
- • 磷酸化级联
- • 信号通路串扰
- • 细胞表面受体信号
网络图示例

ConsensusPathDB分子相互作用网络图示例
分析工具详解
基因集富集分析 (Gene Set Analysis)
分析类型
过表达分析 (Over-representation)
基于超几何分布检验,识别在基因列表中显著富集的功能类别
GSEA分析
基于基因排序列表的基因集富集分析,无需预设阈值
网络邻域分析
基于蛋白质相互作用网络的邻域富集分析
功能注释数据库
相互作用网络查询
单基因查询
- • 输入基因名或ID
- • 获取所有相互作用伙伴
- • 查看相互作用类型
- • 下载网络数据
基因列表查询
- • 批量基因输入
- • 构建子网络
- • 识别网络模块
- • 计算网络属性
网络可视化
- • 交互式网络图
- • 节点大小和颜色自定义
- • 边类型区分显示
- • 导出高质量图片
高级分析功能
代谢物分析
支持代谢物列表的通路富集分析,连接代谢组学和基因组学数据
- • KEGG代谢通路分析
- • SMPDB代谢网络
- • 代谢物-基因关联
药物靶点分析
整合药物-靶点相互作用数据,支持药物重定位和靶点预测
- • DrugBank集成
- • STITCH化合物网络
- • 药物作用机制分析
Cytoscape集成
通过插件与Cytoscape无缝集成,实现高级网络分析和可视化
- • 直接数据导入
- • 网络拓扑分析
- • 社区检测算法
批量数据下载
提供REST API和批量下载接口,支持程序化数据访问
- • RESTful API接口
- • 多种数据格式
- • 自动化工作流程
使用流程指南
访问数据库
网站访问
浏览器要求
准备基因列表
支持的ID类型
- • Entrez Gene ID
- • Gene Symbol
- • Ensembl ID
- • UniProt ID
- • RefSeq ID
输入格式
- • 每行一个基因ID
- • 逗号分隔列表
- • 制表符分隔
- • 支持混合ID类型
- • 最大5000个基因
数据质量检查
- • 去除重复ID
- • 检查ID有效性
- • 物种匹配验证
- • 提供映射报告
- • 建议标准化ID
选择分析类型
基因集富集分析
分析基因列表在预定义功能基因集中的富集程度
相互作用网络分析
构建和分析基因之间的分子相互作用网络
单基因查询
查询单个基因的所有已知分子相互作用
代谢物分析
分析代谢物列表的通路富集和网络分析
设置分析参数
富集分析参数
数据库选择
结果解读与下载
结果表格
- • 按p值排序的富集条目
- • 基因集大小和重叠数
- • 富集倍数计算
- • 基因列表详情
- • 可交互排序和筛选
网络可视化
- • 相互作用网络图
- • 节点颜色编码
- • 边类型区分
- • 网络拓扑属性
- • 子网络模块识别
数据导出
- • Excel格式结果表
- • CSV格式数据
- • PNG/SVG网络图
- • Cytoscape网络文件
- • SBML代谢网络
应用场景与案例
基础研究应用
转录组数据分析
对RNA-seq或微阵列实验得到的差异表达基因进行功能富集分析
蛋白质组学研究
整合蛋白质表达数据与相互作用网络,理解蛋白质功能模块
GWAS后续分析
将全基因组关联研究的候选基因映射到分子网络和通路
药物研发应用
靶点识别与验证
通过网络分析识别疾病相关的关键节点作为潜在药物靶点
药物重定位
分析已知药物的作用网络,发现新的治疗适应症
副作用预测
基于药物-靶点网络预测潜在的不良反应和毒性
临床研究应用
生物标志物发现
整合多组学数据识别疾病诊断、预后和治疗反应的分子标志物
疾病机制研究
通过网络分析揭示复杂疾病的分子机制和调控网络
精准医疗
基于患者分子特征和网络分析制定个体化治疗策略
多组学整合分析
基因组 + 转录组
整合基因变异和表达数据,理解基因型-表型关联
转录组 + 代谢组
连接基因表达与代谢物变化,解析代谢调控机制
蛋白组 + 表观组
整合蛋白质修饰和表观遗传标记,理解基因调控
ConsensusPathDB应用成果
数据库对比分析
主要通路分析数据库对比
特征 | ConsensusPathDB | STRING | Reactome | KEGG | Metascape |
---|---|---|---|---|---|
数据源整合 | 32+数据库 | 15+数据库 | 专有数据 | 专有数据 | 40+数据库 |
相互作用类型 | 全类型 | 蛋白质相互作用 | 生化反应 | 代谢通路 | 功能模块 |
网络可视化 | ✓ 强大 | ✓ 优秀 | ✓ 通路图 | ✓ 通路图 | ✓ 网络图 |
API接口 | ✓ REST API | ✓ REST API | ✓ REST API | ✓ REST API | ✗ 无 |
物种支持 | 人/小鼠/酵母 | 2000+物种 | 主要模式生物 | 500+物种 | 主要模式生物 |
更新频率 | 年度更新 | 季度更新 | 季度更新 | 月度更新 | 年度更新 |
ConsensusPathDB 优势
数据整合全面
整合32+个公共数据库,提供最全面的分子相互作用信息
多类型网络支持
支持蛋白质、基因调控、代谢、信号传导等多种网络类型
富集分析功能强大
提供多种富集分析方法和丰富的功能注释数据库
Cytoscape集成
无缝集成Cytoscape,支持高级网络分析和可视化
使用注意事项
物种限制
主要支持人类、小鼠和酵母,其他物种数据有限
数据更新频率
年度更新,可能不如某些数据库及时反映最新研究
网络复杂性
整合多源数据可能包含冗余或冲突信息,需要谨慎解读
计算资源需求
大型网络分析可能需要较长时间,建议合理设置参数
数据库选择指南
选择ConsensusPathDB
- • 需要全面的分子相互作用信息
- • 进行多类型网络整合分析
- • 需要强大的富集分析功能
- • 使用人类/小鼠/酵母数据
- • 需要Cytoscape集成分析
选择STRING
- • 专注蛋白质相互作用网络
- • 需要多物种支持
- • 要求高质量置信度评分
- • 需要频繁的数据更新
- • 进行比较基因组学研究
选择Reactome/KEGG
- • 专注特定通路类型分析
- • 需要权威的通路注释
- • 进行代谢通路研究
- • 要求详细的通路图示
- • 进行教学和展示用途
最佳实践建议
数据准备建议
基因ID标准化
- • 优先使用Entrez Gene ID或Gene Symbol
- • 确保基因ID与目标物种匹配
- • 去除重复和无效的基因ID
- • 检查基因ID的版本一致性
基因列表质量控制
- • 合理的列表大小(50-5000个基因)
- • 考虑基因表达水平和检测质量
- • 去除假基因和预测基因
- • 包含足够的生物学重复验证
背景基因集选择
- • 使用与实验平台匹配的背景
- • 考虑基因表达的组织特异性
- • 排除低表达或检测不到的基因
- • 保持背景与目标列表的一致性
结果解读指南
统计显著性评估
- • 关注FDR校正后的p值
- • 考虑效应大小(富集倍数)
- • 验证基因集大小的合理性
- • 评估重叠基因的生物学意义
网络结果验证
- • 检查网络的连通性和模块化
- • 验证关键节点的生物学功能
- • 考虑网络边的置信度得分
- • 使用独立数据集进行验证
分析策略优化
参数设置优化
多层次分析策略
- • 从GO功能分析开始,逐步深入通路分析
- • 结合多个数据库的结果进行交叉验证
- • 使用网络分析识别关键调控节点
- • 整合文献挖掘验证分析结果
常见问题与解决
问题:富集结果过于宽泛或无特异性
- • 提高p值阈值,增加统计严格性
- • 减小基因集的最大大小限制
- • 选择更具体的功能注释数据库
- • 重新评估输入基因列表的质量
问题:网络过于复杂,难以解读
- • 增加置信度阈值,过滤低质量边
- • 使用网络聚类算法识别功能模块
- • 专注分析高度连接的核心节点
- • 使用子网络提取特定功能模块
问题:基因ID映射失败或映射率低
- • 确认基因ID格式和物种匹配
- • 使用多种ID类型进行交叉验证
- • 更新基因注释到最新版本
- • 手动检查和修正关键基因ID
成功使用ConsensusPathDB的关键要素
数据质量
高质量的输入数据是获得可靠分析结果的基础
生物学理解
结合领域知识解读分析结果,避免过度解释
结果验证
使用独立实验或数据集验证重要发现