遗传关联性 Meta 分析证据可信度评价_《中国循证医学杂志》

作者：

赵向 ¹ ^# , 仇成凤 ^2,3 ^# , 史志华 ³ , 邓紫薇 ³ , 翁鸿 ⁴ , 杨宜华 ⁵ ,  谭力铭 ^2,3 ,  曾宪涛 ⁴

1. 湖南省怀化市第一人民医院全科医学科（湖南怀化 418000）;
2. 湖南省怀化市第一人民医院循证医学与临床研究中心（湖南怀化 418000）;
3. 湖南省怀化市第一人民医院临床药学研究室（湖南怀化 418000）;
4. 武汉大学中南医院循证与转化医学中心（武汉 430071）;
5. 徐州医科大学药学院（江苏徐州 210004）;

关键词：

遗传关联性研究 Meta 分析 Venice 标准可信度

DOI：

10.7507/1672-2531.201804142

视频：

导出 下载 收藏 扫码 引用

摘要 全文 图表 视频 参考文献 施引文献 补充材料

遗传关联性 Meta 分析将多个研究的数据整合，通过增大样本量以提高统计效能，成为探求真实遗传关联性的有效途径。Meta 分析为遗传关联性证据的产生带来机遇，但同时也给此类证据的利用带来挑战。因此，合理评价证据的可信度确有必要。本文主要介绍如何使用 Venice 标准从分子流行病学角度评价遗传关联性 Meta 分析证据的可信度。评估指标包括证据量、重复性及偏倚控制三方面，最后综合三方面的分级结果，得出“强”、“中等”、“弱”三个等级结果。通过对遗传关联性 Meta 分析证据可信度的评估，为进一步的研究及证据的临床转化提供明确信息。

引用本文： 赵向, 仇成凤, 史志华, 邓紫薇, 翁鸿, 杨宜华, 谭力铭, 曾宪涛. 遗传关联性 Meta 分析证据可信度评价. 中国循证医学杂志, 2018, 18(8): 883-887. doi: 10.7507/1672-2531.201804142 复制

近年，随着高通量基因检测技术的发展，每年有大量研究报道了基因多态与人类疾病的关联性。由于遗传关联性研究的效应量指标通常较小，因此常需要较大样本量以获得真实的遗传关联性。系统评价/Meta 分析能整合多个研究数据，通过增大样本量来提高统计效能，成为探求真实遗传关联性的有效途径。遗传关联性 Meta 分析为生产和传播遗传关联性证据带来机遇，但同时也给此类证据的利用带来挑战。因此，合理评价遗传关联性 Meta 分析证据的可信度非常重要。本文介绍如何应用 Venice 标准^[1]评价遗传关联性 Meta 分析证据的可信度。

1 Venice 标准简介

Venice 标准由 HuGENet（Human Genome Epidemiology Network）工作组于 2007 年提出，并随着研究的发展不断更新^{[2, 3]}。该标准主要从证据量、重复性及偏倚控制三方面来评估遗传关联性 Meta 分析证据的可信度。三个评价指标的评价标准与解释说明见表 1。

表1 遗传关联性研究 Meta 分析证据分级

表选项

下载CSV

表1 遗传关联性研究 Meta 分析证据分级

评价指标	等级	解释说明
证据量	A：n≥1 000 B：100≤n<1 000 C：n<100	在遗传关联性研究中，分级阈值的设定需要综合考虑样本量、统计效能及假阳性率等因素的影响。由于基因分析模型不同及基因突变频率不同等因素，采用发生突变的样本量即基因型样本量（n）作为当前评判证据量的主要依据^*。
重复性	A：无方法学缺陷；I²<25%。 B：存在一定的方法学缺陷；25%≤I²<50%。 C：存在明显方法学缺陷；原始研究间非独立；I²≥50%。	在 Meta 分析中，通过计算纳入原始研究结果间的异质性（I²）来判断结果的重复性。此外，尚需考虑原始研究中对表型定义、基因分型及基因分析模型等的一致性。以下情况均归为“C”级：无遗传关联性；未能重复（结果相反）；原始研究间非独立；零散证据；Meta 分析存在明显方法学缺陷；统计学异质性大（I²≥50%）。
偏倚控制	A：未发现偏倚。即使存在无法排除的潜在偏倚，仅影响效应值的大小，而不影响效应值的统计学意义（不改变结果方向）。 B：未发现可影响效应值统计学意义的偏倚，但在证据产生过程中存在数据缺失。 C：有明显偏倚，并影响效应值的统计学意义。	纳入原始研究明确说明控制偏倚的主要措施，且表型定义、基因分型、人群分层和选择性报告（见表 3）未发现偏倚，或研究设计、数据分析及数据 Meta 合并等未发现可影响遗传关联分析效应值的统计学意义的偏倚，定义为“A”；未明确说明控制偏倚的措施，基因分型及其它混杂因素都已控制，但可观察到由于数据缺失所导致的偏倚，定义为“B”；存在任何可影响遗传关联性分析效应值统计学意义的偏倚，定义为“C”^#。
*：假设某个基因的纯合子突变与某个临床表型具有关联性，如果该基因的纯合子突变率为 3%，当样本量超过 33 000 时，证据量评级为“A”；样本量为 3 300～33 000 时，证据量评级为“B”；样本量少于 3 300 时，证据量评级为“C”。在进行遗传关联分析时，如果采用不同的基因模型，样本量则对应于不同的基因模型中的基因型样本量。#：由于在证据产生与合并的过程中，即使已试图从每一步或各方面去控制偏倚的发生，但是由于实施过程的复杂性，无法完全排除潜在偏倚，因此即使偏倚控制分级定义为“A”，仍建议使用“可能不存在偏倚”进行描述。

2 证据量

证据的有效性主要取决于是否能够发现真实的遗传关联性，主要影响因素包括样本量、基因分析模型、基因突变频率及效应量的大小。足够的样本量可提高统计效能、增加统计学意义的显著性及减少结果报告的假阳性率^{[4, 5]}。在遗传关联性研究中，由于存在基因分析模型不同及不同人群的基因突变频率不同等因素，因此所有比较组中基因突变频率较低组的基因型样本量（n_minor）是影响效能的关键因素。Venice 标准使用 n_minor 作为评估证据量的直接指标。

那么，如何设定证据量的分级阈值?由表 2 可知，假定病例组与对照组样本量相等，n_minor=1 000，最小基因突变率（f_minor）变化范围在 0.01～0.50。当 α=0.05，OR 值在 1.3～5 时可得到较高的统计效能（81～100%）；当 OR 值为 1.2 时，统计效能随着样本量的减少而下降（51～82%）；当 OR 值为 1.1 时，基本失去统计效能（18～32%）。当 n_minor=500、OR 值为 1.1～1.3 时统计效能大幅度下降，当 n_minor=1 500 时，统计效能却并没有明显增加（表 2 中未显示）^[1]。基于统计效能的稳定性，Venice 标准设定 n_minor=1 000 作为 A 级与 B 级的分级阈值。但是需要注意的是，当 α=10^-7（多推荐用于发现性研究，如 GAWS 等）时，n_minor=1 000 仅在 OR≥2 时方能保证稳定的统计效能（96%～100%），因此当 Meta 分析中纳入 GAWS 研究，仍需增加样本量以保证统计效能。

表2 统计效能随不同 OR 值及不同基因突变频率（f_minor）的变化（n_minor=1 000）^*

表选项

下载CSV

表2 统计效能随不同 OR 值及不同基因突变频率（f_minor）的变化（n_minor=1 000）^*

OR 值	f_minor	统计效能（α=0.05）	统计效能（α=10^–7）
1.10	0.01	0.32	<0.001
1.20	0.01	0.82	0.007
1.30	0.01	0.98	0.12
1.50	0.01	1.00	0.83
2.00	0.01	1.00	1.00
5.00	0.01	1.00	1.00
1.10	0.05	0.31	<0.001
1.20	0.05	0.80	0.006
1.30	0.05	0.98	0.09
1.50	0.05	1.00	0.78
2.00	0.05	1.00	1.00
5.00	0.05	1.00	1.00
1.10	0.10	0.30	<0.001
1.20	0.10	0.78	0.005
1.30	0.10	0.97	0.74
1.50	0.10	1.00	1.00
2.00	0.10	1.00	1.00
5.00	0.10	1.00	1.00
1.10	0.25	0.25	<0.001
1.20	0.25	0.69	0.002
1.30	0.25	0.94	0.04
1.50	0.25	1.00	0.52
2.00	0.25	1.00	1.00
5.00	0.25	1.00	1.00
1.10	0.50	0.18	<0.001
1.20	0.50	0.51	<0.001
1.30	0.50	0.81	0.006
1.50	0.50	0.99	0.15
2.00	0.50	1.00	0.96
5.00	0.50	1.00	1.00
*：所有估算基于假设病例组与对照组具有相同样本量。f_minor 取两组（病例组和对照组）中基因/基因型突变频率低的一组进行估算。

3 重复性

独立原始研究结果的可重复性是影响 Meta 分析结果可信度的重要因素。在遗传关联性研究中，不同研究阶段对具有统计学显著性意义的 α 值设定不同。在识别发现阶段如 GAWS 研究中，通过同时分析成千上万个基因的突变情况来发现与筛选基因多态性与疾病的关联性，为了保证结果的真实性与可信度，建议将 α 值设定为 10^–7；而在后续的重复验证阶段，主要探讨一个或多个候选基因多态性与疾病的关联性，这时将 α 值设定为 0.05 较为合适^{[6, 7]}。

对于真实存在的遗传关联性，如果独立原始研究间缺少重复性和同质性，需要慎重分析其潜在影响因素。首先考虑是否存在错误或偏倚，主要包括表型定义非标准化、基因分型错误、人群分层不适宜及选择性报告等^[8-10]。在后续重复验证阶段，基因的连锁不平衡在不同人群的不一致可能是导致独立研究存在异质性的原因之一^[11]。因此，独立研究间缺少重复性也不能完全否定之前所发现的基因-疾病关联性，在排除潜在的错误与偏倚外，独立研究间的异质性可能也是基因效应的真实反映^[11]。此外，尚需评估原始研究间的独立性。原始研究的独立性方能确保真实的“重复性”^[12]。由不同的研究团队在不同的人群中探讨同一基因多态性-疾病的关联性是保证原始研究独立性的最佳措施。如果由同一个研究团队在不同人群中去进行某个遗传关联性的重复验证，或将未进行合并分析人群的分层分析视为独立研究均会因缺乏独立性导致潜在偏倚增加^[13]。

总之，对于重复验证的某个遗传关联性，原始研究之间的独立性和重复性是提高累积证据可信度的重要因素。在进行系统评价或 Meta 分析时，通常计算异质性（I²）对结果的重复性进行估算与分级（表 1）。

4 控制偏倚风险

偏倚不仅会影响真实遗传关联效应值的大小，甚至会决定是否存在统计学意义的差异（结果的方向）。由于遗传关联性的效应指标通常较小，因此，采取恰当的措施尽可能控制偏倚风险对于发现真实的遗传关联分析十分重要。偏倚风险存在于实施原始研究阶段和证据整合阶段。许多因素都可导致偏倚的发生，包括研究设计、DNA 提取、基因分型、原始数据管理和分析、结果报告及结果合并方法（Meta 分析方法）等^[14-17]。

遗传关联性研究主要偏倚包括表型定义非标准化、基因分型错误、人群分层不适宜及选择性报告等（表 3）^[8-10]。各研究对同一表型的非标准化定义常导致偏倚。即使在当今高通量分型技术高速发展的阶段，基因分型错误仍然非常普遍。由于病例组与对照组的受试对象是分别招募的，因此基因分型错误对病例组与对照组会产生不同的效应，影响对真实遗传关联性的发现。那么，如何评价基因分型质量?首先，使用盲法重复验证部分样本的基因分型情况；第二，采用不同的基因分型方法对同一人群进行重复验证；第三，对病例组与对照组分别进行 Hardy-Weinberg 平衡检测^[9]。对于部分样本基因分型数据缺失情况，需要额外分析缺失状态下病例-对照表型情况来验证缺失数据对结果的影响。此外，人群的不适当分层会导致偏倚，尤其对于效应指标较小的遗传关联分析，不恰当的人群分层会产生严重偏倚，从而影响结果的真实性。在研究实施过程中，通常采用基因组控制（genomic control）和主成分分析等统计学方法来矫正人群结构对于遗传关联性研究结果的影响^[18]。选择性报告结果（阳性结果发表）是导致系统评价和 Meta 分析结果出现偏倚的重要因素。为降低选择性偏倚，不同研究团队应该有明确的方法确保能够分析所有受试人员数据，同时鼓励发表高质量的阴性结果^{[19, 20]}。对于回顾性研究的 Meta 分析，除了需要排除前面提及的 4 种主要偏倚外，应使用敏感性分析评估首个研究、占最大效应量比例研究和占最小效应量比例的研究、Hardy-Weinberg 不平衡的研究对合并效应值的影响^[15]。

研究透明度和结果报告所遵循的指南是判断偏倚的重要准则。表 3 详细列出 4 种常见偏倚在控制或不控制的情况下对单个研究或 Meta 分析效应值的影响，根据偏倚是否影响实际效应值的统计学显著性意义进行分级。在证据产生过程中，导致偏倚的因素非常多，即使采取严格的措施控制偏倚，仍无法完全控制或消除偏倚对实际效应值的影响，因此即使偏倚控制分级为“A”，仍建议使用“可能不存在偏倚”来定义。

当偏倚对效应值的统计学显著性意义影响为“低/无”，则定义为“A”；如果为“不清楚”，定义为“B”；如果为“可能/高”，则定义为“C”。对于选择性偏倚，如果为“可能”，则不需要从“A”降至“C”。在 Meta 分析中，可采用敏感性分析判断微效应值和大效应值研究对于合并结果的影响。此外，如果发现研究的其它方面如研究设计、实施过程及数据分析等存在明显偏倚，则定义为“C”。

表3 常见偏倚及对遗传关联性分析效应量的影响

表选项

下载CSV

表3 常见偏倚及对遗传关联性分析效应量的影响

偏倚来源	内容	影响效应量的统计学显著性意义（OR）
偏倚来源	内容	<1.15	1.15～1.8	>1.8
表型定义	表型定义标准未报道	不清楚	不清楚	不清楚
	表型定义标准不清楚	可能/高	可能/高	可能/高
	表型定义标准化	低/无	低/无	低/无
	回顾性研究的数据整合	可能/高	低	低/无
	前瞻性研究中表型定义标准化	低/无	低/无	低/无
基因分型	基因分型方法未报道	不清楚	不清楚	不清楚
	未执行基因分型质量检查	可能/高	低	低
	采取适当的措施检查基因分型质量	低	低	低/无
人群分层	人群分层方法未报道	不清楚	不清楚	不清楚
	未按种族进行人群分层	可能/高	可能/高	可能/高
	同一种族未根据临床特点分层	可能/高	低	低/无
	调整种族因素	可能/高	低	低/无
	家系分析	低/无	低/无	低/无
	使用基因组控制、主成分分析等方法	低/无	低/无	低/无
选择偏倚	基于已发表文献的 Meta 分析	可能/高	可能	可能
	纳入已发表文献和未发表数据的 Meta 分析	可能/高	可能	可能
	基于协作的 Meta 分析	低/无	低/无	低/无

5 可信度判定标准组合

对于某个遗传关联性的系统评价或 Meta 分析，分别从证据量、重复性和偏倚控制三方面进行分级（A、B 或 C），然后将分级结果进行组合用以评判累积证据的总体可信度。其评判标准见图 1：

可信度强：证据量、重复性和偏倚控制都为“A”，如“AAA”；

可信度中等：证据量、重复性和偏倚控制级别为“A”或者“B”，如“ABA”、“ABB”等；

可信度弱：证据量、重复性和偏倚控制评级结果中有一个或两个或全部为“C”，如“ABC”、“ACC”、“CCC”等。

图1 遗传关联性分析 Meta 分析证据的可信度评价^[1]

图选项

下载全尺寸图像

下载幻灯片

6 小结

遗传关联性研究证据在不断发展，Meta 分析证据可信度会随着新证据不断产生而发生变化。Venice 标准主要从分子流行病学角度来评估证据的可信度，我们需综合考虑遗传关联性研究发展阶段、基因生物学功能及临床相关性等多方面因素来判断证据的可信度与价值，以期为进一步研究及临床转化提供明确信息。

1 Venice 标准简介

表1 遗传关联性研究 Meta 分析证据分级

表选项

下载CSV

表1 遗传关联性研究 Meta 分析证据分级

评价指标	等级	解释说明
证据量	A：n≥1 000 B：100≤n<1 000 C：n<100	在遗传关联性研究中，分级阈值的设定需要综合考虑样本量、统计效能及假阳性率等因素的影响。由于基因分析模型不同及基因突变频率不同等因素，采用发生突变的样本量即基因型样本量（n）作为当前评判证据量的主要依据^*。
重复性	A：无方法学缺陷；I²<25%。 B：存在一定的方法学缺陷；25%≤I²<50%。 C：存在明显方法学缺陷；原始研究间非独立；I²≥50%。	在 Meta 分析中，通过计算纳入原始研究结果间的异质性（I²）来判断结果的重复性。此外，尚需考虑原始研究中对表型定义、基因分型及基因分析模型等的一致性。以下情况均归为“C”级：无遗传关联性；未能重复（结果相反）；原始研究间非独立；零散证据；Meta 分析存在明显方法学缺陷；统计学异质性大（I²≥50%）。
偏倚控制	A：未发现偏倚。即使存在无法排除的潜在偏倚，仅影响效应值的大小，而不影响效应值的统计学意义（不改变结果方向）。 B：未发现可影响效应值统计学意义的偏倚，但在证据产生过程中存在数据缺失。 C：有明显偏倚，并影响效应值的统计学意义。	纳入原始研究明确说明控制偏倚的主要措施，且表型定义、基因分型、人群分层和选择性报告（见表 3）未发现偏倚，或研究设计、数据分析及数据 Meta 合并等未发现可影响遗传关联分析效应值的统计学意义的偏倚，定义为“A”；未明确说明控制偏倚的措施，基因分型及其它混杂因素都已控制，但可观察到由于数据缺失所导致的偏倚，定义为“B”；存在任何可影响遗传关联性分析效应值统计学意义的偏倚，定义为“C”^#。
*：假设某个基因的纯合子突变与某个临床表型具有关联性，如果该基因的纯合子突变率为 3%，当样本量超过 33 000 时，证据量评级为“A”；样本量为 3 300～33 000 时，证据量评级为“B”；样本量少于 3 300 时，证据量评级为“C”。在进行遗传关联分析时，如果采用不同的基因模型，样本量则对应于不同的基因模型中的基因型样本量。#：由于在证据产生与合并的过程中，即使已试图从每一步或各方面去控制偏倚的发生，但是由于实施过程的复杂性，无法完全排除潜在偏倚，因此即使偏倚控制分级定义为“A”，仍建议使用“可能不存在偏倚”进行描述。

2 证据量

表2 统计效能随不同 OR 值及不同基因突变频率（f_minor）的变化（n_minor=1 000）^*

表选项

下载CSV

表2 统计效能随不同 OR 值及不同基因突变频率（f_minor）的变化（n_minor=1 000）^*

OR 值	f_minor	统计效能（α=0.05）	统计效能（α=10^–7）
1.10	0.01	0.32	<0.001
1.20	0.01	0.82	0.007
1.30	0.01	0.98	0.12
1.50	0.01	1.00	0.83
2.00	0.01	1.00	1.00
5.00	0.01	1.00	1.00
1.10	0.05	0.31	<0.001
1.20	0.05	0.80	0.006
1.30	0.05	0.98	0.09
1.50	0.05	1.00	0.78
2.00	0.05	1.00	1.00
5.00	0.05	1.00	1.00
1.10	0.10	0.30	<0.001
1.20	0.10	0.78	0.005
1.30	0.10	0.97	0.74
1.50	0.10	1.00	1.00
2.00	0.10	1.00	1.00
5.00	0.10	1.00	1.00
1.10	0.25	0.25	<0.001
1.20	0.25	0.69	0.002
1.30	0.25	0.94	0.04
1.50	0.25	1.00	0.52
2.00	0.25	1.00	1.00
5.00	0.25	1.00	1.00
1.10	0.50	0.18	<0.001
1.20	0.50	0.51	<0.001
1.30	0.50	0.81	0.006
1.50	0.50	0.99	0.15
2.00	0.50	1.00	0.96
5.00	0.50	1.00	1.00
*：所有估算基于假设病例组与对照组具有相同样本量。f_minor 取两组（病例组和对照组）中基因/基因型突变频率低的一组进行估算。

3 重复性

4 控制偏倚风险

表3 常见偏倚及对遗传关联性分析效应量的影响

表选项

下载CSV

表3 常见偏倚及对遗传关联性分析效应量的影响

偏倚来源	内容	影响效应量的统计学显著性意义（OR）
偏倚来源	内容	<1.15	1.15～1.8	>1.8
表型定义	表型定义标准未报道	不清楚	不清楚	不清楚
	表型定义标准不清楚	可能/高	可能/高	可能/高
	表型定义标准化	低/无	低/无	低/无
	回顾性研究的数据整合	可能/高	低	低/无
	前瞻性研究中表型定义标准化	低/无	低/无	低/无
基因分型	基因分型方法未报道	不清楚	不清楚	不清楚
	未执行基因分型质量检查	可能/高	低	低
	采取适当的措施检查基因分型质量	低	低	低/无
人群分层	人群分层方法未报道	不清楚	不清楚	不清楚
	未按种族进行人群分层	可能/高	可能/高	可能/高
	同一种族未根据临床特点分层	可能/高	低	低/无
	调整种族因素	可能/高	低	低/无
	家系分析	低/无	低/无	低/无
	使用基因组控制、主成分分析等方法	低/无	低/无	低/无
选择偏倚	基于已发表文献的 Meta 分析	可能/高	可能	可能
	纳入已发表文献和未发表数据的 Meta 分析	可能/高	可能	可能
	基于协作的 Meta 分析	低/无	低/无	低/无

5 可信度判定标准组合

可信度强：证据量、重复性和偏倚控制都为“A”，如“AAA”；

可信度中等：证据量、重复性和偏倚控制级别为“A”或者“B”，如“ABA”、“ABB”等；

可信度弱：证据量、重复性和偏倚控制评级结果中有一个或两个或全部为“C”，如“ABC”、“ACC”、“CCC”等。

图1 遗传关联性分析 Meta 分析证据的可信度评价^[1]

图选项

下载全尺寸图像

下载幻灯片

6 小结

表1 遗传关联性研究 Meta 分析证据分级

评价指标	等级	解释说明
证据量	A：n≥1 000 B：100≤n<1 000 C：n<100	在遗传关联性研究中，分级阈值的设定需要综合考虑样本量、统计效能及假阳性率等因素的影响。由于基因分析模型不同及基因突变频率不同等因素，采用发生突变的样本量即基因型样本量（n）作为当前评判证据量的主要依据^*。
重复性	A：无方法学缺陷；I²<25%。 B：存在一定的方法学缺陷；25%≤I²<50%。 C：存在明显方法学缺陷；原始研究间非独立；I²≥50%。	在 Meta 分析中，通过计算纳入原始研究结果间的异质性（I²）来判断结果的重复性。此外，尚需考虑原始研究中对表型定义、基因分型及基因分析模型等的一致性。以下情况均归为“C”级：无遗传关联性；未能重复（结果相反）；原始研究间非独立；零散证据；Meta 分析存在明显方法学缺陷；统计学异质性大（I²≥50%）。
偏倚控制	A：未发现偏倚。即使存在无法排除的潜在偏倚，仅影响效应值的大小，而不影响效应值的统计学意义（不改变结果方向）。 B：未发现可影响效应值统计学意义的偏倚，但在证据产生过程中存在数据缺失。 C：有明显偏倚，并影响效应值的统计学意义。	纳入原始研究明确说明控制偏倚的主要措施，且表型定义、基因分型、人群分层和选择性报告（见表 3）未发现偏倚，或研究设计、数据分析及数据 Meta 合并等未发现可影响遗传关联分析效应值的统计学意义的偏倚，定义为“A”；未明确说明控制偏倚的措施，基因分型及其它混杂因素都已控制，但可观察到由于数据缺失所导致的偏倚，定义为“B”；存在任何可影响遗传关联性分析效应值统计学意义的偏倚，定义为“C”^#。
*：假设某个基因的纯合子突变与某个临床表型具有关联性，如果该基因的纯合子突变率为 3%，当样本量超过 33 000 时，证据量评级为“A”；样本量为 3 300～33 000 时，证据量评级为“B”；样本量少于 3 300 时，证据量评级为“C”。在进行遗传关联分析时，如果采用不同的基因模型，样本量则对应于不同的基因模型中的基因型样本量。#：由于在证据产生与合并的过程中，即使已试图从每一步或各方面去控制偏倚的发生，但是由于实施过程的复杂性，无法完全排除潜在偏倚，因此即使偏倚控制分级定义为“A”，仍建议使用“可能不存在偏倚”进行描述。

表选项

下载CSV

表2 统计效能随不同 OR 值及不同基因突变频率（f_minor）的变化（n_minor=1 000）^*

OR 值	f_minor	统计效能（α=0.05）	统计效能（α=10^–7）
1.10	0.01	0.32	<0.001
1.20	0.01	0.82	0.007
1.30	0.01	0.98	0.12
1.50	0.01	1.00	0.83
2.00	0.01	1.00	1.00
5.00	0.01	1.00	1.00
1.10	0.05	0.31	<0.001
1.20	0.05	0.80	0.006
1.30	0.05	0.98	0.09
1.50	0.05	1.00	0.78
2.00	0.05	1.00	1.00
5.00	0.05	1.00	1.00
1.10	0.10	0.30	<0.001
1.20	0.10	0.78	0.005
1.30	0.10	0.97	0.74
1.50	0.10	1.00	1.00
2.00	0.10	1.00	1.00
5.00	0.10	1.00	1.00
1.10	0.25	0.25	<0.001
1.20	0.25	0.69	0.002
1.30	0.25	0.94	0.04
1.50	0.25	1.00	0.52
2.00	0.25	1.00	1.00
5.00	0.25	1.00	1.00
1.10	0.50	0.18	<0.001
1.20	0.50	0.51	<0.001
1.30	0.50	0.81	0.006
1.50	0.50	0.99	0.15
2.00	0.50	1.00	0.96
5.00	0.50	1.00	1.00
*：所有估算基于假设病例组与对照组具有相同样本量。f_minor 取两组（病例组和对照组）中基因/基因型突变频率低的一组进行估算。

表选项

下载CSV

表3 常见偏倚及对遗传关联性分析效应量的影响

偏倚来源	内容	影响效应量的统计学显著性意义（OR）
偏倚来源	内容	<1.15	1.15～1.8	>1.8
表型定义	表型定义标准未报道	不清楚	不清楚	不清楚
	表型定义标准不清楚	可能/高	可能/高	可能/高
	表型定义标准化	低/无	低/无	低/无
	回顾性研究的数据整合	可能/高	低	低/无
	前瞻性研究中表型定义标准化	低/无	低/无	低/无
基因分型	基因分型方法未报道	不清楚	不清楚	不清楚
	未执行基因分型质量检查	可能/高	低	低
	采取适当的措施检查基因分型质量	低	低	低/无
人群分层	人群分层方法未报道	不清楚	不清楚	不清楚
	未按种族进行人群分层	可能/高	可能/高	可能/高
	同一种族未根据临床特点分层	可能/高	低	低/无
	调整种族因素	可能/高	低	低/无
	家系分析	低/无	低/无	低/无
	使用基因组控制、主成分分析等方法	低/无	低/无	低/无
选择偏倚	基于已发表文献的 Meta 分析	可能/高	可能	可能
	纳入已发表文献和未发表数据的 Meta 分析	可能/高	可能	可能
	基于协作的 Meta 分析	低/无	低/无	低/无

表选项

下载CSV

图1 遗传关联性分析 Meta 分析证据的可信度评价^[1]

图选项

下载全尺寸图像

下载幻灯片

1.	Ioannidis JP, Boffetta P, Little J, et al. Assessment of cumulative evidence on genetic associations: interim guidelines. Int J Epidemiol, 2008, 37(1): 120-132.
2.	Mocellin S, Verdi D, Pooley KA, et al. Genetic variation and gastric cancer risk: a field synopsis and meta-analysis. Gut, 2015, 64(8): 1209-1219.
3.	Qiu C, Zeng P, Li X, et al. What is the impact of PCSK9 rs505151 and rs11591147 polymorphisms on serum lipids level and cardiovascular risk: a meta-analysis. Lipids Health Dis, 2017, 16(1): 111.
4.	Zehetmayer S, Graf AC, Posch M. Sample size reassessment for a two-stage design controlling the false discovery rate. Stat Appl Genet Mol Biol, 2015, 14(5): 429-442.
5.	Ioannidis JP, Trikalinos TA, Ntzani EE, et al. Genetic associations in large versus small studies: an empirical assessment. Lancet, 2003, 361(9357): 567-571.
6.	NCI-NHGRI Working Group on Replication in Association Studies, Chanock SJ, Manolio T, et al. Replicating genotype-phenotype associations. Nature, 2007, 447(7145): 655-660.
7.	Ioannidis JP. Non-replication and inconsistency in the genome-wide association setting. Hum Hered, 2007, 64(4): 203-213.
8.	Balding DJ. A tutorial on statistical methods for population association studies. Nat Rev Genet, 2006, 7(10): 781-791.
9.	Clayton DG, Walker NM, Smyth DJ, et al. Population structure, differential bias and genomic control in a large-scale, case-control association study. Nat Genet, 2005, 37(11): 1243-1246.
10.	Pompanon F, Bonin A, Bellemain E, et al. Genotyping errors: causes, consequences and solutions. Nat Rev Genet, 2005, 6(11): 847-859.
11.	Ioannidis JP, Patsopoulos NA, Evangelou E. Heterogeneity in meta-analyses of genome-wide association investigations. PLoS One, 2007, 2(9): e841.
12.	Ioannidis JP, Trikalinos TA, Zintzaras E. Extreme between-study homogeneity in meta-analyses could offer useful insights. J Clin Epidemiol, 2006, 59(10): 1023-1032.
13.	Skol AD, Scott LJ, Abecasis GR, et al. Joint analysis is more efficient than replication-based analysis for two-stage genome-wide association studies. Nat Genet, 2006, 38(2): 209-213.
14.	Hattersley AT, McCarthy MI. What makes a good genetic association study? Lancet, 2005, 366(9493): 1315-1323.
15.	Wang Y, Localio R, Rebbeck TR. Evaluating bias due to population stratification in epidemiologic studies of gene-gene or gene-environment interactions. Cancer Epidemiol Biomarkers Prev, 2006, 15(1): 124-132.
16.	Cordell HJ, Clayton DG. Genetic association studies. Lancet, 2005, 366(9491): 1121-1131.
17.	Newton-Cheh C, Hirschhorn JN. Genetic association studies of complex traits: design and analysis issues. Mutat Res, 2005, 573(1-2): 54-69.
18.	Price AL, Patterson NJ, Plenge RM, et al. Principal components analysis corrects for stratification in genome-wide association studies. Nat Genet, 2006, 38(8): 904-909.
19.	Chan AW, Hróbjartsson A, Haahr MT, et al. Empirical evidence for selective reporting of outcomes in randomized trials: comparison of protocols to published articles. JAMA, 2004, 291(20): 2457-2465.
20.	Shields PG. Publication bias is a scientific problem with adverse ethical outcomes: the case for a section for null results. Cancer Epidemiol Biomarkers Prev, 2000, 9(8): 771-772.

1. Ioannidis JP, Boffetta P, Little J, et al. Assessment of cumulative evidence on genetic associations: interim guidelines. Int J Epidemiol, 2008, 37(1): 120-132.
2. Mocellin S, Verdi D, Pooley KA, et al. Genetic variation and gastric cancer risk: a field synopsis and meta-analysis. Gut, 2015, 64(8): 1209-1219.
3. Qiu C, Zeng P, Li X, et al. What is the impact of PCSK9 rs505151 and rs11591147 polymorphisms on serum lipids level and cardiovascular risk: a meta-analysis. Lipids Health Dis, 2017, 16(1): 111.
4. Zehetmayer S, Graf AC, Posch M. Sample size reassessment for a two-stage design controlling the false discovery rate. Stat Appl Genet Mol Biol, 2015, 14(5): 429-442.
5. Ioannidis JP, Trikalinos TA, Ntzani EE, et al. Genetic associations in large versus small studies: an empirical assessment. Lancet, 2003, 361(9357): 567-571.
6. NCI-NHGRI Working Group on Replication in Association Studies, Chanock SJ, Manolio T, et al. Replicating genotype-phenotype associations. Nature, 2007, 447(7145): 655-660.
7. Ioannidis JP. Non-replication and inconsistency in the genome-wide association setting. Hum Hered, 2007, 64(4): 203-213.
8. Balding DJ. A tutorial on statistical methods for population association studies. Nat Rev Genet, 2006, 7(10): 781-791.
9. Clayton DG, Walker NM, Smyth DJ, et al. Population structure, differential bias and genomic control in a large-scale, case-control association study. Nat Genet, 2005, 37(11): 1243-1246.
10. Pompanon F, Bonin A, Bellemain E, et al. Genotyping errors: causes, consequences and solutions. Nat Rev Genet, 2005, 6(11): 847-859.
11. Ioannidis JP, Patsopoulos NA, Evangelou E. Heterogeneity in meta-analyses of genome-wide association investigations. PLoS One, 2007, 2(9): e841.
12. Ioannidis JP, Trikalinos TA, Zintzaras E. Extreme between-study homogeneity in meta-analyses could offer useful insights. J Clin Epidemiol, 2006, 59(10): 1023-1032.
13. Skol AD, Scott LJ, Abecasis GR, et al. Joint analysis is more efficient than replication-based analysis for two-stage genome-wide association studies. Nat Genet, 2006, 38(2): 209-213.
14. Hattersley AT, McCarthy MI. What makes a good genetic association study? Lancet, 2005, 366(9493): 1315-1323.
15. Wang Y, Localio R, Rebbeck TR. Evaluating bias due to population stratification in epidemiologic studies of gene-gene or gene-environment interactions. Cancer Epidemiol Biomarkers Prev, 2006, 15(1): 124-132.
16. Cordell HJ, Clayton DG. Genetic association studies. Lancet, 2005, 366(9491): 1121-1131.
17. Newton-Cheh C, Hirschhorn JN. Genetic association studies of complex traits: design and analysis issues. Mutat Res, 2005, 573(1-2): 54-69.
18. Price AL, Patterson NJ, Plenge RM, et al. Principal components analysis corrects for stratification in genome-wide association studies. Nat Genet, 2006, 38(8): 904-909.
19. Chan AW, Hróbjartsson A, Haahr MT, et al. Empirical evidence for selective reporting of outcomes in randomized trials: comparison of protocols to published articles. JAMA, 2004, 291(20): 2457-2465.
20. Shields PG. Publication bias is a scientific problem with adverse ethical outcomes: the case for a section for null results. Cancer Epidemiol Biomarkers Prev, 2000, 9(8): 771-772.

上一篇
中国三级医院管理人员培训需求的系统评价
下一篇
中成药临床应用专家共识制订方法

《中国循证医学杂志》

遗传关联性 Meta 分析证据可信度评价

摘要 全文 图表 视频 参考文献 施引文献 补充材料

1 Venice 标准简介

2 证据量

3 重复性

4 控制偏倚风险

5 可信度判定标准组合

6 小结

1 Venice 标准简介

2 证据量

3 重复性

4 控制偏倚风险

5 可信度判定标准组合

6 小结

上一篇

下一篇

Format

Content

《中国循证医学杂志》

遗传关联性 Meta 分析证据可信度评价

摘要 全文 图表 视频 参考文献 施引文献 补充材料

1 Venice 标准简介

2 证据量

3 重复性

4 控制偏倚风险

5 可信度判定标准组合

6 小结

1 Venice 标准简介

2 证据量

3 重复性

4 控制偏倚风险

5 可信度判定标准组合

6 小结

上一篇

下一篇

Format

Content

摘要全文图表视频参考文献施引文献补充材料