引言
在这个屏幕无处不在的时代,视力问题似乎已经成了现代人的一种“标配”。屈光不正(Refractive errors, REs),包括近视、远视和散光,目前影响着全球超过一半的人口。尤其是高度近视,据估计到2050年将波及全球10%的人口,并可能引发白内障、视网膜脱落等不可逆的视力损害。长久以来,我们习惯于将视力下降归咎于昏暗的灯光、过长的阅读时间或是缺少户外活动。然而,视力问题仅仅是后天环境的产物吗?
4月20日,《Nature Genetics》的研究报道“Multi-ancestry genome-wide association analyses of refractive error augment genetic discovery and polygenic prediction”,研究人员以前所未有的宏大视野,跨越不同人类祖先群体,深入解析了屈光不正背后的复杂遗传架构,向我们展示了基因在视力发育中扮演的隐秘而强大的角色。
填补遗传学拼图:为何我们需要一场跨越种族的“人口普查”?在探讨具体的基因变异之前,我们需要先理解一个在遗传学界长期存在的困惑:缺失的遗传率(Missing heritability)。
早期的双胞胎研究向我们展示了一个惊人的事实:屈光不正具有极高的遗传倾向,其遗传率估计在75%到88%之间。这意味着,一个人是否会近视,很大程度上在受精卵形成的瞬间就已经被基因图谱勾勒出了轮廓。然而,当研究人员试图通过全基因组关联分析(Genome-wide association studies, GWAS)来寻找这些导致近视的“罪魁祸首”时,却遭遇了瓶颈。以往基于常见变异构建的多基因风险评分(Polygenic risk scores, PRS),仅仅能解释3.4%到19.0%的表型变异。双胞胎研究中观察到的极高遗传率与基因组数据实际能解释的变异之间,存在着巨大的鸿沟。
造成这种鸿沟的一个关键原因,在于样本的多样性不足。在过去的GWAS研究中,样本存在严重的欧洲人群偏倚。例如,在此前最大规模的屈光不正GWAS研究中,欧洲祖先样本量高达约54万,而亚洲祖先样本仅有约1.2万,其他族裔的样本更是寥寥无几。考虑到亚洲人群,尤其是东亚人群中近视发病率的激增,这种样本结构显然无法完整揭示全球人类的视力遗传图谱。
为了打破这一局限,这项研究开展了一场真正意义上的跨种族数据大整合。研究人员汇集了十个大型队列的数据,最终纳入了1,495,159名欧洲(European, EUR)祖先个体、121,172名东亚(East Asian, EAS)祖先个体以及144,737名非洲(African, AFR)祖先个体的庞大样本。
如此惊人的数据体量不仅赋予了统计学上极高的效力,更为解析不同种族间共享与特异的遗传效应提供了可能。基于这超过170万人的海量数据,研究人员使用基于单核苷酸多态性(Single nucleotide polymorphism, SNP)的工具(如GREML和GREML-LDMS模型)重新评估了遗传率。结果显示,当把罕见变异(次等位基因频率小于0.01)纳入考量后,SNP相关的屈光不正遗传率跃升至0.460。这一数据有力地支持了负选择(Negative selection)在视力进化中的作用——那些对视力有重大负面影响的罕见突变,在进化过程中被自然选择压制在较低的频率,但它们却贡献了超出预期的遗传变异。
932个变异位点浮出水面:寻找人类共享与独有的进化印记借助跨种族荟萃分析(Cross-ancestry meta-analysis)的强大算力,研究人员在人类基因组中精准锁定了932个与屈光不正显著相关的独立变异位点,其中241个是之前从未被发现的全新关联位点。这极大地丰富了我们对眼球发育遗传调控网络的认知。
深入挖掘这些位点,我们会发现一个迷人的现象:虽然不同种族在屈光不正的遗传倾向上具有高度的一致性(例如,欧洲与东亚群体之间的遗传相关性估计值高达0.80),但不同祖先群体依然保留着自身独特的遗传印记。
在欧洲人群中,信号最强烈的是位于LAMA2基因区域的变异位点(rs12193446)。数据表明,这个与眼轴长度和屈光不正紧密相关的变异,在欧洲群体中的次等位基因频率(Minor allele frequency, MAF)约为0.10,这意味着它在欧洲人群中具有一定的普遍性。然而,令人意外的是,这个变异在非洲群体中的频率骤降至0.01,而在东亚群体中几乎为零。这完美解释了为什么之前的单一东亚人群研究很难捕捉到这个关键信号。
相反,在东亚人群中,研究人员发现了一个专属的强烈信号:位于PDE4B基因区域的变异位点(rs12063046)。该位点在东亚人群中表现出了极高的统计学显著性,但在欧洲和非洲人群中却完全没有达到显著水平。更深入的数据揭示了背后的频率差异:该突变在东亚和非洲人群中的频率分别达到了0.27和0.24,而在欧洲人群中仅为0.03。结合以往的动物模型研究,缺失Pde4b基因的小鼠相比野生型小鼠会出现-3.66屈光度(Diopters)的近视偏移。这一东亚特异性信号的发现,或许能为解答“为何东亚人群近视率居高不下”提供一个分子层面的重要线索。
除了东亚群体,研究还在非洲人群中发现了一个独有的关联信号(rs1646026)。这些散布在基因组各处、带有明显种族烙印的微小变异,像是漫长人类迁徙和环境适应史中留下的微观化石,静静诉说着不同群体眼球进化的独特历程。
基因的隐秘网络:当“近视基因”与身高、学历产生交集生命体系的复杂性在于,基因往往不是“单一职能”的孤岛。一个基因同时影响多个看似不相关的表型,这在遗传学中被称为基因多效性(Pleiotropy)。在这项研究中,基因的多效性展现得淋漓尽致。
在跨种族分析鉴定出的932个变异中,高达626个(占比67.2%)被发现与其他表型存在多效性关联。具体来看,有142个变异与站立身高有关,91个与躯干去脂体重(Trunk fat-free mass)有关,68个与红细胞计数有关,还有42个与大学或以上学历资格有关。
最引人注意的是新发现的241个变异。数据揭示,在这批新变异中,有39个与身高表现出强烈的多效性关联(优势比高达3.60),另有11个与受教育程度(大学学历)表现出显著关联(优势比高达5.70)。
面对这些数据,我们不禁要思考:为何控制眼球屈光度的基因,会与骨骼生长甚至学术成就纠缠在一起?这是否暗示了眼球轴长发育与身体整体骨骼轴向生长之间,共享着某种底层的生物学信号通路?而与受教育程度的遗传关联,是否意味着某些促使个体倾向于长时间近距离阅读(从而获得更高学历)的神经或行为特质,其基因表达网络与调控眼球生长的网络存在重叠?这些数据虽然不能直接划上因果关系的等号,但它们巧妙地揭示了人体各个系统在遗传底座上的深度互联。
为了进一步锁定具体的致病机制,研究人员整合了十种基因优先级排序(Gene prioritization)策略,将目光聚焦在了23个与眼部发育(Eye development)密切相关的核心基因上。例如,SIX3基因在早期眼部发育的细胞增殖和分化中发挥着关键的转录调控作用;TFAP2B被认为是角膜内皮发育和维持平衡的重要调节因子;而FBN1基因的突变已知会因眼轴过度拉长而导致近视,SMOC1和BMP4基因突变则会导致严重的眼部畸形。这些从海量数据中“淘”出的核心基因,犹如一张精确的导航图,为未来开发针对性的近视干预药物指明了方向。
预测未来的尺子:多基因风险评分如何划分视力命运?如果说发现基因变异是为了理解过去,那么构建预测模型则是为了掌控未来。这项研究中最具临床转化潜力的成果,在于利用全新算法构建的高精度多基因风险评分(Polygenic risk scores, PRS)模型。
以往的PRS模型由于受限于样本量或未充分利用功能注释信息,预测效能往往差强人意。本研究中,研究人员采用了一种名为SBayesRC的先进方法,这种方法巧妙地将功能注释(Functional annotations)整合到效应权重的计算中。
结果是惊人的。在针对欧洲人群的十折交叉验证中,这种增强版的PRS(RE-PRS)能够解释高达21.4%的屈光不正变异。相比于之前仅能解释约14%变异的基线模型,这是一个巨大的飞跃。更重要的是,这个数字已经占据了利用常见变异估计出的总体SNP遗传率的54.2%。这意味着,仅仅通过读取个体的DNA序列,我们就能在很大程度上预测其视力走向。
为了评估这种预测在临床上的实际价值,研究人员将连续的屈光度数据转化为二元特征(即近视和远视),并绘制了受试者工作特征曲线(Receiver operating characteristic curve, ROC)。数据显示,该RE-PRS预测近视的曲线下面积(Area under the curve, AUC)达到了0.741,预测高度近视(低于-6.00屈光度)的AUC更是达到了0.806。在临床统计学中,AUC超过0.8通常被认为是具有很高区分能力的优秀预测指标。
我们不妨通过极端的对比来更直观地感受这把“基因尺子”的威力。如果根据RE-PRS得分将人群分为一百等份,处于分数最低的1%区间(即近视遗传风险极高)的人群中,有高达84%的人患有近视,其中35%是高度近视。相比之下,处于分数最高的1%区间的人群中,仅有3%患有近视,高度近视几乎绝迹。两组之间的近视发生率相差整整28倍。
有趣的是,基因的馈赠往往伴随着代价。那些不容易得近视的人,面临着另一种风险。数据表明,PRS得分最高的1%人群,其患远视(高于+1.00屈光度)的风险是中位数人群的10.2倍;而他们在近视方面的风险比值比仅为0.07,这意味着与普通人相比,他们拥有14.3倍的近视“保护力”。这种精准的风险分层能力,使得RE-PRS不再仅仅是一个统计学玩具,而是有望成为临床眼科医生手中的一把利器,用于在生命早期筛选出真正需要严密监控的高危群体。
追踪时间的轨迹:基因的低语如何随岁月回响?近视并非一蹴而就,它是一个随时间演变的动态过程。基因,这串看似静态的代码,是如何在漫长的岁月中持续发挥作用的呢?
为了探究这个问题,研究人员引入了“开始戴眼镜的年龄”(Age of onset of spectacle wear, AOSW)这一极具参考价值的临床指标,作为屈光不正发病时间的替代测量。数据分析呈现出一个清晰的上行趋势:随着RE-PRS得分的升高(近视风险降低,远视风险升高),戴眼镜的起始年龄也在不断推迟。在风险最高的第一个十分位组,人群戴眼镜的年龄中位数为15岁;而在风险最低的第十个十分位组,这个数字被推迟到了惊人的42岁。生存分析(Survival analysis)的曲线也描绘了类似的故事:低PRS组(高近视风险)的累积发病风险曲线十分陡峭,表明他们不仅近视发病率高,而且发病年龄极早。
这引发了另一个深层次的问题:基因对视力的影响,是一成不变的,还是随着个体的发育阶段而波动的?
一项针对长期追踪队列(ALSPAC)的纵向分析给出了答案。研究发现,PRS的预测准确率并不是恒定的,而是随着年龄的增长而稳步攀升。在儿童12个月大时,PRS仅能解释1.9%的屈光变异;到了7岁,这个数字增长到5.3%;10岁时达到8.6%;而到了15岁,PRS已经能够解释10.2%的变异。此外,PRS还能显著预测7岁到15岁之间屈光度的恶化程度。这些数据强有力地暗示,屈光不正的基因效应具有年龄依赖性,或者说,这些基因在儿童和青少年的眼球发育关键期,与环境风险因素发生了密集的“化学反应”。
对于临床医生而言,早期识别出可能发展为高度近视的儿童是重中之重,因为高度近视是导致各种致盲性眼病的核心推手。以往的研究认为,发病年龄是预测高度近视的最强指标。在这项研究中,研究人员将传统的发病年龄(AOSW)与前沿的基因评分(RE-PRS)进行了“强强联手”。
数据给出了令人振奋的反馈:仅凭AOSW预测高度近视的AUC为0.883,仅凭RE-PRS预测的AUC为0.806;但当两者结合时,预测模型的AUC跃升至0.920。统计学检验(P = 6.1 × 10^-140)证实了这种结合带来的预测性能提升是极其显著的。
尽管记录发病年龄是有效的方法,但它依赖于个人的记忆,容易产生偏差;而基因组信息从出生那一刻起就已确定,不受记忆或后天环境的干扰。一个高精度的多基因风险评分,为我们提供了一种从生命原点就开始进行高危预警的可能性。
此外,研究人员并没有忽视环境的力量。通过模拟和分析,他们考察了教育年限和户外活动时间等环境因素的影响。有趣的是,数据提示这些环境风险因素与屈光不正之间并非简单的线性叠加,而是存在潜在的非线性交互作用。这意味着,对于携带高危遗传背景的个体而言,施加特定强度的环境干预(如增加户外暴露时间),或许能获得非同寻常的保护收益。
这场跨越170万人的基因解码之旅,以前所未有的分辨率向我们展示了屈光不正背后的遗传巨网。从独特的种族基因密码,到盘根错节的基因多效性;从随时间逐渐显露威力的多基因风险评分,到基因与环境的非线性博弈。
这些冷冰冰的数据背后,蕴含着一种医学理念的深刻转变:我们正在从被动地配镜矫正,迈向主动地基于个体遗传构架进行精准预防的新纪元。在未来,也许只需一滴唾液或一滴血液,我们就能提前预知视力的轨迹,并在不可逆的损伤发生前,按下干预的按钮。
参考文献
Cheng FF, Liu X, Mi H, Wang L, Ma R, Guo Y, Sidorenko J, Jiang C, Islam T, Meguro A, Hikino K, Ishikawa Y, Tang S, Li T, Chen R, Wang L, Mägi R, Metspalu A; Estonian Biobank Research Team; Takeuchi M, Mizuki N, Choquet H, Jin ZB, Chen G, Zhou K, Terao C, Zeng J, Yang J. Multi-ancestry genome-wide association analyses of refractive error augment genetic discovery and polygenic prediction. Nat Genet. 2026 Apr 20. doi: 10.1038/s41588-026-02576-0. Epub ahead of print. PMID: 42009823.
声明:本文仅用于分享,不代表平台立场,如涉及版权等问题,请尽快联系我们,我们第一时间更正,谢谢!