本文为奇点原创文章(公众号:geekheal_com)
2020 年世界睡眠日的主题是“Better Sleep, Better Life, Better Planet” (更好的睡眠,更好的生活,更好的星球),强调睡眠作为健康支柱的重要地位,并通过健康的睡眠可以改善生活质量。在过去的几十年中,人类探索影响睡眠的深层次原因的研究也走过了一段非比寻常的历程。今天我们就来和大家一起回顾一下在睡眠——这一占据每个人1/3 生命的独特生理现象的遗传学研究历程。
早期的睡眠遗传学研究以往普遍认为,健康的睡眠主要是受到文化、社会、经济和环境的影响,但是随着遗传学的出现及研究手段的进步,科学家逐渐发现基因遗传因素同样响着我们的睡眠时间和睡眠质量。早在 1937 年开始,就有研究发现相比于异卵双胞胎,同卵双胞胎之间睡眠参数具有更高的一致性。科学家陆续发现许多基因的突变或变异都与睡眠相关,因此人们逐渐意识到就像很多慢性病一样,大部分睡眠障碍也属于遗传性疾病,准确的说是复杂遗传疾病。例如嗜睡症,患有这种嗜睡症的犬一旦兴奋或者激动,就会马上入睡。当发现最初病例呈现家系集中发病特点时,斯坦福大学的 William C. Dement 教授就坚信这是一种基因相关的遗传病。
William C. Dement 教授 (右) 及和他研究患有嗜睡症卡宾犬
全基因组关联分析(GWAS)与睡眠研究
2001 年加拿大蒙特利尔大学的 Guy Rouleau 博士选择了一个庞大的法裔加拿大的不宁腿综合症患者家系,采用微卫星标记连锁分析的方法,第一次尝试从全基因组角度分析睡眠障碍疾病领域的相关基因,但很遗憾的是没能鉴别到特定基因。
直到全基因组关联研究(GWAS)的大潮的来临,不宁腿综合征的研究才再次取得突破。全基因组关联研究 ,最早通过 SNP 芯片对病例及对照样本进行全基因组范围内的 SNP 分析,再根据连锁不平衡 (Linkage Disequilibrium, LD) 关系,找到与性状相关易感基因。迄今为止,人类的基因分型工作已经确定了数千种基因变异与疾病或性状之间的关联,绘制出了群体内部独特变异的图谱。基因芯片是评估人类基因组中已知标记的理想平台,使研究人员能够在数百万个标记中发现单核苷酸多态性 (SNP) 或较大的结构变化。
Kári Stefánsson – 冰岛 deCODE Genetics 公司 CEO 2006 年 5 月,deCODE Genetics 的遗传学家 Kári Stefánsson 带领其团队借助 illumina 31 万个 SNP 的基因芯片分析了近 16,000 名冰岛人的基因组分型数据,其中包括 306 名不宁腿综合症患者。该项研究最终通过全基因组关联系分析 (GWAS) 找到 BTBD9 基因变异与病症存在显著相关性,并且他们随后在The New England Journal of Medicine 发表的文章中报道,根据这项研究统计 BTBD9 基因变异占欧洲的不宁腿综合征患者数量的 50% 左右。巧合的是,与此同时德国慕尼黑的一个研究团队也发现了 BTBD9 这个基因与疾病的相关性。两项研究发表后,Science期刊都将两个团队的研究成果评价为不宁腿综合征研究“向前迈进的重要一步”。早期——源于消费级基因检测的群体睡眠研究 GWAS 首次成功用于不宁腿综合症研究,极大鼓舞了全球范围内从事睡眠障碍研究的科学家们,包括嗜睡症、阻塞性睡眠呼吸暂停综合症等一系列研究纷纷取得突破。与此同时,随着消费级基因检测的兴起, 23andMe 借助基于全基因组测序数据设计的更高密度 SNP 位点的基因芯片,这一极具性价比的分析工具,来完成大规模消费者基因检测与解读,并加以整理分析利用,进而助力健康研究以及生物医药创新。也正因为如此,在 NGS 成为基因组学主流研究手段的今日,SNP 芯片依然是各类大型群体遗传学项目的重要研究工具。
2016 年, 23andMe 利用其庞大的客户 DNA 数据库,对超过 8.9 万个人的遗传数据信息进行了一项大型针对晨型人(Morningness,即习惯早起人群)全基因关联研究,确定了 15 个与习惯早起的人群显著相关的基因位点,而且发现了其中有 7 个是先前被确定在昼夜节律中起关键作用的基因。23andMe 调查的数据结果表明:60 岁以上的老人更习惯早起;早起的人发生失眠或嗜睡的几率更小;与那些习惯熬夜的人相比,早起的人患有抑郁症的风险也更低。在对年龄和性别数据进行校正后还发现,习惯早起的人比习惯熬夜的“夜猫子”身体质量指数 (BMI) 更加接近健康水平。
习惯早起的人群 GWAS 曼哈顿图
NGS 时代的睡眠多组学(Multi-Omics)研究
随着新一代测序技术(NGS)的成本逐年下降,研究人员能够探究与任何生物的基因组、转录组或表观基因组相关的几乎所有问题。无论是大规模全基因组测序,单细胞测序,表观遗传学还是微生物宏基因组研究,目前花样繁多的 NGS 测序方法被应用到了人类健康的研究的方方面面,尤其在针对群体型样本的大规模研究中。在 2019 年,23andMe 再次和 UK BioBank 合作了迄今为止最大的失眠相关基因组研究项目,涉及样本高达 133 万,含盖多个种群。通过这项有史以来最大规模的失眠 GWAS 研究,科学家发现 202 个基因位点与夜晚失眠显著密切相关。与此同时,这次大规模群体遗传学的样本优势,也为进一步解释 GWAS 所发现的 SNP 位点与失眠相关性提供了依据,并通过对 GWAS 发现的 SNP 的效应值以及 Meta 分析,作者建立针对失眠的多基因风险评分(Polygenic Risk Score)模型,来实现对人群中的失眠症患者给予更好的预测,并将睡眠障碍与其他一系列精神类障碍进行了关联研究。
失眠与其他睡眠相关的精神和代谢特征遗传性重叠
借助对模式动物小鼠的单细胞 RNA 转录组测序数据发现,对这些遗传变异的广泛功能注释,最终将失眠的遗传因素指向了与运动行为密切相关的基因,在脑中的屏状核、下丘脑、纹状体和中型多棘神经元这些特定的神经元细胞类型中,失眠相关基因都存在特异性表达的情况。
2019 年 11 月,哈佛大学医学院的 Susan Redline 教授分析了美国 TOPMed 项目的 487 人全基因组测序(WGS)数据。通过定位之前在 132 个家系中具有连锁分析证据的染色体 8p23 上基因区域,他们发现在DLC1基因中就有 57 个 SNP 位点会影响到睡眠期间的体内血氧水平。这项研究是基于该课题组以往大量生物样本基因分型的工作积累之上展开的,在 GWAS 和家系连锁分析数据的指引下,即使较少数量的全基因组测序数据,也能够识别出复杂性状相关的特定罕见低频变异。通过反向变量加权评估和孟德尔回归分析,作者利用 GTEx 数据库中的DLC1变异位点构建孟德尔随机化 (Mendelian randomization) 分析方法,结果说明成纤维细胞的DLC1基因修饰方式与睡眠时血氧水平变化之间存在潜在的因果关系。遗传变异、基因表达和甲基化等多实验也都支持 DCL1 与睡眠期间的平均动脉血氧饱和度的相关性。
克利夫兰家系研究中 8 号染色体上与平均动脉血氧饱和度的连锁证据
鉴于微生物种群在与睡眠障碍相关疾病发生中的相关作用,人们对肠道微生物种群与睡眠相互影响的兴趣日益增加。已经有 16S 微生物测序的研究表明,由作息时间节律紊乱会引起影响人类肠道菌群功能及其相互作用。但要为临床干预相关疾病进行可能的微生物疗法提供依据,还需要更大规模的长期干预实验和更多实验研究数据的支持。
2018 年,Achim Kramer 和他的同事利用机器学习开发了一种称为 BodyTime 的诊断工具,该方法从血样中采集血液单核细胞的 RNA 转录组测序数据来确定个体的即时昼夜节律,再根据患者的昼夜节律生物钟表型诊断而改善患者的睡眠质量,并提供个性化医学诊断和药物治疗的辅助功能。
同样也有研究者将目光聚焦在了表观遗传学层面。妇女健康倡议研究 (Women’s Health Initiative) 和动脉粥样硬化多种族研究 (Multi-Ethnic Study of Atherosclerosis) 大型前瞻性队列研究体内血液全基因组 DNA 甲基化水平发现,失眠和作息时间紊乱会加速女性的体内表观遗传年龄衰老,从而影响体内免疫系统功能,引发多种疾病对身体健康造成不利影响。
展望近年来,还有很多上述未提及的遗传学大型队列的研究让我们对睡眠相关遗传疾病发生的分子机制有了更深入的理解。由于在我们现代社会中社交时差,工作换班,晨起和熬夜引起昼夜节律失调已经相当普遍。如要准确评估睡眠障碍相关基因变异与实际睡眠质量之间的关系,还有许多非遗传因素需纳入考虑,所以多组学研究将是未来的睡眠研究必经之路。随着基因组学检测技术成本降低以及各类群体遗传学项目所带来的丰富样本资源,诸如表观基因组关联分析以及空间转录组等新兴技术将会进一步帮助人类来解锁睡眠健康的奥秘。参考资料:
1. Lin, L., 1999. The Sleep Disorder Canine Narcolepsy Is Caused by a Mutation in the Hypocretin (Orexin) Receptor 2 Gene. Cell, 98(3), pp.365-376.
2. Desautels, A., 2001. Identification of a Major Susceptibility Locus for Restless Legs Syndrome on Chromosome 12q. The American Journal of Human Genetics, 69(6), pp.1266-1270.
3. Stefansson, H., 2007. A Genetic Risk Factor for Periodic Limb Movements in Sleep. New England Journal of Medicine, 357(7), pp.639-647.
4. Winkelmann, J., 2007. Genome-wide association study of restless legs syndrome identifies common variants in three genomic regions. Nature Genetics, 39(8), pp.1000-1006.
5. Mignot, E., 2007. A step forward for restless legs syndrome. Nature Genetics, 39(8), pp.938-939.
6. Hu, Y., 2016. GWAS of 89,283 individuals identifies genetic variants associated with self-reporting of being a morning person. Nature Communications, 7(1).
7. Liang, J., 2019. Sequencing Analysis at 8p23 Identifies Multiple Rare Variants in DLC1 Associated with Sleep-Related Oxyhemoglobin Saturation Level. The American Journal of Human Genetics, 105(5), pp.1057-1068.
8. Liu, Z., 2020. Acute Sleep-Wake Cycle Shift Results in Community Alteration of Human Gut Microbiome. mSphere, 5(1).
9. Wittenbrink, N., 2018. High-accuracy determination of internal circadian time from a single blood sample. Journal of Clinical Investigation, 128(9), pp.3826-3839.
10. Carroll, J., Irwin, M., Levine, M., Seeman, T., Absher, D., Assimes, T. and Horvath, S., 2017. Epigenetic Aging and Immune Senescence in Women With Insomnia Symptoms: Findings From the Women’s Health Initiative Study. Biological Psychiatry, 81(2), pp.136-144.
11. Li, X., 2019. Association between sleep disordered breathing and epigenetic age acceleration: Evidence from the Multi-Ethnic Study of Atherosclerosis. EBioMedicine, 50, pp.387-394.