研究人员在哺乳动物基因组中发现了数千个未知 DNA 序列
最近審查:30.06.2025

对29种哺乳动物基因组进行的大规模比较研究,或将导致人类基因组功能和组织原理的修订。科学家们已成功直接观测到基因中的“暗物质”,而其存在长期以来一直被怀疑。此前对人类和小鼠DNA进行比较的研究,间接得出结论:存在大量调控序列,它们本身并不编码蛋白质,而是控制着其他基因的活性。然而,与已知和已鉴定的调控序列不同,它们的存在仍停留在假设的层面。正因如此,它们被称为“暗物质”:它们必然存在于某个地方,只是至今无人能够观测到。
美国麻省理工学院的一支研究团队与来自世界其他科研中心的同事合作,成功实现了这一目标。他们历时五年,对29种胎盘哺乳动物(包括人类、大象、兔子、蝙蝠等)的基因组进行了测序和比对。其中20种哺乳动物的基因组DNA序列首次被获得。首先,科学家们对那些物种间变化不大的序列很感兴趣。正是这些区域的高度保守性使他们怀疑调控序列的存在。
最终结果如下:发现了10,000个高度保守的序列,它们直接影响基因活性,其中1,000多个序列是合成结构复杂的调控RNA的基础。科学家还发现了270万个位点,这些位点是与转录因子相互作用的潜在靶点,决定了基因在何时何地起作用。此外,还发现了4,000个新的编码序列,其中包含与蛋白质相关的信息。必须指出的是,尽管人类基因组已被完全解读,但许多DNA序列的功能仍不清楚。仅凭一个基因组,几乎不可能确定哪个位点本身编码蛋白质,哪个位点执行调控功能。但与其他基因组相比,这样的任务是完全可以解决的。
研究人员已经能够在分子水平上追踪哺乳动物一亿年来的进化历程。生物体对不断变化的环境条件的适应性体现在基因组调控的变化中,体现在那些“暗物质”(现在已经不那么“暗”)的配置和活性上。例如,现在可以找出哪些基因将猿类变成了人。此前,大约有200个基因;其中一些负责大脑发育和肢体结构。如今,DNA中此类序列的数量已增加到1000个。
医学也必须面对新的时代。大量疾病与DNA编码区突变直接相关:这些突变会破坏蛋白质本身的结构。但更多的疾病是由基因活动调控的紊乱引起的——蛋白质开始在不该合成的地方合成,或者合成地点不对,或者合成量不足以满足需求。因此,现在,有了一张全新、详细且扩展的基因组调控元件图谱,我们将能够确定许多疾病的真正病因。