中文大学(CUHK)计算机科学与工程系(CSE)的研究团队开发了新的基因表达嵌入框架(GEEK),该技术将人工智能技术用于机器学习和自然语言处理中,以进行研究基因表达的调节。与以前的研究一次只关注一种或几种监管机制相比,该新框架可以同时研究多种机制的共同作用。描述这项新研究的研究文章已发表在著名的国际科学杂志《自然机器智能》上。该框架可以帮助研究癌症的原因和治疗方法。
每个人体都包含数十万亿个细胞。尽管它们大多共享相同的DNA序列,但它们的基因活性却可以明显不同。这种活动称为“基因表达”,受许多调节机制的影响,例如转录因子结合和蛋白质相互作用。2017年,中文大学中学会考的叶凯文教授及其研究团队研究了涉及调控元素的一种机制,称为增强子。他们研究了增强子与基因表达之间的关系,并将结果应用于发现可能与肝癌相关的三个基因。该研究和其他类似研究仅考虑了单个基因调控机制,因此无法完全理解不同机制之间的复杂相互作用。
叶教授用一个比喻来解释基因调控机制之间的复杂关系。他说:“如果您无法使用遥控器打开电子设备,则似乎控制器有问题,但问题还可能在于接收器或两者之间的兼容性问题。如果我们有工具,可以同时分析不同的组件,因此更容易找出问题的根本原因。”
叶教授的团队提出的GEEK框架利用了机器学习和自然语言处理方法,将基因视为“单词”,以捕获它们在“句子”中的关系。在已发表的研究中,GEEK用于研究多种多样的基因调控机制,包括三维基因组结构中的接触,蛋白质相互作用,基因组邻域和广泛的染色质可及性域。结果表明,一起建模这些机制比单独考虑时,能更好地解释基因表达。
癌症是由导致异常细胞增殖的突变引起的。叶教授说:“ GEEK代表了一种研究基因在不同类型的细胞(包括癌细胞)中表达的新颖方法。” “我们将与医学专家密切合作,尝试使用GEEK解释肝癌的某些原因。从长远来看,我们希望将我们的研究扩展到其他癌症类型,并为开发新的预防和治疗方法做出贡献。”
在癌症治疗中,免疫疗法由于在某些类型的癌症中具有更高的功效而受到了广泛的关注。然而,治疗结果因患者而异。叶教授希望将来可以使用人工智能来预测患者对免疫疗法的反应,从而提高治疗精度并减轻患者负担。