几年前,当小希孟和志凯梁首次提出这个想法时,詹姆斯·施纳布尔(James Schnable)持怀疑态度。 至少可以说。
“'好吧,你可以尝试,但我认为它不会奏效,'”农学和园艺学副教授回忆说,当时是内布拉斯加大学林肯分校 Schnable 实验室的博士后研究人员孟和梁。
他错了,事后看来,他永远不会快乐。 然而当时,Schnable 有充分的理由扬起眉毛。 两人的想法 - 屈服于严霜的对寒冷敏感的作物的 DNA 序列可以帮助预测更狂野、更耐寒的植物如何忍受冰冻条件 - 似乎大胆。 至少可以说。 尽管如此,这是一个低风险、高回报的提议。 因为如果孟和梁能够让它发挥作用,它可能只是加快努力,使对冷敏感的作物有点甚至更像他们的抗寒作物。
世界上一些最重要的作物是在热带地区驯化的——墨西哥南部的玉米,非洲东部的高粱——没有对它们施加选择压力来进化抵御寒冷或冻结的能力。 当这些作物在更恶劣的气候下生长时,它们对寒冷的敏感性限制了它们可以种植的时间和收获的时间。 较短的生长季节意味着光合作用的时间较短,导致预计到 10 年将接近 2050 亿的全球人口的产量和粮食减少。
寒冷气候
与此同时,已经在寒冷气候中生长的植物物种进化出了抵御寒冷的技巧。 他们可以重新配置细胞膜以在较低温度下保持流动性,防止细胞膜冻结和破裂。 他们可以在这些膜内部和周围的液体中加入少量的糖,降低它们的冰点,就像盐对人行道的冰点一样。 它们甚至可以产生蛋白质,在这些晶体长成破坏细胞的团块之前,这些蛋白质会扼杀微小的冰晶。
所有这些防御都起源于基因水平,尽管不仅仅是 DNA 序列本身。 当植物开始冻结时,它们可以通过关闭或打开某些基因来做出反应——阻止或允许转录和执行它们的基因指导手册。 了解哪些基因耐寒植物在冰冻温度下关闭和开启,可以帮助研究人员掌握其防御工事的基础,并最终将类似的防御设计到对冷敏感的作物中。
但施纳布尔也知道,正如孟和梁所做的那样,即使是相同的基因,在不同的植物物种中,即使是密切相关的物种,对寒冷的反应也往往不同。 这意味着,令人沮丧的是,了解基因如何在一个物种中对寒冷做出反应往往会告诉植物科学家几乎没有关于该基因在另一个物种中的行为的结论。 反过来,这种不可预测性阻碍了学习决定什么将停用或激活基因的规则的努力。
“我们仍然非常非常不擅长理解基因为什么会关闭和开启,”Schnable 说。
玉米植物
由于缺乏规则手册,研究人员转向机器学习,这是一种基本上可以自己编写的人工智能形式。 他们专门开发了一个有监督的分类模型——当展示足够多的标记图像时,比如猫和非猫,这种模型可以最终学会区分前者和后者。 该团队最初展示了自己的模型,其中包含大量来自玉米的测序基因,以及当植物处于冰冻温度时这些基因的平均活性水平。 Schnable 说,该模型还为每个玉米基因输入了“我们能想到的每一个特征”,包括它的长度、稳定性以及它与在其他玉米植物中发现的其他版本之间的任何差异。
后来,研究人员通过在这些基因的一个子集中仅隐藏一条信息来测试他们的模型:它们是否对冰冻温度的开始做出反应,或者它们是否没有反应。 通过分析被告知有响应或无响应的基因特征,该模型识别出这些特征的哪些组合与每个基因相关——然后成功地将大部分剩余的神秘盒基因归入正确的类别。
毫无疑问,这是一个充满希望的开始。 但真正的考验仍然存在:该模型能否接受它在一个物种中接受的训练并将其应用于另一个物种?
答案是肯定的。 在仅使用来自六种物种中的一种——玉米、高粱、珍珠粟、黍、谷子或柳枝稷——的 DNA 数据进行训练后,该模型通常能够预测其他五种中的哪些基因会对冷冻做出反应。 令 Schnable 惊讶的是,该模型即使在对冷敏感的物种(玉米、高粱、珍珠或小米)进行训练时也能成立,但其任务是预测耐寒粟或柳枝稷的基因反应。
型号
“我们训练的模型在不同物种之间的效果几乎一样好,就好像你真的有一个物种的数据并使用内部数据对同一物种进行预测一样,”他说,几个月后他的声音中带着一丝好奇。 “我真的没有预料到这一点。”
“我们可以将所有这些信息输入计算机,并且它至少可以找出一些规则来做出有效的预测的想法,对我来说仍然有点令人惊讶。”
在考虑替代方案时,这些预测可能特别有用。 大约十年来,植物生物学家实际上已经能够测量活植物中每个基因产生的 RNA 分子的数量——负责转录和运输 DNA 指令的分子。 Schnable 说,但是比较活体标本和多个物种中基因表达对寒冷的反应是一项艰巨的任务。 对于野生植物来说尤其如此,它们的种子甚至很难获得。 这些种子可能不会按预期发芽(如果有的话),并且可能需要数年时间才能生长。 即使他们这样做了,每株植物都必须在相同的受控环境中种植,并在相同的发育阶段进行研究。
更多种类
所有这些都对从足够多的野生物种中培育出足够多的野生标本来复制和统计评估其基因对寒冷的反应构成了巨大挑战。
“如果我们真的想了解哪些基因是重要的——这实际上在植物如何适应寒冷中发挥作用——我们需要研究两个以上的物种,”施纳布尔说。 “我们想看看一组耐寒的物种和一组敏感的物种,并观察模式:“这个相同的基因总是对一个有反应,而对另一个没有反应。”
“这开始成为一项非常庞大且昂贵的实验。 如果我们能从这些物种的 DNA 序列中做出预测,而不是,例如,选取 20 个物种,并试图让所有物种处于同一阶段,让它们都经历完全相同的压力处理,那就太好了,并且测量每个物种中每个基因产生的 RNA 量。”
幸运的是,该模型的研究人员已经对 300 多种植物物种的基因组进行了测序。 正在进行的国际努力可能会在未来几年内将这一数字推高至 10,000。
尽管该模型已经大大超出了他的适度预期,但 Schnable 表示,下一步将涉及“说服我们自己和其他人”,相信它的效果与目前一样好。 在迄今为止的每个测试案例中,研究人员都要求模型告诉他们他们已经知道的事情。 他说,当人类和机器都从头开始时,最终的考验就会到来。
“我认为我们需要做的下一个大实验是对我们根本没有任何数据的物种进行预测,”他说。 “让人们相信它在我们也不知道答案的情况下确实有效。”
该团队在美国国家科学院院刊上报告了他们的发现。 Meng、Liang 和 Schnable 与内布拉斯加州的 Rebecca Roston、Yang Zhang、Samira Mahboub 和本科生 Daniel Ngu 以及山东农业大学的访问学者 Xiuru Dai 共同撰写了这项研究。
欲了解更多信息,请访问:
内布拉斯加大学林肯分校
www.unl.edu