近期,生物演化与环境科教融合中心的Norman MacLeod教授与来自希伯来大学生命科学学院的Liora Kolska Howritz教授合作完成的研究“Machine-Learning Strategies for Testing Patterns of Morphological Variation in Small Samples: Sexual Dimorphism in Gray Wolf (Canis lupus) Crania”在国际生物学期刊BMC Biology上发表。该研究使用少量以色列灰狼的头盖骨样本,对其独特的性双形现象进行了检测。研究对三种机器学习方法进行了横向比较,分别是针对头骨轮廓的椭圆傅里叶多元线性判别分析、朴素贝叶斯机器学习分析,以及针对完整头骨图像的嵌入式深度学习神经网络分析。
此项研究关注的是犬类驯化过程中不同阶段的形态变异这一重大主题,研究结果所涵盖的仅是其中的初始成果。在诸如此类的研究中,样本量稀少这一问题一直难以突破,许多具有重要科学意义的形态学信息就储存在这些少量个体组成的小样本中。在以往的研究中,只能依靠类似样本的拼合来达到充足的样本数,否则很难完成假设检验。但事实上,这些具有区域性特征的小数量样本往往非常珍贵,就算有其他地区的样本可与之合并,也会因样本地理分布范围的增加而造成空间均值分辨率的降低。此项研究中使用的方法,则成功地解决了这一问题。文中的方法和步骤,可用于区分微弱但高度结构化的组间形态差异,达到了前所未有的分辨率,并且具有高度普适性。
研究证明,对图像整体进行深度学习分析的方法远远优于对形态轮廓的椭圆傅里叶线性分析方法(主成分分析PCA和典型变量分析CVA)以及传统的机器学习方法(朴素贝叶斯法)。后两种方法中,研究对象的形态信息是通过对其平面几何形态的采集来实现的,得到的信息有限。而直接将图像作为形态学研究对象,可以很大程度上破除这些限制。进一步结合非线性深度学习分析,则可以准确揭示组间的结构化差异。 此研究揭示了简单有机形态中蕴含的生物学信息,也为博物馆小样本藏品的演化生物学、生物地理学、发育生物学等研究提供了有效的途径。
色列灰狼头盖骨背面及侧面的3D扫描图示
BMC Biology是Springer Nature旗下BMC系列的300多种开放获取、经过同行评审的期刊之一。它致力于共享科学、技术、工程和医学研究领域的发现,目前的影响因子(7.30)在整个动物科学和动物学期刊中排名第四。
文章链接:https://bmcbiol.biomedcentral.com/articles/10.1186/s12915-020-00832-1