机器学习和AI是科学中令人兴奋的主题,它们有望提供更快,更准确的数据分析和新见解。但是,他们经常创建“黑匣子”模型,我们不容易理解或复制它们。由于科学依赖我们在以前的工作基础上的能力,因此这对未来很危险。
在一项新的研究中,John Innes中心信息学团队的Matthew Hartley博士和Tjelvar Olsson博士展示了我们如何能够提高依赖于深度学习(DL)模型的数据分析的长期可重复性。
DL技术是机器学习的一个子集,它利用人工神经网络,模拟真实神经元工作方式的模拟系统。在生物学中,DL已被应用于许多问题,例如细胞图像分割,基因组变异调用和转录因子结合位点预测。
本文提供了可重现模型开发的指南,以及该团队已开发的Python软件包dtoolAI。
“我们发现这些工具对于使我们自己的AI模型更易于理解和重新创建非常有用,我们希望其他人也能这样做,”约翰·英内斯中心信息学负责人Hartley博士说。
文章“ dtoolAI:深度学习的可再现性”出现在Pattern中。