首页 > 生活 >

新代码挖掘科学文章中的显微镜图像

发布时间:2024-04-11 15:26:56来源:

深度学习是人工智能的一种形式,它通过教导计算机使用模仿人脑的人工神经网络来处理信息,从而改变社会。它现在被用于面部识别、自动驾驶汽车,甚至用于玩围棋等复杂游戏。一般来说,深度学习的成功取决于使用大型标记图像数据集进行训练。

科学文献中蕴藏着潜在的标记图像金矿,每年发表超过一百万篇文章。大多数文本中都融入了许多图形。迄今为止,这些数字尚不适合深度学习模型。这在一定程度上是由于其复杂的布局造成的。每个图形通常包含多个嵌入的图像、图表和插图。还缺乏在文献中搜索与特定内容匹配的图像的适当方法。

为了应对这一挑战,美国能源部 (DOE) 阿贡国家实验室和西北大学的研究人员创建了 EXSCLAIM!软件工具。该名称代表图像的提取、分离和基于标题的自然语言注释。

研究结果发表在《模式》杂志上。

“电子显微镜产生的十亿分之一米的图像是材料科学文献中最重要的图像之一,”阿贡纳米材料中心(美国能源部科学办公室用户设施)的科学家玛丽亚·陈(Maria Chan)说。 “这些图像对于理解和开发许多不同领域的新材料至关重要。我们 EXSCLAIM! 的目标是释放这些成像数据的未开发潜力。”

什么设置 EXSCLAIM!其独特之处在于它对数据集查询方法的独特关注,类似于 ChatGPT 和 DALL-E 等生成式 AI 工具中提示的使用方式。因此,它能够从图形中提取具有非常具体内容的单个图像,因为它既可以对图像内容进行分类,又可以识别放大程度。然后它可以为每个图像创建描述性标签。这个创新的软件工具有望成为研究纳米级新材料的科学家的宝贵资产。

“虽然现有的方法常常难以解决复合布局问题,但 EXSCLAIM! 采用了一种新方法来克服这个问题,”主要作者、前阿贡国家实验室研究生 Eric Sc​​hwenker 说。 “我们的软件能够有效识别清晰的图像边界,并且擅长捕捉不规则的图像排列。”

声明!已经通过构建超过 280,000 个纳米结构图像的自标记电子显微镜数据集证明了其有效性。虽然最初是围绕材料显微镜图像开发的,但 EXSCLAIM!适用于任何产生大量带有图像的论文的科学领域。因此,该软件有望彻底改变各个学科已发表的科学图像的使用。

“研究人员现在拥有强大的图像挖掘工具来增进他们对复杂视觉信息的理解,”陈说。

免责声明:本答案或内容为用户上传,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 如遇侵权请及时联系本站删除。