Null

记号系统使科学家能够更容易地通信聚合物

类别: 学院, 澳门现金赌场新闻, 研究

bigsmiles语言表示通过ASCII字符串更复杂的分子结构。

具有紧凑而可靠的结构为基础的标识符或表示为分子结构系统是用于研究界内的结果的有效共享和传播的关键使能因素。这样的系统也放下了机器学习和其他数据驱动的研究的必要基础。而重大进展已经进行了小分子,聚合物社区一直在努力在未来与一个有效的表示系统。

为小分子,其基本前提是,每个不同的化学物种对应于良好定义的化学结构。这并不适用于聚合物。聚合物是本质是经常与化学结构的分布合奏随机分子。这种困难限制了小分子开发的所有确定性交涉的适用性。在一份文件中公布的七重峰12 ACS中央科学,研究人员在澳门现金赌场,杜克大学和西北大学的报告中新的表述系统,该系统能够处理聚合物的随机性质,称为bigsmiles。

“bigsmiles解决了聚合物的数字表示显著的挑战,解释说:”康纳博士科莱'19,论文的共同作者。 “聚合物几乎都是多重的化学结构,通过随机过程产生的乐团,所以我们不能使用相同的策略,写下自己的结构为小分子。”

合着者科莱;化学工程布拉德利d副教授。奥尔森在澳门现金赌场;沃伦ķ。化学工程klavs的F·刘易斯教授。詹森在澳门现金赌场;化学朱莉娅的助理教授。 kalow西北大学;化学副教授 耶利米。约翰逊 在澳门现金赌场;威廉吨。化学斯蒂芬升米勒教授。克雷格在杜克大学;研究生在西北大学艾略特树林;研究生在杜克大学的学生王紫;在澳门现金赌场研究生王骢;研究生海利ķ。榉木在澳门现金赌场;客座研究员荣信用濑在澳门现金赌场;和研究生tzyy,祥霖在澳门现金赌场。

有几个线符号是最流行的通信的分子结构,以简化分子线性输入规范(微笑)。微笑被普遍认为是最可读的变型,与目前最广泛的软件支持。在实践中,微笑提供一组简单的适合作为标签化学数据和作为用于研究人员之间的数据交换的存储器紧凑标识符表示。作为一个基于文本的系统,笑容也是天作之合许多基于文本的机器学习算法。这些特点都取得了微笑翻译化学知识为机器友好形式的完美工具,并已成功应用于小分子性能预测和计算机辅助综合规划。

聚合物,但是,已经通过这个和其他结构语言抵制描述。这是因为诸如微笑大多数结构语言已经被设计来描述的分子或化学片段被明确定义的原子论图表。由于聚合物是随机的分子,它们不具备的独特的微笑表示。这种缺乏高分子材料统一的命名和标识约定的是主要障碍减慢聚合物信息学领域的发展方向之一。而在聚合物情报的努力开拓,如聚合物基因组计划已经证明,在聚合物情报笑容扩展的实用性,新的化学和材料信息学和数据驱动的研究迅速发展的快速发展做出了普遍适用的必要性命名为重要的聚合物约定。

“机器学习提供了一个巨大的机遇,加快发展化学和发现,”林他,对化学国家科学基金会(NSF)事业部代理副处长说。 “这个标记结构扩展工具,专门设计,以解决固有的聚合物的独特挑战,极大地增强了化学结构数据的可搜索性,并且使我们更接近了一步利用数据革命”。

研究人员创建了一个新的结构为基础的结构作为除了非常成功的微笑表示可以治疗高分子材料的随机性。因为聚合物是高摩尔质量的分子,该构建体被命名为bigsmiles。在bigsmiles,聚合物片段是通过重复由大括号括单元的列表表示。的重复单元的化学结构是使用正常笑容语法进行编码,但是具有附加的键合描述符指定的重复单元是如何不同的连接以形成聚合物。这个简单的语法的设计将使大分子的编码在宽范围的不同化学,包括均聚物,无规共聚物和嵌段共聚物,以及各种分子连接的,从线性聚合物的响聚合物甚至支化的聚合物。在微笑,bigsmiles表示是紧凑的,自包含的文本字符串。

“与bigsmiles规范聚合物结构的数字表示将鼓励聚合物数据的共享和聚合,提高模型的质量随着时间的推移和加强其使用的好处,”杰森·克拉克说,这些材料在开放创新引领可再生化学品和材料的Braskem公司,谁没有与研究有关。 “bigsmiles是该领域的贡献显著,它解决了一个灵活的系统表示复杂的聚合物结构数字的需要。”

克拉克补充说,“在循环经济的环境下面临的塑料行业所面临的挑战始于原材料的来源和继续通过结束寿命管理的所有道路。应对这些挑战需要基于聚合物的材料,这在传统上从漫长的开发周期所受的创新设计。在人工智能和机器学习进步显示了承诺,加快利用金属合金和有机小分子,激励塑料行业寻求并行方法应用的开发周期。” bigsmiles数字表示由应用推动的结构 - 性能关系的评价数据科学的方法,他说,最终加速收敛到聚合物结构或组合物,这将有助于实现循环经济。

“复杂的聚合物结构的多个可以通过三个新的基本运算符和原始微笑符号组合物构成,”奥尔森说,“化学,材料科学和工程的整个领域,包括高分子科学,生物材料,材料化学,和多生物化学,是基于其具有随机结构的大分子。这基本上可以看作是怎么写大分子结构的新的语言“。

“的事情,我感到很兴奋之一是如何将数据输入最终可能直接关系到用于制造特定的聚合物,合成方法”克雷格说,“正因为如此,有实际捕捉机会和处理更多关于除了分子信息是通常可从标准表征。如果可以做到这一点,它将使各种发现的“。

这项工作是通过中心分子优化网络的化学资助的美国国家科学基金会,一 美国国家科学基金会中心的化学创新。