建设科技

中药学论文_基于谱聚类的何首乌天然产物聚类

 

文章摘要:目的 对何首乌中的天然产物进行聚类分析,建立一种较为科学的天然产物的聚类方法,为后续化合物挑选、药理筛选提供技术指导。方法 从文献中收集并整理何首乌天然产物,选择二苯乙烯类、蒽醌类等主要类别化合物作为聚类对象,转换为简化分子线性输入规范(SMILES),并使用rdkit提取化合物的扩展连通性指纹和理化性质作为特征,经过方差筛选得到有效的特征。接着使用谱聚类算法,对何首乌天然产物进行聚类,以CalinskiHarabaz(CH)指数作为评估指标,优化聚类参数。参数优化完毕后,采用最佳参数对化合物进行聚类,分析各个类别的特点。随后对3种主要类别的化合物进行主成分分析,查看主要类别的空间分布。最后对主要类别化合物分别计算脂水分配系数和拓扑极性表面积,分析性质分布,验证聚类合理性。结果 从文献中挑选了13个类别的123个何首乌天然产物。经过特征提取和过滤,共得到207个特征。CH指数表明聚类数量为10,γ为0.004时聚类效果最佳。主成分分析显示3个主要成分组在空间中各自成簇,无重叠情况发生。经过聚类后,脂水分配系数和拓扑极性表面积2个指标倾向更加集中。结论 谱聚类算法不仅能够区分何首乌天然产物中差异较大的化合物,也能较好地对复杂化合物进行聚类,聚类结果具有一定的合理性,能够为传统药理筛选提供新的思路。

文章关键词:何首乌,天然产物,无监督学习,聚类分析,谱聚类,

项目基金:国家科技重大专项(2018ZX09735006),国家自然科学基金(81773874、81973476), 上一篇: 生物学论文_小管福寿螺SNP标记开发及其在物种
下一篇:没有了