北京大学学报(医学版) ›› 2018, Vol. 50 ›› Issue (2): 368-374. doi: 10.3969/j.issn.1671-167X.2018.02.028
瞿经纬1,吕肖庆1,2△,刘振明3,廖媛1,孙鹏晖1,王蓓1,汤帜1,2
QU Jing-wei1, LV Xiao-qing1,2△, LIU Zhen-ming3, LIAO Yuan1, SUN Peng-hui1, WANG Bei1, TANG Zhi1,2
摘要: 目的:为实现准确、高效的医药信息查询,本文探索了一种基于图结构的药物分子检索方法。方法:基于图结构的药物分子检索方法以接收智能终端的拍照或手绘作为输入,并将输入的结构式形式化为相应图结构,基于对图匹配效率的直接影响因素的分析,建立了结构式的一种紧凑有效的超图表示形式,其依据结构式的特点结合了子图匹配与频繁子图挖掘等方法对大图进行多级塌缩。为避免塌缩过程中子图交叠问题阻碍超图的准确构建,引入一种基于图同构的算法,借助子图之间交叠情况的分析,选择占优子图,利用多维度信息完成精确的分子匹配。结果:为证明检索方法的有效性,将本文检索方法和Wikipedia Chemical Structure Explorer(WCSE)进行检索准确率的对比,结果表明,本文方法的检索准确率更高,前10个检索结果的MAP(mean average precision)、DCG(discounted cumulative gain)、RBP(rank-biased precision)和ERR(expected reciprocal rank)四个指标均高于WCSE。上述指标的领先幅度分别为10%、1.41、6.42%、1.32%。进一步通过两个系统的具体检索结果实例对检索效果进行直观对比,发现本文方法在药物分子检索有效性方面更具优势,能为用户提供更为满意的检索结果。结论:本研究提出的基于图结构相似度的药物分子检索方法能够实现较为理想的检索结果,实验证明本检索系统具有可行性和有效性。
中图分类号:
[1] | 王斯维,黎敏,杨慧芳,赵一姣,王勇,刘怡. 3种生成大视野锥形束CT数据正中矢状面方法的比较[J]. 北京大学学报(医学版), 2016, 48(2): 330-335. |
[2] | 熊玉雪, 杨慧芳, 赵一姣, 王勇. 两种评价面部三维表面数据不对称度方法的比较[J]. 北京大学学报(医学版), 2015, 47(2): 340-343. |
[3] | 刘文龙, 王路漫, 贺东奇, 张天蓝, 苟宝迪, 李庆. 寡糖分子结构及其分形[J]. 北京大学学报(医学版), 2014, 46(5): 739-743. |
[4] | 姚艺桑, 高凌, 李玉玲, 马少丽, 吴子媺, 谈宁芝, 吴建勇, 倪陆群, 朱佳石. 丰度加权法分析冬虫夏草RAPD多态性高度差异及动态变化[J]. 北京大学学报(医学版), 2014, 46(4): 618-628. |
[5] | 霍长虹, 梁鸿, 林文翰, 赵玉英. 苯骈噁嗪酮类化合物的结构特征和谱学规律[J]. 北京大学学报(医学版), 2006, 38(3): 321-323. |
[6] | 郑璐, 吴刚, 王邠, 吴立军, 赵玉英. 合欢皂苷及苷元的分离鉴定[J]. 北京大学学报(医学版), 2004, 36(4): 421-425. |
[7] | 邹坤, 王邠, 赵玉英, 郑俊华, 张如意. 合欢皮中一个新的八糖苷[J]. 北京大学学报(医学版), 2004, 36(1): 18-20. |
[8] | 赵明, 王超, 彭师奇. 寡肽药物先导结构的发现与优化[J]. 北京大学学报(医学版), 2002, 34(5): 506-512. |
[9] | 王东升, 邱晓彦, 朱晓辉, 吕蓬, 姜南, 吕平, 张玲, 张岩, 高晓明. 人宫颈癌传代细胞Ig样蛋白的纯化分析[J]. 北京大学学报(医学版), 2000, 32(4): 310-312. |
|