基于复杂性K近邻规则的蛋白质亚细胞位点预测

doi:10.3969/j.issn.1000-3428.2007.07.010

计算机工程 ›› 2007, Vol. 33 ›› Issue (07): 28-29. doi: 10.3969/j.issn.1000-3428.2007.07.010

基于复杂性K近邻规则的蛋白质亚细胞位点预测

李斌1，李义兵2，何红波2

（1. 中南大学信息科学与工程学院，长沙 410083；2. 中南大学物理科学与技术学院，长沙 410083）

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2007-04-05 发布日期:2007-04-05

Complexity KNN Rules Based Prediction of Protein
Subcellular Locations

LI Bin1, LI Yibing2, HE Hongbo2

(1. School of Information Science and Engineering, Central South University, Changsha 410083;
2. School of Physics Science and Technology, Central South University, Changsha 410083)

Received:1900-01-01 Revised:1900-01-01 Online:2007-04-05 Published:2007-04-05

摘要/Abstract

摘要： 提出了一个基于符号序列LZ复杂性相似度和K近邻规则的蛋白质亚细胞位点类型预测的方法。相比许多其他特征参数，蛋白质序列的LZ复杂性相似度计算无需深入的生物学领域知识和除序列数据以外的其他辅助数据。同时，K近邻规则的延迟学习特性适合于亚细胞位点类型已知的蛋白质数据的动态增加。在标准的RH数据集上对该预测方法进行10重交叉验证，其总体的预测准确率优于4种对照预测方法。

关键词: 生物信息学, LZ复杂性相似度, K近邻, 蛋白质, 亚细胞位点

Abstract: A method to predict the subcellular location of proteins is proposed based on the LZ complexity similarity of symbolic sequences and K nearest neighbor rule. Compared to many other features, the calculation of the LZ complexity similarity between protein sequences requires little detailed field knowledge of biology, nor accessorial data besides the sequences of proteins. The lazy learning characteristic of the K nearest neighbor rule facilitates the prediction of protein subcellular location when the number of proteins, which subcellular location has been determined, increases dynamically. The proposed prediction method is tested on the standard RH dataset using a 10-Fold cross validation. The total precision of the proposed method is better than the results of other four contrast methods.

Key words: Bioinformatics, LZ Complexity similarity, K nearest neighbor(KNN), Protein, Subcellular location

李斌;李义兵;何红波. 基于复杂性K近邻规则的蛋白质亚细胞位点预测[J]. 计算机工程, 2007, 33(07): 28-29.

LI Bin; LI Yibing; HE Hongbo. Complexity KNN Rules Based Prediction of Protein
Subcellular Locations
[J]. Computer Engineering, 2007, 33(07): 28-29.

http://www.ecice06.com/CN/Y2007/V33/I07/28

[1]	李泽水, 冀俊忠, 杨翠翠. 基于边权重信息深度网络嵌入的PPIN功能模块检测[J]. 计算机工程, 2023, 49(8): 69-76.
[2]	王其涵, 庞建民, 岳峰, 祝迪, 沈莉, 肖谦. 面向申威架构的KNN并行算法实现与优化[J]. 计算机工程, 2023, 49(5): 286-294.
[3]	钱龙, 赵静, 韩京宇, 毛毅. 基于标签相关性的K近邻多标签学习[J]. 计算机工程, 2022, 48(6): 73-78,88.
[4]	田盼盼, 陈璟. 基于层次聚类的生物网络全局比对算法[J]. 计算机工程, 2022, 48(2): 65-71,78.
[5]	刘子巍, 骆曦, 李克, 陈富强. 基于k近邻的多尺度超球卷积神经网络学习[J]. 计算机工程, 2022, 48(11): 111-119.
[6]	武娇, 洪彩凤, 顾永春, 顾兴全, 金世举. 基于类邻域字典的线性回归文本分类[J]. 计算机工程, 2021, 47(8): 93-99,108.
[7]	李培媛, 黄迟. 基于CSPPNet与集成学习的人类蛋白质图像分类方法[J]. 计算机工程, 2020, 46(8): 235-242.
[8]	彭大芹, 李靖. 面向NB-IoT终端的指纹匹配定位改进算法[J]. 计算机工程, 2020, 46(3): 178-183,191.
[9]	李鹏, 闵慧, 罗爱静, 瞿昊宇, 伊娜, 许家祺. 改进的动态PPI网络构建与蛋白质功能预测算法[J]. 计算机工程, 2020, 46(12): 52-59.
[10]	李佳佳,臧寅旭,刘向宇,夏秀峰,朱睿. 面向时间依赖路网的空间索引方法[J]. 计算机工程, 2019, 45(5): 127-134.
[11]	梁聪,夏书银,陈子忠. 基于参考点的改进k近邻分类算法[J]. 计算机工程, 2019, 45(2): 167-172.
[12]	陈景年,胡顺祥,徐力. 基于异类近邻的支持向量机加速算法[J]. 计算机工程, 2018, 44(5): 19-24.
[13]	吴泽泰,蔡仁钦,徐书燕,吴小思,傅予力. 基于K近邻法的WiFi定位研究与改进[J]. 计算机工程, 2017, 43(3): 289-293.
[14]	齐向明,郑帅,魏萍. 基于Hadoop的微阵列数据两阶段并行K近邻基因提取[J]. 计算机工程, 2016, 42(5): 54-59.
[15]	周文剑,靳婷. Blogel-SPINAL:分布式PPI网络比对算法[J]. 计算机工程, 2016, 42(4): 209-214,220.

选择文件类型/文献管理软件名称

选择包含的内容

基于复杂性K近邻规则的蛋白质亚细胞位点预测

Complexity KNN Rules Based Prediction of Protein
Subcellular Locations

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于复杂性K近邻规则的蛋白质亚细胞位点预测

Complexity KNN Rules Based Prediction of Protein Subcellular Locations

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

Complexity KNN Rules Based Prediction of Protein
Subcellular Locations