为克服传统关键词提取算法局限于字面匹配、缺乏语义理解的缺点,提出一种基于语义的中文文本关键词提取(SKE)算法。将词语语义特征融入关键词提取过程中,构建词语语义相似度网络并利用居间度密度度量词语语义关键度。实验结果表明,与基于统计特征的关键词提取算法相比,SKE算法提取的关键词能体现文档的主题,更符合人们的感知逻辑,且算法性能较优。
联邦学习作为新兴的分布式学习框架, 允许多个客户端在不共享原始数据的情况下共同进行全局模型的训练, 从而有效保护了数据隐私。然而, 传统联邦学习仍然存在潜在的安全隐患, 容易受到中毒攻击和推理攻击的威胁。因此, 为了提高联邦学习的安全性和模型性能, 需要准确地识别恶意客户端的行为, 同时采用梯度加噪的方法来避免攻击者通过监控梯度信息来获取客户端的数据。结合恶意客户端检测机制和本地差分隐私技术提出了一种鲁棒的联邦学习框架。该算法首先利用梯度相似性来判断和识别潜在的恶意客户端, 减小对模型训练任务产生的不良影响; 其次, 根据不同查询的敏感性以及用户的个体隐私需求, 设计一种基于动态隐私预算的本地差分隐私算法, 旨在平衡隐私保护和数据质量之间的权衡。在MNIST、CIFAR-10和MR文本分类数据集上的实验结果表明, 与3种基准算法相比, 该算法在准确性方面针对sP类客户端平均提高了3百分点, 实现了联邦学习中更高的安全性水平, 显著提升了模型性能。
针对现有的版面分析算法对参数的敏感性以及弱适用性等缺陷,提出基于SVM区域构造的复杂中文文档版面分析算法。该算法通过选取最能代表区域字符特征的连通区(种子连通区)作为测试的第一特征,利用具有强学习和泛化能力的支持向量机实现区域构造,在构造的区域中运用投影快速判断文档阅读顺序。实验结果表明,该方法具有更好的适应性,对复杂的中文版面有满意的分析结果。
研究足式机器人行走过程的稳定性优化控制策略,设计一种基于机器人上身平台振动加速度为反馈的小腿减振控制系统。通过虚拟仿真分析软件——机械系统动力学自动分析构建足式机器人小腿虚拟样机,并导入到Matlab中进行主动减振的自抗扰控制算法设计,根据主动和被动减振分别抑制低频和高频振动。仿真结果表明,主被动联合减振大幅衰减了机器人上身平台的振动,弥补被动减振对低频振动无法抑制的情况,有效提高了机器人行走的稳定性。
分析汉字结构特征及其演变,在汉字字库及汉字识别目标变化的基础上,结合汉字识别过程,研究与比较贝叶斯决策、二次判别函数法、隐马尔科夫模型、神经网络分类器以及支持向量机这5种汉字识别方法的优缺点及适用范围。结果表明,汉字识别方法仍需要在识别目标及特征提取、训练字符集准备方面进行改进。
随着基于MapReduce模型的应用程序越来越多,Hadoop性能取决于应用程序。针对上述特性,从应用着手剖析Hadoop存在的局限和不足,提出解决方案,利用作业和任务的多重并发平衡磁盘和网络带宽,减小瓶颈出现的可能性,提高系统性能。
为在现场可编程门阵列(FPGA)中实现快速高精度除法,在传统的倒数除法的基础上,提出一种改进算法。对倒数求解采用泰勒级数展开结合优化搜索逼近,求出各个分区间内的拟合一次两项式,再通过一次牛顿迭代提高精度。时序仿真结果表明,以该算法构建的除法器易于在FPGA上实现,时延仅为6个时钟周期,能达到2-34的有效精度和86.95 MHz的工作频率。
直接将ElGamal签名方案移植到椭圆曲线密码系统上会出现未定义的两点相乘运算。为解决上述问题,改进签名生成及验证过程,使用代数运算代替椭圆曲线上的数乘运算,给出改进算法的可行性证明及安全性分析。对MV加密算法进行改进,降低其膨胀率,通过实验证明其执行速度快于RSA和ECC-E算法。执行效率及密钥长度方面的优势使2种改进算法能更有效地应用于智能卡计算中。