传统摄像头在获取大范围复杂场景中的感兴趣目标时,容易出现目标物体丢失或遮挡等问题。为此,提出一种基于全景摄像头的柱面展开及运动目标实时跟踪算法。通过改进的柱面展开算法对360°摄像头获取的全景图像进行还原展开,解决全景图像中的成像扭曲问题。利用CamShift和Kalman预测相结合的算法跟踪运动目标。实验结果表明,在运动目标存在遮挡、短暂消失或同色物体干扰的情况下,该方法能实现对全景范围复杂环境中运动目标实时鲁棒的跟踪。
在心肌灌注核磁共振(MR)图像中,病人的呼吸和心跳会使心脏的位置和形状发生改变,因此需要对心脏核磁共振(CMR)时间序列图像中的心肌图像位置进行运动补偿。针对医学图像特征较少的问题,利用马尔科夫随机场(MRF)模型,提出一种基于图像配准的心脏运动补偿算法。根据心动周期不同时间点图像像素块的邻域和灰度信息,计算心脏的运动向量,将最相似的像素块平移到图像的相近位置,对心跳产生的位移进行补偿。由于MRF模型的计算量较大,将CPU算法和GPU算法相结合,计算耗时部分使用GPU并行实现,以提高程序的运行速度。实验结果表明,该方法能有效地对心肌灌注MR图像中心脏的位移和弹性形变进行补偿,结合GPU算法能使运动补偿算法的计算性能提高400%,图像配准时间仅为CPU算法的1/3。
针对实际人脸图像中含有重尾噪声的问题,提出一种基于混合Kotz-型分布的多分类人脸识别方法。利用Kotz-型分布与广义逆Γ分布混合表现出的较厚拖尾特性,结合核方法和概率统计知识,通过调节混合Kotz-型分布中的参数,估计人脸图像中重尾噪声的拖尾情况。分别向ORL人脸库、Yale人脸库、Randface人脸库添加程度不同的重尾噪声,形成新的含有不同程度重尾噪声的人脸库,通过对3个人脸库进行验证,结果表明,该方法能较好地估计人脸图像的拖尾特性,对含有重尾噪声的人脸图像有较高的识别率。
为提高实时以太网通信性能和数据帧发送成功率,提出一种基于随机优化理论的实时以太网数据传输优化策略。对实时以太网传输状态进行分析,计算每种状态之间的转移概率,得到状态转移概率矩阵,通过求解平稳状态方程确定以太网处于每种状态的概率,并计算数据帧发生碰撞后每次重传成功概率,以数据帧发送成功率最大为目标函数,对节点发送速率进行优化。实验结果表明,与现有方法相比,该策略在网络传输成功率和吞吐量方面最多提高50.4%和23.4%,在端到端平均延时上也有所改善。
Mel频率倒谱系数(MFCC)与线性预测倒谱系数(LPCC)融合算法只能反映语音静态特征,且LPCC对语音低频局部特征描述不足。为此,提出将希尔伯特黄变换(HHT)倒谱系数与相对光谱-感知线性预测倒谱系数(RASTA-PLPCC)融合,得到一种既反映发声机理又体现人耳感知特性的说话人识别算法。HHT倒谱系数体现发声机理,能反映语音动态特性,并更好地描述信号低频局部特征,可改进LPCC的不足。PLPCC体现人耳感知特性,识别性能强于MFCC,用3种融合算法对两者进行融合,将融合特征用于高斯混合模型进行说话人识别。仿真实验结果表明,该融合算法较已有的MFCC与LPCC融合算法识别率提高了8.0%。
概率模型是解决不确定性推理和数据分析的有效工具。针对本体匹配的不确定性,提出一种基于马尔科夫网的本体匹配改进算法。采用多种传统匹配算法计算相似度矩阵,改进相似度传播规则,添加2种结构稳定性约束规则和1种Disjoint一致性约束规则,定义其对应团的势函数。根据相似度矩阵和上述规则,给出马尔科夫网的构造方法,使用循环置信度传播算法计算随机变量的后验概率,依据后验概率得到最后的本体匹配结果。在OAEI 2010数据集上进行实验,结果表明,与iMatch本体匹配系统相比,该算法能有效降低概率模型的复杂度,提高本体匹配的准确率和召回率。