作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2010, Vol. 36 ›› Issue (14): 24-25. doi: 10.3969/j.issn.1000-3428.2010.14.009

• 博士论文 • 上一篇    下一篇

基于计算听觉场景分析的混合语音分离

张 磊,刘继芳,项学智   

  1. 张 磊,刘继芳,项学智
  • 出版日期:2010-07-20 发布日期:2010-07-20
  • 作者简介:张 磊(1973-),女,副教授、博士,主研方向:语音信号处理,自然语言处理;刘继芳,硕士研究生;项学智,讲师
  • 基金资助:

    国家自然科学基金资助项目(60702053)

Mixture Speech Separation Based on Computational Auditory Scene Analysis

张 磊,刘继芳,项学智   

  1. ZHANG Lei, LIU Ji-fang, XIANG Xue-zhi
  • Online:2010-07-20 Published:2010-07-20

摘要:

基于计算听觉场景分析的理论,使用onset/offset线索完成混合语音分离研究。将经过外围模型处理后的数据,在时域和频域上分别检测并匹配onset/offset,利用时频图上的onset/offset信息合并片段,实现语音分离。通过对3类混合语料进行实验分析,得出onset/offset线索可以同时处理清音和浊音,对声音混合类型没有限制,能得到较好的分离效果。

关键词: 计算听觉场景分析, 起始和结束时间, 片段

Abstract:

Based on the principle of Computational Auditory Scene Analysis(CASA), this paper describes a model of speech separation by analyzing onset and offset of auditory events. The model detects onsets and offsets, and generates segments by matching corresponding onset and offset fronts. The model is evaluated with three kinds of corpus, evaluation shows that it can separate all the corpus with excellent performance.

Key words: Computational Auditory Scene Analysis(CASA), onset and offset time, segment

中图分类号: