[1]张焱,张杰,黄志同.基于一种听觉模型的特征提取及语音识别[J].南京理工大学学报(自然科学版),1998,(02):21-24.
 ZhangYan ZhangJie HuangZhitong.Feature Extraction and Speech Recognition Based on An Auditory Model[J].Journal of Nanjing University of Science and Technology,1998,(02):21-24.
点击复制

基于一种听觉模型的特征提取及语音识别()
分享到:

《南京理工大学学报》(自然科学版)[ISSN:1005-9830/CN:32-1397/N]

卷:
期数:
1998年02期
页码:
21-24
栏目:
出版日期:
1998-04-29

文章信息/Info

Title:
Feature Extraction and Speech Recognition Based on An Auditory Model
作者:
张焱张杰黄志同
南京理工大学信息学院, 南京210094
Author(s):
ZhangYan ZhangJie HuangZhitong
School of Information, NUST, Nanjing 210094
关键词:
语音识别 信号处理 听觉模型
Keywords:
phonet ic recog nit ion signal processing audito ry model
分类号:
TN912.34
摘要:
该文分析了人耳耳蜗及中枢听觉神经对声信号处理的机理,主要包括耳蜗对声信号的频率分析、柯蒂氏器官毛细胞的从振动机械能到电化学能的转换、听神经的侧抑制神经网络(LIN)和增益调整四个层次,建立各个层次上听觉的数学模型。模型的最终输出即为用于识别的语音特征。辨识实验结果也表明此听觉模型特征能较好地表征语音本质。
Abstract:
T his paper analyses the principle of speech sig nal pro cessing of human co chlea and audito ry ner ve. The fo ur stag es of pr ocessing include cochleaqs f requency analysis of sound, Organ of Cor tiqs ex chang ing f rom mechanical energ y to chemical ener gy , lateral inhibitory netw ork ( LIN) and g ain adjust ing . At every stage, mathemat ics models are given. The o utput of the last model is the featur e used for speech r ecognit io n ( SR) . The result of SR test show s that the feature ex t racted f rom this audito ry model r epresent s speech sig nal ex act ly .

参考文献/References:

1 杨行峻, 迟惠生. 语音信号数字处理. 北京: 电子工业出版社, 1995, 34~46
2 Shamma S A, Chadw ick R, Wilbur J. A Bio phy sical Mo del of Cochlea Pr o cessing : Intensity Dependence o f Pure T one Responses. J. Acoust. So c. Am, 1986, 80( 1) : 133~145
3 Yang Xiaow ei, Wang Kuansan, Samma S A. Auditor y Repr esentat ions of Aco ustic Sig nals. IEEE T ransactio ns o n Informatio n Theor y , 1992, 38( 2) : 824~ 839
4 胡守仁, 余少波, 戴葵. 神经网络导论. 长沙: 国防科技大学出版社, 1992, 201~205
5 林宝成, 黄志同. 基于听觉模型的子波变换语音处理. 数据采集与处理, 1995, 10( 4) : 269~274
6 张焱, 张杰, 张生平等. 基于听觉模型的鲁棒性语音识别. 见: 王炳锡. 语音图像与通信号处理第八届全国学术会议论文集. 郑州: 解放军信息工程学院, 1997. 106~109

相似文献/References:

[1]付卫红,杨小牛,曾兴雯,等.适用于通信侦察的信号盲分离算法[J].南京理工大学学报(自然科学版),2008,(02):189.
 FU Wei-hong,YANG Xiao-niu,ZENG Xing-wen,et al.Signal Blind Separation Algorithm Applying to Communication Reconnaissance[J].Journal of Nanjing University of Science and Technology,2008,(02):189.
[2]徐天成.基2FFT的二进制理论分析[J].南京理工大学学报(自然科学版),2000,(02):160.
 XuTiancheng.Binary Theoretical Analysis of FFT on Radix-2[J].Journal of Nanjing University of Science and Technology,2000,(02):160.
[3]杨亦春,程翔,陈庆生.提高时延估计精度的方法研究[J].南京理工大学学报(自然科学版),1999,(06):514.
 YangYichun ChengXiang ChenQingsheng.Methods of Improving Time delay Estimation Accuracy[J].Journal of Nanjing University of Science and Technology,1999,(02):514.
[4]张焱,张杰,黄志同.语音识别中隐马尔可夫模型状态数的研究[J].南京理工大学学报(自然科学版),1998,(03):16.
 Zhang Yan Zhang Jie Huang Zhitong.Study on State’s Number of HMM of Speech Recognition[J].Journal of Nanjing University of Science and Technology,1998,(02):16.

备注/Memo

备注/Memo:
江苏省自然科学基金,南京理工大学科研发展基金
张 焱 男 30 岁 博士生
更新日期/Last Update: 2013-03-29