Modulo frontal para um sistema de reconhecimento automatico de voz
Maurilio Nunes Vieira
DISSERTAÇÃO
Português
(Broch.)
T/UNICAMP V673m
Campinas, SP : [s.n.], 1989.
[151]f. : il.
(Publicação FEE)
Orientador : Fabio Violaro
Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica
Resumo: Este trabalho descreve o desenvolvimento do software para o Módulo Frontal de um Sistema de Reconhecimento Automático de Voz para operação na faixa de 0-4 kHz. O Módulo FrontaI , ou Processador Acústico, é responsável pela extração de traços a caracterização dos diversos sons da fala. O...
Ver mais
Resumo: Este trabalho descreve o desenvolvimento do software para o Módulo Frontal de um Sistema de Reconhecimento Automático de Voz para operação na faixa de 0-4 kHz. O Módulo FrontaI , ou Processador Acústico, é responsável pela extração de traços a caracterização dos diversos sons da fala. O sinal de voz sofre uma filtragem passa-baixas com
corte em 3,4 kHz, é amostrado a 8,0 kHz e quantizado em 12 bits. As análises são feitas em quadros de 25 ms, deslocados a um passo de 5 ms, obtendo-se uma série de parâmetros, como o número de cruzamentos por zero, o período de pitch para os intervalos sonoros, a energia em diversas faixas de freqüência do espectro LPC (Linear Predictive Coding) e a freqüência, amplitude e largura de faixa dos três primeiros formantes. O quadro é classificado em uma dentre sete categorias:
silêncio, fricativo surdo, fricativo sonoro, oclusão sonora, vocálico, coarticulação eu indefinido. Esta última categoria
inclui segmentos que não podem ser confiavelmente classificados em nenhuma das outras categorias. A classificação é independente do locutor Ver menos
corte em 3,4 kHz, é amostrado a 8,0 kHz e quantizado em 12 bits. As análises são feitas em quadros de 25 ms, deslocados a um passo de 5 ms, obtendo-se uma série de parâmetros, como o número de cruzamentos por zero, o período de pitch para os intervalos sonoros, a energia em diversas faixas de freqüência do espectro LPC (Linear Predictive Coding) e a freqüência, amplitude e largura de faixa dos três primeiros formantes. O quadro é classificado em uma dentre sete categorias:
silêncio, fricativo surdo, fricativo sonoro, oclusão sonora, vocálico, coarticulação eu indefinido. Esta última categoria
inclui segmentos que não podem ser confiavelmente classificados em nenhuma das outras categorias. A classificação é independente do locutor Ver menos
Abstract: Not informed.
Modulo frontal para um sistema de reconhecimento automatico de voz
Maurilio Nunes Vieira
Modulo frontal para um sistema de reconhecimento automatico de voz
Maurilio Nunes Vieira
Exemplares
Nº de exemplares: 2
Não existem reservas para esta obra