Ses işaretlerinin analizinde kısa zamanlı fourier ve dalgacık dönüşümlerinin uygulamaları

Yükleniyor...
Küçük Resim

Tarih

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Gebze Yüksek Teknoloji Enstitüsü, Lisansüstü Eğitim Enstitüsü

Erişim Hakkı

info:eu-repo/semantics/closedAccess

Özet

Bu çalışmada frekans, zaman-frekans ve zaman-ölçek temelli işaret analiz yöntemleri incelenmiş ve konuşma işaretlerinin tanınmasında kullanılmıştır. Bilindiği gibi, en temel dönüşüm yöntemlerinden biri olan Fourier dönüşümü uygulandığı işaretin sadece frekans bilgisini vermekte, zaman bilgisine yer vermemektedir. Ancak konuşma işaretleri durağan işaretler değildir, frekans içerikleri zamanla değişir. Bu nedenle, frekansın yanı sıra zaman bilgisine de yer veren Kısa Zamanlı Fourier Dönüşümleri (KZFD) konuşma işaretlerini incelemek için daha uygun bir yöntemdir. Bu yöntemde, küçük bir aralıkta işaretin durağan olduğu kabul edilir ve işaret küçük pencerelere bölünerek incelenir. Ne var ki, KZFD'nde analiz boyunca pencere uzunluğu sabit olduğu için arzu edilen zaman- frekans çözünürlükleri elde edilememektedir. KZFD'nün bu dezavantajından kurtulmak amacıyla Dalgacık Dönüşümüne başvurulmuştur. Dalgacık dönüşümünde pencere uzunluğu analiz boyunca kendiliğinden değiştiği için istenilen zaman-frekans çözünürlükleri elde edilebilir. Bu nedenle dalgacık dönüşümü, frekans içeriği zamanla oldukça değişken bir yapıya sahip konuşma işaretlerini incelemek için daha uygun bir yöntemdir. Kısa zamanlı Fourier ve dalgacık dönüşümlerinden yararlanılarak 0 ile 9 arasındaki rakamların ses kayıtlarından elde edilen konuşma işaretlerinin ayırt edici özellikleri çıkartılmaya çalışılmıştır. Elde edilen özellikler ses tanıma algoritmalarına verilerek konuşmacı-bağımlı ve konuşmacı-bağımsız rakam tanıma deneyleri yapılmıştır. Bu çalışma, KZFD ile çok başarılı ses tanıma sonuçları alındığını göstermiştir. Bununla birlikte dalgacık dönüşümü konuşma işaretlerinin analizi için etkili bir yöntem olduğunu kanıtlamış ve ses tanıma deneylerinde önemli katkılar sağlamıştır.

"" In this work speech signals are studied with frequency, time-frequency and time-scale based analysis methods and some speech recognition experiments are carried out by using these methods. The Fourier transform, which is the basic transformation method, gives only the frequency information of the signal. However, speech signals are non-stationary signals and their frequency properties change over the time. Therefore STFT (Short- Time Fourier Transform), which also provides time information, is a more suitable technique in the analysis of the speech signals. But in STFT the length of the window is the same over the time and it cannot produce desired time-frequency resolutions. In order to correct this deficiency of STFT, Wavelet Transform is used. The size of the window during the analysis changes and hence it could yield better time- frequency resolutions. This advantage makes the wavelet transform a more suitable technique for analyzing the speech signals, which present quite non-stationary characteristics. By using the short-time Fourier and wavelet transforms feature extraction is done for the speech signals of sound records of digits from 0 to 9. The features obtained from these methods are fed into the speech recognition algorithms for digit recognition. This work shows that very successful speech recognition results have been obtained by means of STFT. Besides this, the wavelet transform has proven itself as an effective method for the analysis of speech signals and provided significant contributions in the speech recognition experiments.

Açıklama

Bu tezin, veri tabanı üzerinden yayınlanma izni bulunmamaktadır. Yayınlanma izni olmayan tezlerin basılı kopyalarına Üniversite kütüphaneniz aracılığıyla (TÜBESS üzerinden) erişebilirsiniz.

Anahtar Kelimeler

Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye

Onay

İnceleme

Ekleyen

Referans Veren