Türkçe otomatik dudak okuma sistemi

Yükleniyor...
Küçük Resim

Tarih

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Gebze Yüksek Teknoloji Enstitüsü, Lisansüstü Eğitim Enstitüsü

Erişim Hakkı

info:eu-repo/semantics/closedAccess

Özet

Teknolojideki ilerleme, otomatik konuşmayı anlama sistemlerinin Bilgisayar- İnsan Etkileşimi'nde yaygın bir şekilde kullanılmaya başlanmasına neden oldu. Bununla birlikte bu sistemler hala sıradan ortamlarda yetersiz kalmaktadır. Şu anki uygulamalar; ofis, açık hava gibi ortamlarda rastlanılan arkaplar gürültüsü veya birden fazla insanın aynı anda konuştuğu durumlara karşı çok hassastırlar. Bu durumun üstesinden gelmenin yollarından biri, konuşmayı anlama sistemlerinde insanların yaptığı gibi görsel bilgilerden yararlanmaktır. Araştırmalara göre insanların konuşmayı anlamasında görsel işaretler önemli rol oynamaktadır. Bu yüzden otomatik konuşmayı anlama sistemlerinde dudak okumadan da yararlanılması, bizi daha verimli Bilgisayar-İnsan Etkileşimi'ne bir adım daha yaklaştıracaktır. Bu projenin temel hedefi, Türkçe diline dayalı uygulanabilir bir dudak okuma sistemi oluşturmaktır. Türkçe dili için iki işitme engelli tarafından bir fonem-vaysem eşleşim tablosu hazırlanmış ve dudak biçimini çıkaran bir sistem oluşturularak, bu eşleşim tablosuyla birlikte, konuşmacının ne dediğini anlamaya çalışan bir uygulama oluşturulmaya çalışılmıştır.

Advances in technology in recent years have led to a widespread use of automatic speech recognition (ASR) systems in Human-Computer Interaction (HCI). However, ASR systems still perform poorly, when it comes to real world applications. Most approaches are very sensitive to background noise or fail when more than one speaker talks simultaneously, as it often happens in offices, outdoors and other real world environments. One way of overcoming these limitations of audio-only ASR systems is to use the additional visual information of the act of speaking, just like humans do. Psycholinguistic research has found that visual cues like lip movements play an important role in speech understanding by humans. Thus, a lip reading system as part of an ASR system leads thus one step closer to more natural HCIs. The major aim of this project is to show a simple and applicable way of a "Lip Reading System" on Turkish Language. Two hard-of-hearing people have prepared a Turkish language phoneme-viseme mapping table. Some basic lip features are extracted. After that; these features and the mapping table are used as to find that what the speaker says.

Açıklama

Bu tezin, veri tabanı üzerinden yayınlanma izni bulunmamaktadır. Yayınlanma izni olmayan tezlerin basılı kopyalarına Üniversite kütüphaneniz aracılığıyla (TÜBESS üzerinden) erişebilirsiniz.

Anahtar Kelimeler

Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye

Onay

İnceleme

Ekleyen

Referans Veren