İngiliz alfabesi kullanılarak yazılmış Türkçe metinlerin Türk alfabesine göre yeniden oluşturulması

Yükleniyor...
Küçük Resim

Tarih

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Gebze Yüksek Teknoloji Enstitüsü, Lisansüstü Eğitim Enstitüsü

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

İngilizce alfabesi ile yazılan Türkçe metinler her ne kadar insanlar tarafından kolay anlaşılsa da, bu işlemin otomatik olarak yapılması günümüzde hala tam çözülmemiş Sözcük Anlamı Belirleme problemlerinden birisi olarak karşımıza çıkmaktadır. İngilizce alfabesi ile yazılmış olan metinlerin Türkçe alfabesi ile yeniden yazılması, Türkçe?ye özgü bir Doğal Dil İşleme çalışmasıdır. Farklı Türkçe kelime seçenekleri içinden, uygun olanın bulunması için metnin anlamsal açıdan ele alınması gerekmektedir. Bu çalışmada, metnin cümle bazlı veya tüm parça olarak incelenmesinin doğru kelime tercihi üzerindeki etkileri araştırılmıştır. İstatistiğe dayalı yöntemler ile makina öğrenmesi yöntemlerinin doğru kelime tercihi üzerindeki başarısı incelenmiştir. Bir metnin tüm parça olarak incelenmesinin, bize metin hakkında cümle bazlı yönteme göre daha fazla bilgi verdiği; ayrıca makina öğrenmesi yöntemlerinin, istatistiksel bazlı yapılan çalışmalara göre daha iyi sonuçlar sağladığı deneylerle gösterilmiştir.

Turkish texts written by English characters are easily comprehended by people, although performing this process by machines is still one of the unsolved Word Sense Disambiguation problems. Rewriting texts in English characters using Turkish characters is a natural language processing problem special to Turkish. Choosing the right Turkish word among different alternatives requires consideration of the text semantically. In this study, the effect of examination of the text either sentence or whole text based, on the right word determination is investigated. Performance of machine learning methods and statistical methods in right word determination is examined. The study is tested on randomly selected news texts. It is shown that examination of the text as a whole provides more information compared to sentence based methods and machine learning methods provides better results compared to statistical studies.

Açıklama

Anahtar Kelimeler

Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control, Bilim ve Teknoloji, Doğal Dil ??leme, Metin Madenciliği, Sözcük Anlam Belirleme, Makina Öğrenmesi., Natural Language Processing, Text Mining, Word Sense Disambiguation, Machine Learning.

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye

Onay

İnceleme

Ekleyen

Referans Veren