Haber arşivlerinde olay çizge modeli ile yapılandırılmış bilgi keşfi ve soru cevaplama
Dosyalar
Tarih
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Erişim Hakkı
Özet
Hızla artan dijital bilgi kaynakları, özellikle büyük ölçekli haber arşivleri gibi zengin bağlamsal verilerde, doğru ve etkili bilgiye erişim süreçlerini daha karmaşık hale getirmiştir. Bu tez, çevrimiçi haber metinlerinden olay tabanlı bilgi çıkarımı ve bu bilgilerin çok adımlı soru cevaplama sistemlerinde kullanılması için bir çerçeve sunmaktadır. Çalışmada geliştirilen olay çizge modeli, yalnızca bireysel bilgi birimlerini çıkarmakla kalmamış, aynı zamanda olaylar arasındaki bağlamsal ve zamansal ilişkileri de yapılandırarak olay örgüsü zincirleri oluşturmayı amaçlamıştır. Model, isimlendirilmiş varlık merkezli alt çizge madenciliği ve zamansal bilgi entegrasyonu gibi yöntemlerle desteklenmiş; bu yaklaşımlar özellikle çok adımlı soruların yanıtlanmasında dikkate değer sonuçlar elde edilmesini sağlamıştır. Çalışmanın yeniliklerinden biri, Türkçe doğal dil işleme alanına uygun standart veri kümelerinin geliştirilmiş olmasıdır. Bu veri kümeleri, bilgi tabanlı soru cevaplama ve olay odaklı metin kümeleme gibi alanlarda kullanılmak üzere hazırlanmış ve literatürdeki büyük bir eksikliği gidermek üzere araştırmacılara sunulmuştur. Bunun yanı sıra, büyük dil modellerinin semantik ayrıştırma süreçleriyle zenginleştirilmesi ve komut istemi mühendisliği teknikleriyle performanslarının artırılması, çalışmayı yalnızca teorik bir katkı değil, aynı zamanda pratik bir dönüşüm aracı haline getirmiştir. Bu çalışma, dijital haber arşivlerinden bilgi çıkarımı ve çok adımlı soru cevaplama sistemleri için yapısal bir temel sunmakta ve bilgi erişim süreçlerini optimize etmek için yeni yöntemler önermektedir. Bununla birlikte, elde edilen bulgular, özellikle olay çizge modelinin daha geniş veri kümelerinde uygulanabilirliği ve dil modellerinin maliyet performans dengesi gibi konuların gelecekteki araştırmalar için potansiyel taşıdığını göstermektedir.
Rapidly growing digital information sources, especially rich contextual data such as large-scale news archives, have made the processes of accessing accurate and effective information increasingly complex. This dissertation presents a framework for event-based information extraction from online news texts and the application of this information in multi-hop question answering systems. The event graph model developed in this study not only extracts individual information units but also structures contextual and temporal relationships between events to form coherent event chains. The model is supported by techniques such as named entity-centered subgraph mining and temporal information integration, which have demonstrated notable effectiveness, particularly in answering multi-hop questions. One of the key innovations of this study is the development of standardized datasets tailored to the Turkish natural language processing domain. These datasets are designed for use in areas such as knowledge-based question answering and event-centric text clustering, addressing a significant gap in the literature and providing valuable resources for researchers. Furthermore, the enrichment of large language models with semantic parsing processes and the enhancement of their performance through prompt engineering techniques have transformed this study into not only a theoretical contribution but also a practical tool for implementation. This research establishes a structural foundation for information extraction from digital news archives and multi step question answering systems, proposing novel methods to optimize information retrieval processes. However, the findings also highlight the potential for future research, particularly in the applicability of the event graph model to larger datasets and the exploration of cost performance trade-offs in language models.








