Pazar sepet analizinde ürün ilişkilerinin bulunması
Tarih
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Erişim Hakkı
Özet
Veri madenciliğinin genel amacı, büyük bir veri topluluğu içindeki dikkate değer ilişkileri ortaya çıkarmaktır. Diğer bir değişle veri madenciliği, anamlı örüntüleri ve kuralları bulmak için büyük miktardaki verinin analiz edilmesidir. Veri madenciliği, pazar sepet analizindeki ambar bütünleşmesini sağlamaya çalışan sık küme problemlerini içermektedir. Kümelerden oluşmuş veriler ve bu verilerin olasılıklarının elde olduğu varsayıldığında, sık küme problemi, en az olasılıkla hangi veri gruplarının elimizdeki veri topluluğunun içinde olduğunun belirlenmeye çalışılması işlemidir. Yapılan çalışmada bu tip problemlerde kullanılmak üzere, yeni ve hızlı bir algoritma geliştirilerek, algoritma için ikna edici bir hesaplama yöntemi geliştirilmiştir. Yapılan uygulamada ürünlerin alt kümelerinden oluşan büyük miktardaki veri birikimi ve ürünlerin dizileri elde edilerek, ürün hareketleri içerisinde, farklı ürünler arasındaki ilişkileri bulmak için, belirlenen eşik değerini aşan ürün kümeleri bulunmaya çalışılmıştır. Bunun için Zhenjiang Hu tarafandan geliştirilen algoritma [Zhe,2001] farklı bir şekilde ele alınıp yeni bir algoritma geliştirilmiştir. Eşik değerini aşan ürünler sık gerçekleşen ürünlerdir.
The general goal of data mining is to extract interesting correlated information from large collection of data. A key computationally intensive sub- problem of data mining involves finding frequent sets in order to help mine association rules for market basket analysis. Given a bag of sets and a probability, the frequent set problem is to determine which subsets occur in the bag with some minimum probability. This paper given a bag of sets and a probability, the frequent set problem is to determine which subsets occur in the bag with some minimum probability. Beginning with a simple but inefficient specification expressed in a functional language, the new algorithm is calculated in a systematic manner from the specification by applying a sequence of known calculation techniques. In this application.the item sets that exceed the defined threshold are processed to find the relations among different item sets by getting the big amount of data consisted of the subsets of the items and the item arrays.within the item transactions.To accomplish this, a new algorithm has been formulated which was based on the algorithm developed by Zhenjiang Hu.Those items who exceed the threshold are the ones that have the highest frequencies. [Zhe,2001]








