Defective fruits detection using deep convolutional networks
Tarih
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Erişim Hakkı
Özet
Görüntülerin sınıflandırılması ve tanınması, bilgisayarlı görmenin vazgeçilmez bir görevidir. Son yıllarda, bu görevler büyük ölçüde, derin sinir ağları (CNN'ler) tarafından yerine getirilmiş, bu güçlü tekniğe ilgi birçok alanda artmıştır.Çoğu veri kümesi, RGB görüntülerden oluşur ve bu görüntüler modifikasyon olmadan giriş görüntüleri olarak kullanılmaktadır. Bu tezde, esas olarak meyve hastalığı görüntülerinin sınıflandırılması ve tanınmasına odaklanılmıştır. Meyve tanıma giderek daha popüler bir araştırma konusu haline gelmesine rağmen, bilimsel ve teknik bir zorluk olmaya devam etmektedir. Meyve sınıflandırmalarının renk uzaylarının önemi de de tartışıldı ve incelendi.Modelimizde prensip olarak, bir giriş görüntüsü olarak üç renk uzayının birleşimi kullanıldı; diğer yandan, renk uzaylarının meyve sınıflandırma performansının doğruluğunu nasıl bir etkisi olabileceğini görmek için farklı tek renk uzaylarıyla analizler yapıldı. Dönüşümler temel olarak RGB görüntülerini HSV ve CIELAB renk uzaylarına dönüştürerek özetlenir.Sonuç olarak, RGB yi farklı renk alanlarına dönüştürmek öğrenme süreci üzerinde genel bir etkiye sahip olabilir.Bir CNN'nin girişi olarak çoklu renk uzayları kullanmak, bazen tek renkten daha iyi mükemmel sonuçlar vererek renk alanı sınıflandırma doğruluğunu önemli ölçüde etkileyebilmektedir. Bu tezde, çalışmasında farklı yaklaşımlar da çalışılmış ve füzyon yaklaşımının performansı diğer yaklaşımlarla karşılaştırıldığında iyi çalışmıştır. Birleşme yaklaşımımız iyi çalıştı, Custom-CNN için %91.23 ve Alex-Net için %97.94, transfer öğrenimi için %84.20 ve klasik görüntü işleme yaklaşımı için %71.60.Bununla birlikte, çoklu renk aralığına izin veren bir model kullanmak, ön işleme aşamasının (her renk alanına dönüştürme) kendi başına büyük miktarda kaynak harcadığı için önemli miktarda zaman gerektirmektedir. Ancak, yeterli kaynak sağlanmışsa, ön işleme gerçek zamanlı olarak gerçekleştirilebilir.
Image classification and object detection are indispensable tasks of computer vision. Over the past few years, these tasks have been largely accomplished by deep neural networks (CNNs) while the interest in this powerful technique has increased in many areas as well. Most datasets consist of RGB images and these images are used as input images without modifications. In this thesis, the main focus is on the classification of fruit disease images. Although fruit disease recognition has become an increasingly popular topic of research, it still remains a scientific and technical challenge. Exploration and study of the importance of color spaces on fruit classification performance were as well looked in to. In our model, we principally use a concatenation of three-color space as an input image, on the other hand, we made an analysis with different single color spaces to see what kind of influence the color spaces have on the performance of fruit classification in terms of accuracy. The transformations are mainly summarized by the conversion of RGB images into HSV and CIELAB color spaces. In conclusion, changing the RGB into different color spaces can have a global impact on the training process. Using multiple color spaces as input of a CNN can significantly affect the accuracy of fruit classification by giving excellent results, sometimes better than the single color space. Different approaches have been studied in this thesis as well and the fusion approach performance works quite well in comparison with other approaches. Our approach been the fusion approach achieved the best, with 91.23% for the Custom-CNN and 97.94% for the Alex-Net, while 84.20% was obtained for the transfer learning and 71.60% for the classical image processing approach. However, using a model that allows multiple color spaces requires significant amount of time and resources because of the preprocessing step (converting to each color space) but, preprocessing can be done in real-time if adequate resources are provided.









