GÖRÜNTÜ İŞLEME
NEDİR VE NASIL ÇALIŞIR?
GÖRÜNTÜ İŞLEME
TÜRLERİ
GÖRÜNTÜ İŞLEME
METOTLARI
GÖRÜNTÜ İŞLEME'NİN
UYGULAMA ALANLARI

Görüntü İşleme Metotları

Görüntü işleme teknikleri görüntünün nasıl elde edildiği, renk skalası, tekniğin kullanım amacı gibi bazı özelliklere bağlı olarak değişmektedir. 2 boyutlu görüntüler için (x,y) koordinat sisteminde çalışılırken 3 boyutlu görüntüler için (x,y,z) koordinat sisteminde çalışılmaktadır. Örneğin, renkli görüntülerde renk kanalları için geliştirilen teknikler kullanılırken (CCM - Color Co-Occurrence Matrix), gri seviye görüntüler için daha başka teknikler kullanmak gerekir (GLCM – Gray Level Co-Occurrence Matrix)

Görüntü İşleme Algoritmaları

HOG (Histogram of Oriented Gradients)

Yönlendirilmiş gradyanların histogramı (HOG), nesne algılama amacıyla bilgisayarla görme ve görüntü işlemede kullanılan bir özellik tamamlayıcısıdır. Teknik, bir görüntünün lokalize kısımlarında gradyan oryantasyonunun oluşumlarını sayar. Bu yöntem, kenar oryantasyon histogramlarına, ölçekle değişmeyen özellik dönüşümü tanımlayıcılarına ve şekil bağlamlarına benzer, ancak eşit aralıklı hücrelerden oluşan yoğun bir ızgarada hesaplanması ve gelişmiş doğruluk için örtüşen yerel kontrast normalizasyonu kullanması bakımından farklılık gösterir.

GLCM (Gray Level Co-Occurrence Matrix)

Piksellerin uzamsal ilişkisini göz önünde bulunduran dokuyu incelemenin istatistiksel bir yöntemi, gri düzey uzamsal bağımlılık matrisi olarak da bilinen gri düzey eş oluşum matrisidir (GLCM). GLCM işlevleri, bir görüntüde belirli değerlere ve belirli bir uzamsal ilişkiye sahip piksel çiftlerinin ne sıklıkla oluştuğunu hesaplayarak, bir GLCM oluşturarak ve ardından bu matristen istatistiksel ölçüleri çıkararak görüntünün dokusunu karakterize eder.

GLCM algoritması bize birçok öznitelik verir. Bunlardan en yaygın olarak kullanılan 4 öznitelik tablodaki gibidir:

CCM (Color Co-Occurrence Matrix)

Birlikte oluşum matrisi veya birlikte oluş dağılımı, bir görüntü üzerinde birlikte oluşan piksel değerlerinin belirli bir ofsette renk dağılımı olarak tanımlanan bir matristir. Özellikle tıbbi görüntü analizinde çeşitli uygulamalarla doku analizine yaklaşım olarak kullanılmaktadır. RGB görüntüler için her bir renk kanalının (red, green, blue) matris olarak ifade edilmesi ile oluşan 3 boyutlu dizilimin komşuluk değerleri Color Co-Occurrence Matrix algoritması ile öznitelik çıkarımında çok önemlidir. Renk dağılımı ve yoğunluk bilgilerinin detaylı verildiği öznitelik vektörünü ile büyük veriden renk bazında anlamlı veriler çıkarılabilir ve makine öğrenmesi yöntemleri ile veriler sınıflandırılabilir.

PCA (Principal Components Analysis)

PCA, en çok kullanılan boyut azaltma tekniğinden biridir. PCA’ yı kullanırken, orijinal verilerimizi girdi olarak alırız ve orijinal veri dağılımını en iyi şekilde özetlenebilecek girdi özelliklerinin bir kombinasyonunu bulmaya çalışırız, böylece orijinal boyutlarını küçültebiliriz. PCA, çift yönlü mesafelere bakarak varyansları en üst düzeye çıkararak ve yeniden yapılandırma hatasını en aza indirerek bunu yapabilir. PCA’ da, orijinal verilerimiz bir dizi ortogonal eksene yansıtılır ve her bir eksen önem sırasına göre sıralanır.

SIFT (Scale Invariant Feature Transform)

Bazı görüntüler dönüşle değişmezler, yani görüntü döndürülse bile aynı köşeleri bulabiliriz. Açıktır çünkü döndürülen görüntüde köşeler de köşe olarak kalır. Peki ya ölçeklendirme? Görüntü ölçeklenir ise köşe köşe olmayabilir. Örneğin, aşağıdaki basit bir resme bakın. Küçük bir pencere içindeki küçük bir görüntüdeki köşe, aynı pencerede yaklaştırıldığında düzdür. Yani Harris köşesi ölçekle değişmez değildir.

Bu yüzden, 2004 yılında, British Columbia Üniversitesi’nden D. Lowe, yeni bir algoritma olan Scale Invariant Feature Transform (SIFT) makalesinde, anahtar noktaları çıkaran ve tanımlayıcılarını hesaplayan Ölçek Değişmez Anahtar Noktalarından Ayırt Edici Görüntü Özellikleri buldu. SIFT özelliği, ilişkili bir tanımlayıcıya sahip seçili bir görüntü bölgesidir (anahtar nokta olarak da adlandırılır). Anahtar noktalar SIFT detektörü tarafından çıkarılır ve bunların tanımlayıcıları SIFT tanımlayıcısı tarafından hesaplanır. Bağımsız olarak SIFT detektörünü (yani anahtar noktaları tanımlayıcılar olmadan hesaplamak) veya SIFT tanımlayıcısını (yani özel anahtar noktalarının hesaplama tanımlayıcılarını) kullanmak yaygındır.

SURF (Speeded-up Robust Features)

Bilgisayarla görmede, hızlandırılmış sağlam özellikler (SURF), patentli bir yerel özellik algılayıcı ve tanımlayıcıdır. Nesne tanıma, görüntü kaydı, sınıflandırma veya 3B yeniden yapılandırma gibi görevler için kullanılabilir. Kısmen ölçekle değişmeyen özellik dönüşümü (SIFT) tanımlayıcısından esinlenmiştir. Standart SURF sürümü, SIFT’ den birkaç kat daha hızlıdır ve yazarları tarafından SIFT’ den farklı görüntü dönüşümlerine karşı daha sağlam olduğu iddia edilmiştir.

SURF tanımlayıcıları, nesneleri, insanları veya yüzleri bulmak ve tanımak, 3B sahneleri yeniden oluşturmak, nesneleri izlemek ve ilgi çekici noktaları çıkarmak için kullanılmıştır. SURF, SIFT’in hızlandırılmış sürümüdür. SURF biraz daha ileri gider ve LoG’ye Kutu Filtresi ile yaklaşır. Bu yaklaşımın büyük bir avantajı, kutu filtreli evrişimin integral görüntüler yardımıyla kolayca hesaplanabilmesidir. Ve farklı ölçekteki görüntüler de paralel olarak aynı mantıkla hesaplanabilir. Ayrıca, SURF hem ölçek hem de konum için Hessian matrisinin belirleyicisine güvenir. Oryantasyon ataması için SURF, 6x6 boyutundaki bir matris için yatay ve dikey yönde dalgacık yanıtlarını kullanır. Yeterli Guassian ağırlıkları da ona uygulanır. Baskın yönelim, 60 derecelik bir kayan yönelim penceresindeki tüm tepkilerin toplamı hesaplanarak tahmin edilir. Dalgacık tepkisi, herhangi bir ölçekte çok kolay bir şekilde integral görüntüler kullanılarak bulunabilir. SURF, Upright-SURF veya U-SURF adı verilen bir işlevsellik sağlar. Hızı artırır ve dayanıklıdır. OpenCV, bayrağa bağlı olarak her ikisini de dikey olarak destekler. 0 ise yön hesaplanır. 1 ise yönlendirme hesaplanmaz ve daha hızlıdır.

 

  1. Gonzalez RC, Woods RE, Eddins SL. Digital Image Processing using Matlab. New Jersey, Prentice Hall, 2003.
  2. Tzimiropoulos G., Zafeiriou S. ve Pantic M., Principal Component Analysis of Image Gradient Orientations for Face Recognition.
  3. https://opencv-python-tutroals.readthedocs.io/en/latest/py_tutorials/py_feature2d/py_sift_intro/py_sift_intro.html adresinden alınmıştır.
  4. https://www.i2tutorials.com/what-are-sift-and-surf/ adresinden alınmıştır.