Varyans-kovaryans matrislerinin eşitliği varsayımı olmaksızın bazı diskriminant fonksiyonları ve bir uygulama (Xeromammografi`nin meme kanseri erken teşhisindeki öneminin istatistiksel ispatı)
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu çalışmada yığınların aynı varyans-kovaryans matrislerine sahip olma varsayımına bağlı olmaksızın sınıf lama problemi üzerinde durulmuştur. Diskriminant analizi probleminin çözümünde yığınların var-kovaryans matrislerinin eşit olduğu varsayımının yanlış sınıflanan gözlem sayısını artırdığı bilinmektedir. Bu nedenle BÖLÜM 2 de bu varsayım kaldırılarak `Sebestyen yaklaşımı` ile diskriminant metriği incelendi. 2 Metrik olarak d (a, b) = (a - b)'Q(a - b) gözönüne alındığında 2 farklı Q matrisi söz konusu olmaktadır. Birincisi; değişkenlerin ağırlıkları köşegen elemanları olmak üzere alınan Q köşegen matrisi, ikincisi pozitif tanımlı bir Q metrik matrisi. Böylece ilk durumda, yığınların var-kovaryans matrisleri gözönüne alınmaksızın uzaklık kavramına dayanan bir sınıflandırma yapılmıştır. İkinci durumda, var-kovaryans matrislerinin eşitliği söz konusu olmaksızın ` grupların var-kovaryans matrislerinden yararlanarak yine uzaklık kavramına dayalı sınıflandırma yapılmıştır. BÖLÜM 3 de öncelikle L (x) = (j^`!^) ' 2~ 2 _ -j` (Ü2`ül) 2~ (^2 + Hı> olmak üzere lineer diskriminant fonksiyonuna yer verildi. ıı-1 Daha sonra 12 1 Q(x) = İ ln njT ~ İ (* - »ı^h1^ ' Hı> + `T (x - <y2) '22 (- ~ -2J kuadratik diskriminant fonksiyonu ve 3 = (t, 2,+ t2 2L) (]j2 - }i,) olmak üzere BL(x).'.= x*j$ - §']i1 + tx £' 2X g best (en iyi) lineer diskriminant fonksiyonu üzerinde duruldu. Ancak lineer diskriminant fonksiyonu ile kuadratik diskriminant fonksiyonunun avantajlarının birleştirilmesi halinde i ninci grup için Birleştirilmiş diskriminant fonk siyonu, !,-_.*., 1....... v-1- BDF = _^log,2i, _ ^ (x_ Eı). 2.-(x_ H±) olarak alındı. Burada 2. birleştirilmiş grupların kovar- yans matrisidir. Sonuç olarak, var-kovaryans matrislerinin eşitliği var sayımı altında yapılan yanlış sınıflamalar ile bu varsa yım yapılmaksızın yapılan yanlış sınıflamalar arasındaki fark bir uygulama ile ortaya konmaya çalışıldı. Bunun için Dr. Kayhan Özkan'ın Amerika Birleşik Devletleri. Detroit kentinde yaptığı çalışma sonucu hazırladığı Doçentlik tezi verilerini kullandık. Bü- çalışmada Xeromammograf inin meme kanseri erken teş- hisindeki önemi belirtilmektedir. Bizde bu önemi diskrimi nant analiz kullanarak istatistiksel olarak kanıtladık. iiiABSTRACT In this work, the classification problem of populations is studied independent of the assumption having same var- covariance matrix. The number of misclassif ied observation increases under the assumption of var-covariance matrices equal. For this reason in Section 2, learing this assumption `discriminant metrics` is studied using `Sebestyen approximation`. 2 In case, metric d (a,b) = (a - b) ' Q(a - b) is taken in to consideration there come out two different Q matrices. 1. Q is a diagonal matrix when the weight of variables are elements of diagonals. 2. Q is a positive definite metric matrix Thus, in the first case a classification is done depending on the distance conception without taking the var covarian- ce matrixes of populations in to considerations. In the second case, without the equality of vari-co- variance matrices classification is made using combined var-covariance matrices again depending the distance conception. In section 3, first, L (x) = (x - ^2~I}ii + /L2) ) ' ^ (U-l ~ Ü2^ lineer discriminant function is considered. iv ABSTRACT In this work, the classification problem of populations is studied independent of the assumption having same var- covariance matrix. The number of misclassif ied observation increases under the assumption of var-covariance matrices equal. For this reason in Section 2, learing this assumption `discriminant metrics` is studied using `Sebestyen approximation`. 2 In case, metric d (a,b) = (a - b) ' Q(a - b) is taken in to consideration there come out two different Q matrices. 1. Q is a diagonal matrix when the weight of variables are elements of diagonals. 2. Q is a positive definite metric matrix Thus, in the first case a classification is done depending on the distance conception without taking the var covarian- ce matrixes of populations in to considerations. In the second case, without the equality of vari-co- variance matrices classification is made using combined var-covariance matrices again depending the distance conception. In section 3, first, L (x) = (x - ^2~I}ii + /L2) ) ' ^ (U-l ~ Ü2^ lineer discriminant function is considered. ivı ' ^2' 1 ' - 1 Then Q(x) = -j- In pg-[^ (x - y^) 2^ <* _H.2)+ `T (x ` Ü2),22^- ` ^2] ls the quadratik discriminant function and when g =(t1S1 + t222)`1 (y2 - /x±) then BL = x'B - B'y-L + t1^'21 3 is the best linear discriminant function. Yet - if the combination of the advantages of linear discriminant function are subject, combined discriminant function for i grup is BDF = - -J` logl JS±l. - 4` (2F - ]x±) 'ST-'-U - y±) and 2. used above, are var-covariance matrices of combined groups. As a result, the difference between the classification of populations, assuming them having equal variance-covari- ance matrices and classifications made without this assump tion, is show up by an application. Data used by Dr. Kayhan Özkan' s thesis of associate professeurship, studied at Henry Ford Hospital of Detroit, U.S.A., on Xeromammography ' s importance in the early diagnosis of breast cancer is used. în my work the first part of the application using the distance conception, number of misclassif ied observation, and in the second section using discriminant functions, number of misclassified observation are calculated. v
Collections