Show simple item record

dc.contributor.advisorKoçak, Cevdet
dc.contributor.authorTürker, Eyüp Sabri
dc.date.accessioned2021-05-08T09:11:28Z
dc.date.available2021-05-08T09:11:28Z
dc.date.submitted1984
dc.date.issued2021-03-08
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/665277
dc.description.abstractö Z E T Çok değişkenli veri analizinde, değişkenler arasındaki bağımlılığın incelenmesi regresyon ve korelasyon teknikleri yardımıyla yapılabilmektedir. Ancak, değişkenler arasındaki bağımlılığın söz konusu olmadığı, yahut değişkenler arası ilişkilerin yapısı hakkında Ön bilgilerin bulunmadığı haller de başka tekniklere gereksinim vardır. Bu çalışmada, çok boyutlu veri analizinin Önemli yön temlerinden biri olan ana bileşeni! faktör analizi çerçeve sinde, üç girişli veri tabloları incelenmiştir. Ana bileşeni! faktör analizi yardımıyla üç girişli veri tablolarının incelenmesi oldukça yeni olup, uygulanmasında bazı güçlüklerle karşılaşılmaktadır. Bu güçlüklerden en önem lisi, iki girişli veri tabloları için varolan ve ana bileşen leri verilere bağlayan yeniden kuruluş formülünün, üç giriş li tablolara genelleştirilmesinde ortaya çıkmaktadır. Bu ça lışmada, bu tür tablolarda kullanılmak üzere, bir yeniden kuruluş formülü önerilmektedir. Hem ana bileşenli faktör analizini uygulamak ve hem de formülün geçerliliğini sağla mak amacıyla, üç girişli tablolara model olarak bir ekonomi problemi seçilmiştir. Giriş Bölümünde: Çok boyutlu veri anal izindeki istatis tiksel yöntemlerden kısaca söz edilmiş ve ana bileşenli fak tör analizi yöntemiyle ilgili yapılmış araştırmalardan bazı ları tanıtılmıştır. Ayrıca, iki ve üç girişli veri tablola rında göz önüne alınan yeniden kuruluş formülleriyle ilgili son yıllara kadar yapılan bazı çalışmalara değinilmiştir. Birinci Bölümde: Verilerin çok boyutlu uzayda oluşturdu ğu nokta bulutunun, mümkün olduğu kadar az bilgi kaybı ile, daha küçük boyutlu bir alt uzayda gösterilimine çalışılmış tır. Veri tablosunun satırlarını oluşturan bireyler ile, ko-II - lonlarını oluşturan değişkenler yardımıyla, araştırılan alt uzaya ait ana eksenlerin bulunması problemi, değişik yönle riyle ele alınarak incelenmiştir. Ayrıca bu yöntemde; prob lemin çözümünün Özdeğer-Üzvektör araştırılması problemine dönüştürülebileceği gösterilmiş ve özvektörlerden ana bile şenlere geçiş formülleri çıkartılarak, bileşenler yardımıy la asıl veri. tablosunun yeniden kuruluşunu sağlayan formül elde edilmiştir. İkinci Bölümde: İki girişli veri tabloları için var olan yeniden kuruluş formülü, üç girişli tablolar için kul lanılabilecek daha genel bir halde verilmiş ve bu formülün ana bileşenlerle olan ilişkisi 'gösterilmiştir. Varlığı ve tekliği son yıllarda ispatlanmış bulunan söz konusu formül, üçüncü basamaktan etkileşimleri kapsamak suretiyle, üç boyut lu verileri ana bileşenler cinsinden tam olarak ifade edebil mektedir. Yalnız ikinci basamaktan etkileşimlerin alınması halinde dahi, yeterli bir yaklaşım sağlayabilmektedir. Üçüncü Bölümde: Ana bilesunli faktör ana.il/. i yöntemiy le ilgili, FORTRAN IV dilinde geliştirilen, oldukça genel amaçlı bir programın algoritması tanıtılmış ve program çı kışlarının yorumunda kullanılan istatistiksel kriterler özetlenmiştir. Dördüncü Bölümde: ülkemizin ekonomik yapısını belirli ölçüde yansıtan, son yıllardaki ihracat problemi ele alına rak, bu problemin istatistiksel, analizi yapı. İmiş tır. 197G/80 yılları arasında, ü l komi/, i lıraı-a t ı uda önoıul i 1.0 I oynayan, ürünler `Değişken` ve ihracatta önemli payı olan ülkeler `Birey` olarak seçilmiş ve böylece her 'yıl için oluşturulan (25 x 12) boyutlu veri tablolarının ana bileşenli faktör analizi yapılmıştır. Ayrıca; iki ve üç girişli karşılaştır ma tabloları için önerilen yeniden kuruluş formüllerinden elde edilen sonuçlar ile, başlangıç tabloları karşılaştırıl- mıştır.- Ill - Son Bölüm sonuçlara ayrılmıştır. Burada, analiz sonuç larının genel bir değerlendirmesi yapılmıştır. Analiz sonucunda elde edilen tablo ve grafikler Ek ' te verilmiştir.
dc.description.abstractIV S U M'MA'R Y Regression and Correlation techniques can be used in the investigation of dependence in such situations where a variable of a multivariate system depends on other variables. However, if a differentiation between dependent and indepen dent variables is not a matter of importance, in other words if all the variables carry equal importance from the point of view of the purposes of the investigation, then it is essential that other techniques will be used in the analysis of dependence. The techniques included in this category are useful especially when there is not sufficient information about the structure öf the relationship between the variables Starting with the Principal Component Analysis method and with the introduction of formula maintaining the reestab- lishment of the starting data table, an analysis of an eco nomical problem closely related to the recent export struc ture of Turkey was made to prove the conformity of this for mula. In the introduction chapter, the initiation of multi dimensional data analysis methods and its development has been briefly given and the principal component analysis met hod and its relation with the other multivariate methods has been explained. Also, the work carried out on the formula which maintain the reestabl isluuent of the starting table with the aid o I` principal component lias been summarised. In the first section, the principal component analysis method and the basic hypothesis on which it depends has been introduced and the related formula are given, also the analysis has been investigated from the geometrical point of view and the calculations are established more clearly.- v - The aim of principal component analysis method is to reduce the number of dimension of the problem by using vari ables related to the problem and by creating a few artificial variables- In the maintaining, some information in the data matrix is naturally lost, still the method depends on the principal of finding and optimum solution in such away to minimize the information loss. In the most general sense, the' principal component analysis method consists 'of looking for the linear combinations of the original variables by summarising the starting data table and with the minimum information loss possible. After establishing the basis of the method, all the definitions and the calculation methods required for 'the analysis are given, at the end of the first section the geometrical study of the principal component is made and the principal component under the hypothesis normal distri bution is investigated as well. In the second section, starting with the principal component, the formula which provided the reestablishment of the starting table are introduced. The validity of the two way contigency tables of a formula is shown, followed by an investigation of a more general formula which can be used for the three way tables. Especially in the situation where the number of the selected variables is gi-eat, this formula gives results close to the starting data table. In the third sect. ion, ?the Algorithm of the general purpose program which çan make all the required calculations about the principal component analysis method and which is coded in FORTRAN IV language is given. This program is prepared to analyse (50 x 50) data matrix and to give the results as ' appropriate tables and graphs. The algorithmic structure of the program can be summarised as follows;VI - i. It reads the data table with the required FORMAT, ii. Starting with the data table it calculates the correlation (or covariance) Matrix, iii. It calculates the eigen values and cicjen vectors of the correlation (or covariance) matrix witli the aid of iteration method, iv. Starting with the eigen values and eigen vectors and using the transformation formula it calculates the cofficients of principal components, v. Since the calculated eigen values are defined as the variance of principal components, it gives the eigen value percentages, accumulated percentages and the histo grams of the eigen values as appropriate tables, vi. If required, it prints the data table and its correlation matriq in an appropriate way, vii. It. gives the quality of the figure, the average and standart deviation of the variables and the calculations of the contribution ratio and thus helps the discussion of the results, viii. It prints the graphs of the calculated principal components in the required planes. In the forth section the results and discussion ob tained as a result of application of a program of principal component analysis method to an economical problem which is possible to be investigated statistically is given. The re sults obtained by the application of the related program to the five (25x12) data matrix created in accordance with the last five years exports of Turkey can be summarized as follows;VII - i. As a result of analysis made by evaluating the data matrices in various ways, it is found that the first four components are generally meaningful. The possibility of explaining the properties, which can be explained with 12 variables, by four equations which are found as the linear components of these variables shows that this analysis is a very effective dimension reducing method for the used data. Li. When l ho five yours ' expor L quant i t Los between 1976/80 is analyzed by taking the time dimension into ac count, it is observed that the types of products that Turkey has exported to the neighbouring countries are accumulated at the same side of t lie principal components. This can be considered as there is no significant change in the export structure. iii. When the calculated components of the countries and the relative placement of these countries are observed on the graphs, it is seen that the countries having the same geographical character are accumulated at the same place. Still it is observed that some countries are very closed to the components and some are very far. iv. Although the results obtained from the analysis of the three way k _ tables contains the results of two way k tables, it is possible to see more clearly the grouping of both the countries and the products in the analysis of the three way tables. v. The reestablishment formula proposed for the data tables of correspondance analysis contains density functions. Since it is possible to pass from the correspondance analysis to principal component analysis with the aid of appropriate transformations, a formula which maintains the reestablish ment of the three way tables can be given in the principal component analysis. In this study, a reestablishment formula- VIII - for three way contigency tables is proposed to be used in the principal component analysis method. vi. By analysing the result obtained from two and three way contigency tables the similarity with the starding table is observed. This means that, the formula put forward are very useful in the principal component analysis method. The tables and graphs obtained as a result of the application of the program related to the analysis are given in the appendix.en_US
dc.languageTurkish
dc.language.isotr
dc.rightsinfo:eu-repo/semantics/embargoedAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectMatematiktr_TR
dc.subjectMathematicsen_US
dc.titleÜç girişli veri tablolarının ana bileşenli faktör analizi yöntemiyle incelenmesi ve bir uygulama
dc.typedoctoralThesis
dc.date.updated2021-03-08
dc.contributor.departmentDiğer
dc.identifier.yokid2120
dc.publisher.instituteFen Bilimleri Enstitüsü
dc.publisher.universityİSTANBUL TEKNİK ÜNİVERSİTESİ
dc.identifier.thesisid2120
dc.description.pages132
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/embargoedAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/embargoedAccess