Jumat, 02 Mei 2014

Analisis Faktor-PCA

Nama : Fadhilatus Shoimah
NIM   : 135060601111023
Kelas : B
Mata Kuliah : Metode Analisis Perencanaan
Tugas : Analisis Faktor | Principal Component Analysis

Di Kelurahan Tunggulwulung diadakan sebuah penelitian untuk mendapatkan data mengenai faktor-faktor utama yang berpengaruh terhadap banyaknya genangan air dengan menggunakan analisis faktor utama dengan variabel sebagai berikut:
x1 =  jumlah sumur resapan per RW (buah)
x2 = jumlah biopori per RW (buah)
x3 = curah hujan per tahun (mm)
x4 = ketinggian (m)
x5 = luas catchment area (m2)
x6 = luas lahan kosong (m2)
x7 = luas saluran conveyor (m2)
x8 = luas saluran collector  (m2)
y = untuk mengetahui faktor-faktor yang mempengaruhi banyaknya genangan air di Kelurahan Tunggulwulung atau mereduksi variabel-variabel yang mempengaruhi banyaknya genangan air di Kelurahan Tunggulwulung
Berikut ini data-data variabel x1 sampai x8 :
No.
X1
X2
X3
X4
X5
X6
X7
X8
1
4
2
2168
583
183
200
2596
2821
2
4
7
2851
585
183
152
2505
2314
3
5
4
2467
566
151
91
2242
2539
4
4
3
1575
553
136
144
2465
2324
5
1
9
2117
519
177
86
2192
2870
6
4
8
1847
574
221
85
2188
2931
7
2
7
2052
552
217
123
2074
2396
8
4
2
1698
581
219
89
2585
2936
9
3
9
1631
487
121
72
2234
2454
10
3
1
2915
599
157
64
2602
2290
11
4
8
2697
490
244
163
2070
2363
12
4
2
1553
501
220
110
2088
2411
13
2
2
2880
497
234
62
2624
2004
14
5
3
2216
598
104
142
2915
2069
15
3
10
2039
560
91
190
2903
2450
16
2
3
2104
498
243
83
2470
2711
17
2
8
1644
575
212
187
2551
2628
18
1
4
2512
540
151
90
2458
2527
19
1
6
1868
468
120
82
2795
2790
20
3
8
1700
485
108
190
2224
2260
21
4
8
2768
572
102
199
2273
2067
22
1
7
2901
570
242
122
2028
2946
23
1
2
1952
488
152
194
2688
2838
24
3
10
2503
598
144
126
2119
2022
25
4
3
2491
519
143
130
2592
2144
26
5
9
2246
465
161
123
2149
2630
27
3
4
2611
594
204
193
2835
2628
28
1
4
2775
459
123
61
2711
2729
29
3
2
1679
600
247
70
2951
2091
30
3
4
2454
507
155
147
2129
2020

·      Intrepetasi Output
Descriptive Statistics

Mean
Std. Deviation
Analysis N
jumlah sumur resapan per RW
2.97
1.299
30
jumlah biopori per RW
5.30
2.902
30
curah hujan per tahun
2230.47
451.780
30
ketinggian wilayah
539.43
46.785
30
luas catchment area
172.17
48.831
30
luas lahan kosong
121.97
51.487
30
luas saluran conveyor
2441.87
287.384
30
luas saluran collector
2473.43
306.387
30

Tabel descriptive statistics menunjukkan bahwa jumlah titik genangan air adalah 30 titik. Pada tabel tersebut didapatkan mean dan standar deviasi tiap-tiap variabel. Variabel yang paling mempengaruhi banyaknya genangan air adalah variabel x8 yaitu luas saluran collector.




Correlation Matrixa


jumlah sumur resapan per RW
jumlah biopori per RW
curah hujan per tahun
ketinggian wilayah
luas catchment area
luas lahan kosong
luas saluran conveyor
luas saluran collector
Correlation
jumlah sumur resapan per RW
1.000
-.034
-.070
.309
-.098
.082
-.097
-.336
jumlah biopori per RW
-.034
1.000
-.026
-.091
-.220
.115
-.451
.053
curah hujan per tahun
-.070
-.026
1.000
.111
.008
-.030
-.057
-.221
ketinggian wilayah
.309
-.091
.111
1.000
.140
.286
.214
-.138
luas catchment area
-.098
-.220
.008
.140
1.000
-.193
-.200
.247
luas lahan kosong
.082
.115
-.030
.286
-.193
1.000
.104
-.118
luas saluran conveyor
-.097
-.451
-.057
.214
-.200
.104
1.000
-.028
luas saluran collector
-.336
.053
-.221
-.138
.247
-.118
-.028
1.000
Sig. (1-tailed)
jumlah sumur resapan per RW

.430
.356
.048
.303
.333
.306
.035
jumlah biopori per RW
.430

.446
.316
.122
.272
.006
.391
curah hujan per tahun
.356
.446

.280
.484
.438
.383
.120
ketinggian wilayah
.048
.316
.280

.231
.063
.128
.233
luas catchment area
.303
.122
.484
.231

.154
.145
.094
luas lahan kosong
.333
.272
.438
.063
.154

.293
.267
luas saluran conveyor
.306
.006
.383
.128
.145
.293

.442
luas saluran collector
.035
.391
.120
.233
.094
.267
.442

a. Determinant = ,308












Tabel correlation matrix merupakan tabel yang menunjukkan korelasi antar variabel-variabel yang ada. Tabel correlation matrix merupakan salah satu proses untuk mereduksi faktor sehingga dari kedelapan faktor yang ada dapat ditemukan faktor yang dapat mewakili faktor lain.
Total Variance Explained
Component
Initial Eigenvalues
Extraction Sums of Squared Loadings
Rotation Sums of Squared Loadings
Total
% of Variance
Cumulative %
Total
% of Variance
Cumulative %
Total
% of Variance
Cumulative %
1
1.763
22.035
22.035
1.763
22.035
22.035
1.490
18.621
18.621
2
1.494
18.680
40.715
1.494
18.680
40.715
1.388
17.356
35.977
3
1.228
15.353
56.068
1.228
15.353
56.068
1.309
16.357
52.334
4
1.125
14.061
70.129
1.125
14.061
70.129
1.296
16.202
68.536
5
1.008
12.595
82.724
1.008
12.595
82.724
1.135
14.188
82.724
6
.615
7.692
90.416






7
.486
6.069
96.485






8
.281
3.515
100.000






Extraction Method: Principal Component Analysis.






Proporsi keragaman data yang dijelaskan tiap komponen setelah dilakukan rotasi terlihat lebih merata dibandingkan dengan sebelum dilakukan rotasi. Faktor pertama menerangkan keragaman data awal dengan proporsi, yaitu 22,035% menurut metode ekstraksi dengan analisis faktor (sebelum rotasi) dan dengan analisis faktor (setelah rotasi) keragaman data awal dapat dijelaskan sebesar 18,621 %. Faktor kedua menerangkan keragaman data dengan proporsi, yaitu 40,715% menurut metode ekstraksi dengan analisis faktor (sebelum rotasi) dan dengan analisis faktor (setelah rotasi) keragaman data awal dapat dijelaskan sebesar 35,977%. Faktor ketiga menerangkan keragaman data dengan proporsi, yaitu 56,068% menurut metode ekstraksi dengan analisis faktor (sebelum rotasi) dan dengan analisis faktor (setelah rotasi) keragaman data awal dapat dijelaskan sebesar 52,334%. Faktor keempat menerangkan keragaman data dengan proporsi, yaitu 70,129% menurut metode ekstraksi dengan analisis faktor (sebelum rotasi) dan dengan analisis faktor (setelah rotasi) keragaman data awal dapat dijelaskan sebesar


68,536%. Faktor kelima menerangkan keragaman data dengan proporsi, yaitu 82,724% menurut metode ekstraksi dengan analisis faktor (sebelum rotasi) dan dengan analisis faktor (setelah rotasi) data tetap menjadi 82,724%.
Scree plot merupakan salah satu alternatif yang dapat digunakan untuk membantu penelitian dalam menentukan berapa banyak faktor terbentuk yang dapat mewakili keragaman peubah-peubah asal. Scree plot dapat menunjukkan komponen apa saja yang memiliki angka lebih dari satu sehingga akan menjadi komponen baru yang mewakili komponen yang lain. Jika kurva masih curam, akan ada petunjuk untuk menambahkan komponen. Jika kurva sudah landai, akan ada petunjuk untuk menghentikan penambahan komponen. Walaupun penilaian curam atau landai bersifat subjektif peneliti. Berdasarkan scree plot diatas, terlihat pada saat titik pertama kurva menunjukkan garis yang tidak begitu curam, begitu juga pada saat di titik ke dua kurva menunjukkan garis yang tidak begitu curam, pada saat di titik ke tiga kurva menunjukkan garis yang semakin landai dari dua titik sebelumnya. Pada saat di titik ke empat kurva menunjukkan garis yang sama landai dibanding dengan titik ke tiga.  Kemudian pada saat di titik ke lima kurva menunjukkan garis yang lebih curam dibanding titik ke empat. Dari penjelasan diatas, dapat ditarik kesimpulan yaitu lima komponen atau faktor yang terbentuk. Berdasarkan nilai eigen value > 1 menunjukkan faktor yang bermakna yaitu faktor 1, faktor 2, faktor 3, faktor 4, dan faktor 5.

Component Matrixa

Component

1
2
3
4
5
ketinggian wilayah
.644

.338
.394

luas saluran collector
-.639


.455

jumlah sumur resapan per RW
.582

.346

-.542
luas lahan kosong
.501


.428
.461
jumlah biopori per RW

-.820



luas saluran conveyor
.400
.659
-.509


luas catchment area
-.330
.416
.699


curah hujan per tahun


.374
-.647
.566
Extraction Method: Principal Component Analysis.


a. 5 components extracted.




Tabel component matrix menunjukkan besarnya korelasi tiap variabel dalam faktor yang terbentuk. Nilai-nilai koefisien korelasi antara variabel dengan faktor-faktor yang terbentuk (loading factor) dapat dilihat pada tabel component matrix. Kelima faktor tersebut mengahasilkan matriks loading factor yang nilai-nilainya merupakan koefisien antara variabel dengan faktor-faktor tersebut. Jika dilihat variabel-variabel yang berkolerasi terhadap setiap faktornya, ternyata loading factor yang dihasilkan belum mampu memberikan arti sebagaimana yag diinginkan peneliti. Hal ini terlihat dari variabel jumlah sumur resapan per RW sebesar -542 (tanda negatif hanya menunjukkan arah korelasi) pada komponen kelima sedangkan pada komponen ke dua sebesar 582. Sehingga peneliti sulit untuk menentukan apakah variabel jumlah sumur resapan per RW termasuk komponen 2 atau komponen lima. Tiap faktor belum dapat diinterpretasikan dengan jelas sehingga perlu dilakukan rotasi dengan metode varimax. Rotasi varimax adalah rotasi orthogonal yang membuat jumlah varian loading factor dalam masing-masing faktor akan menjadi maksimum, dimana nantinya peubah asal hanya akan mempunyai korelasi yang tinggi dan kuat dengan faktor tertentu saja (korelasinya mendekati satu) dan tentunya memiliki korelasi yang lemah dengan faktor yang lainnya (korelasinya mendekati nol). Hal yang demikian belum tercapai pada tabel component matrix diatas. Tabel component matrix menunjukkan beban dari delapan faktor terhadap lima komponen baru yang terbentuk. Jadi lima komponen adalah jumlah yang paling optimal untuk mereduksi kedelapan variabel bebas tersebut. Semakin tinggi nilai dari suatu faktor terhadap komponen yang baru semakin tinggi kontribusi dari faktor pada komponen tersebut.
Rotated Component Matrixa

Component

1
2
3
4
5
luas saluran conveyor
-.851




jumlah biopori per RW
.843




jumlah sumur resapan per RW

.896



luas saluran collector

-.657

.363
-.417
luas lahan kosong


.838


ketinggian wilayah

.337
.715
.345

luas catchment area



.921

curah hujan per tahun




.955
Extraction Method: Principal Component Analysis.
 Rotation Method: Varimax with Kaiser Normalization.


a. Rotation converged in 7 iterations.




Setelah dilakukan rotasi faktor dengan metode varimax, diperoleh tabel seperti yang ada diatas yaitu rotated component matrix. Terdapat perbedaan nilai korelasi variabel dengan setiap faktor sebelum dan sesudah dilakukan rotasi varimax. Terlihat bahwa loading factor yang dirotasi telah memberikan arti sebagaimana mestinya dan setiap faktor sudah dapat diinterpretasikan dengan jelas. Terlihat pula bahwa setiap variabel hanya berkorelasi kuat dengan salah satu faktor saja (tidak ada variabel yang korelasinya < 0.5 di kelima faktor). Dengan demikian, lebih tepat digunakan loading factor yang telah dirotasi sebab setiap faktor sudah dapat menjelaskan keragaman variabel awal dengan tepat.










Kesimpulan:
Jadi, dapat disimpulkan bahwa dari kedelapan faktor dapat direduksi menjadi lima komponen yaitu:
  1. Faktor satu, beberapa variabel yang memiliki korelasi yang kuat dengan faktor satu, yaitu variabel luas saluran conveyor dan jumlah biopori per RW.
  2. Faktor dua, beberapa variabel yang memiliki korelasi yang kuat dengan faktor dua, yaitu variabel jumlah sumur resapan per RW dan luas saluran collector.
  3. Faktor tiga, beberapa variabel yang memiliki korelasi yang kuat dengan faktor tiga, yaitu variabel luas lahan kosong dan ketinggian wilayah.
  4. Faktor empat, variabel yang memiliki korelasi yang kuat dengan faktor empat, yaitu variabel luas catchment area.
  5. Faktor lima, variabel yang memiliki korelasi yang kuat dengan faktor lima, yaitu variabel curah hujan per tahun.

Kelima komponen diatas merupakan faktor yang paling optimal untuk mereduksi ke delapan variabel tersebut.