PENENTUAN PELUANG KEPINDAHAN PELANGGAN DENGAN MENGGUNAKAN MODEL REGRESI LOGISTIK UNTUK DATA BERUKURAN BESAR

Pemodelan regresi logistik sulit dilakukan jika data yang digunakan termasuk massive dataset yang pada dasarnya berkaitan dengan jumlah data yang sangat besar. Oleh karena itu, perlu dilakukan penyamplingan terhadap data induknya dan menurut penelitian sebelumnya data Squashing merupakan metode yang...

Full description

Saved in:
Bibliographic Details
Main Authors: Eto Wuryanto, Drs.,DEA, Dyah Herawatie, Ir.,M.Si, Rimuljo Hendradi, S.Si.,M.Si
Format: Other NonPeerReviewed
Language:Indonesian
Indonesian
Published: UNIVERSITAS AIRLANGGA 2006
Subjects:
Online Access:http://repository.unair.ac.id/40781/1/gdlhub-gdl-res-2008-wuryantoet-6960-lp6508.pdf
http://repository.unair.ac.id/40781/2/gdlhub-gdl-res-2008-wuryantoet-6960-lp6508-t.pdf
http://repository.unair.ac.id/40781/
http://lib.unair.ac.id
Tags: Add Tag
No Tags, Be the first to tag this record!
Institution: Universitas Airlangga
Language: Indonesian
Indonesian
id id-langga.40781
record_format dspace
institution Universitas Airlangga
building Universitas Airlangga Library
country Indonesia
collection UNAIR Repository
language Indonesian
Indonesian
topic SH334 Economic aspects. Finance
spellingShingle SH334 Economic aspects. Finance
Eto Wuryanto, Drs.,DEA
Dyah Herawatie, Ir.,M.Si
Rimuljo Hendradi, S.Si.,M.Si
PENENTUAN PELUANG KEPINDAHAN PELANGGAN DENGAN MENGGUNAKAN MODEL REGRESI LOGISTIK UNTUK DATA BERUKURAN BESAR
description Pemodelan regresi logistik sulit dilakukan jika data yang digunakan termasuk massive dataset yang pada dasarnya berkaitan dengan jumlah data yang sangat besar. Oleh karena itu, perlu dilakukan penyamplingan terhadap data induknya dan menurut penelitian sebelumnya data Squashing merupakan metode yang baik untuk mereduksi data yang telah dilakukan oleh Eto et at (2005) dan Rimuljo et at (2005). Dalam mendapatkan data Squashing ada dua tahap yang sulit yaitu : Pertama, pengelompokan atau pembuatan partisi terhadap data induk. Walaupun penelitian sebelumnya telah membahas data Squashing tetapi hanya melibatkan data dengan satu variabel. Sementara penggunaan model regresi logistik datanya minimal harus memuat 2 variabel sehingga akan terjadi kesulitan untuk mendapatkan partisi yang cocok. Akibatnya timbul persoalan, bagaimana cara pembuatan partisi untuk 2 variabel atau lebih. Kedua, metode apa yang bisa dipakai untuk menentukan nilai pseudo point dan pembobotnya untuk setiap partisi. Setelah diperoleh data Squashing, bagaimana cara menerapkan data Squashing tersebut pada model regresi logistik dan mengestimasi parameternya. Penelitian ini bertujuan mendapatkan data Squashing dengan dua variabel atau lebih dan menentukan estimator parameter model regresi logistik untuk data berukuran besar dengan program dalam bahasa C++ sebagai langkah awal dalam pembuatan software datamining. Untuk menentukan data Squashing dapat dilakukan dengan cara : Pertama, urutkan data berdasarkan variabel respon, sehingga didapat kelompok data dengan variabel respon nol dan kelompok data dengan variabel respon satu. Kedua, pada masing-masing variabel respon urutkan variabel prediktor berdasarkan varibel yang bertype non rasio. Ketiga, urutkan data yang ada di variabel rasio dari kecil ke besar. Keempat, pilih kelompok yang mempunyai anggota terbesar kemudian bagi ke dalam dua kelompok dan lakukan proses pembagian ini sampai diperoleh sebanyak kelompok yang diinginkan. Kelima, hitung nilai mean dan jumlah anggota dari tiap-tiap kelompok yang masing-masing merupakan nilai pengamatan baru (pseudo data point) dan pembobot. Sedangkan untuk mengestimasi parameter #946; pada Model Regresi Logistik dipakai metode MLE dan jika diketahui hasilnya berupa fungsi implisit maka digunakan metode Newton-Raphson. Implementasi algoritma metode squashing dan penentuan estimator parameter #946; pada model regresi logistik di lakukan dengan menggunakan program C++. Sedangkan data yang digunakan pada penelitian ini adalah data bangkitan berjumlah 100.000 data pengamatan dengan 3 variabel prediktor yang terdiri dari satu variabel berskala rasio (X1) , satu variabel berskala nominal 0,1 dan 2 (X2) , dan yang terakhir berskala nominal 0 dan 1 (X3). Penerapan program terhadap data bangkitan dengan 4 jenis kelompok data squashing menghasilkan nilai MSE semakin kecil seiring dengan membesarnya jumlah kelompok di data squashing. Sehingga dapat dikatakan bahwa secara umum estimator #946; dari data squashing dengan jumlah kelompok lebih banyak semakin mendekati nilai estimator #946; dari data induk. Adapun saran yang ingin disampaikan adalah : pembahasan ini dapat dikembangkan : pertama, untuk metode Squashing dengan jumlah variabel prediktor yang berskala rasio lebih dari satu. Kedua, perlu dibuatkan program untuk meng¬update data squashing baik jika ingin menambah jumlah kelompok maupun kalau ada data baru yang masuk dapat di update secara otomatis tanpa harus menghitung dari awal.
format Other
NonPeerReviewed
author Eto Wuryanto, Drs.,DEA
Dyah Herawatie, Ir.,M.Si
Rimuljo Hendradi, S.Si.,M.Si
author_facet Eto Wuryanto, Drs.,DEA
Dyah Herawatie, Ir.,M.Si
Rimuljo Hendradi, S.Si.,M.Si
author_sort Eto Wuryanto, Drs.,DEA
title PENENTUAN PELUANG KEPINDAHAN PELANGGAN DENGAN MENGGUNAKAN MODEL REGRESI LOGISTIK UNTUK DATA BERUKURAN BESAR
title_short PENENTUAN PELUANG KEPINDAHAN PELANGGAN DENGAN MENGGUNAKAN MODEL REGRESI LOGISTIK UNTUK DATA BERUKURAN BESAR
title_full PENENTUAN PELUANG KEPINDAHAN PELANGGAN DENGAN MENGGUNAKAN MODEL REGRESI LOGISTIK UNTUK DATA BERUKURAN BESAR
title_fullStr PENENTUAN PELUANG KEPINDAHAN PELANGGAN DENGAN MENGGUNAKAN MODEL REGRESI LOGISTIK UNTUK DATA BERUKURAN BESAR
title_full_unstemmed PENENTUAN PELUANG KEPINDAHAN PELANGGAN DENGAN MENGGUNAKAN MODEL REGRESI LOGISTIK UNTUK DATA BERUKURAN BESAR
title_sort penentuan peluang kepindahan pelanggan dengan menggunakan model regresi logistik untuk data berukuran besar
publisher UNIVERSITAS AIRLANGGA
publishDate 2006
url http://repository.unair.ac.id/40781/1/gdlhub-gdl-res-2008-wuryantoet-6960-lp6508.pdf
http://repository.unair.ac.id/40781/2/gdlhub-gdl-res-2008-wuryantoet-6960-lp6508-t.pdf
http://repository.unair.ac.id/40781/
http://lib.unair.ac.id
_version_ 1681144779013881856
spelling id-langga.407812016-10-05T05:02:50Z http://repository.unair.ac.id/40781/ PENENTUAN PELUANG KEPINDAHAN PELANGGAN DENGAN MENGGUNAKAN MODEL REGRESI LOGISTIK UNTUK DATA BERUKURAN BESAR Eto Wuryanto, Drs.,DEA Dyah Herawatie, Ir.,M.Si Rimuljo Hendradi, S.Si.,M.Si SH334 Economic aspects. Finance Pemodelan regresi logistik sulit dilakukan jika data yang digunakan termasuk massive dataset yang pada dasarnya berkaitan dengan jumlah data yang sangat besar. Oleh karena itu, perlu dilakukan penyamplingan terhadap data induknya dan menurut penelitian sebelumnya data Squashing merupakan metode yang baik untuk mereduksi data yang telah dilakukan oleh Eto et at (2005) dan Rimuljo et at (2005). Dalam mendapatkan data Squashing ada dua tahap yang sulit yaitu : Pertama, pengelompokan atau pembuatan partisi terhadap data induk. Walaupun penelitian sebelumnya telah membahas data Squashing tetapi hanya melibatkan data dengan satu variabel. Sementara penggunaan model regresi logistik datanya minimal harus memuat 2 variabel sehingga akan terjadi kesulitan untuk mendapatkan partisi yang cocok. Akibatnya timbul persoalan, bagaimana cara pembuatan partisi untuk 2 variabel atau lebih. Kedua, metode apa yang bisa dipakai untuk menentukan nilai pseudo point dan pembobotnya untuk setiap partisi. Setelah diperoleh data Squashing, bagaimana cara menerapkan data Squashing tersebut pada model regresi logistik dan mengestimasi parameternya. Penelitian ini bertujuan mendapatkan data Squashing dengan dua variabel atau lebih dan menentukan estimator parameter model regresi logistik untuk data berukuran besar dengan program dalam bahasa C++ sebagai langkah awal dalam pembuatan software datamining. Untuk menentukan data Squashing dapat dilakukan dengan cara : Pertama, urutkan data berdasarkan variabel respon, sehingga didapat kelompok data dengan variabel respon nol dan kelompok data dengan variabel respon satu. Kedua, pada masing-masing variabel respon urutkan variabel prediktor berdasarkan varibel yang bertype non rasio. Ketiga, urutkan data yang ada di variabel rasio dari kecil ke besar. Keempat, pilih kelompok yang mempunyai anggota terbesar kemudian bagi ke dalam dua kelompok dan lakukan proses pembagian ini sampai diperoleh sebanyak kelompok yang diinginkan. Kelima, hitung nilai mean dan jumlah anggota dari tiap-tiap kelompok yang masing-masing merupakan nilai pengamatan baru (pseudo data point) dan pembobot. Sedangkan untuk mengestimasi parameter #946; pada Model Regresi Logistik dipakai metode MLE dan jika diketahui hasilnya berupa fungsi implisit maka digunakan metode Newton-Raphson. Implementasi algoritma metode squashing dan penentuan estimator parameter #946; pada model regresi logistik di lakukan dengan menggunakan program C++. Sedangkan data yang digunakan pada penelitian ini adalah data bangkitan berjumlah 100.000 data pengamatan dengan 3 variabel prediktor yang terdiri dari satu variabel berskala rasio (X1) , satu variabel berskala nominal 0,1 dan 2 (X2) , dan yang terakhir berskala nominal 0 dan 1 (X3). Penerapan program terhadap data bangkitan dengan 4 jenis kelompok data squashing menghasilkan nilai MSE semakin kecil seiring dengan membesarnya jumlah kelompok di data squashing. Sehingga dapat dikatakan bahwa secara umum estimator #946; dari data squashing dengan jumlah kelompok lebih banyak semakin mendekati nilai estimator #946; dari data induk. Adapun saran yang ingin disampaikan adalah : pembahasan ini dapat dikembangkan : pertama, untuk metode Squashing dengan jumlah variabel prediktor yang berskala rasio lebih dari satu. Kedua, perlu dibuatkan program untuk meng¬update data squashing baik jika ingin menambah jumlah kelompok maupun kalau ada data baru yang masuk dapat di update secara otomatis tanpa harus menghitung dari awal. UNIVERSITAS AIRLANGGA 2006 Other NonPeerReviewed text id http://repository.unair.ac.id/40781/1/gdlhub-gdl-res-2008-wuryantoet-6960-lp6508.pdf text id http://repository.unair.ac.id/40781/2/gdlhub-gdl-res-2008-wuryantoet-6960-lp6508-t.pdf Eto Wuryanto, Drs.,DEA and Dyah Herawatie, Ir.,M.Si and Rimuljo Hendradi, S.Si.,M.Si (2006) PENENTUAN PELUANG KEPINDAHAN PELANGGAN DENGAN MENGGUNAKAN MODEL REGRESI LOGISTIK UNTUK DATA BERUKURAN BESAR. UNIVERSITAS AIRLANGGA. (Unpublished) http://lib.unair.ac.id 63