LOGGING SUMUR SINTETIK MENGGUNAKAN TEKNIK MACHINE LEARNING DENGAN DUA PERLAKUAN MISSING VALUE YANG BERBEDA
Masalah yang timbul dalam aktivitas well log mengakibatkan pencatatan nilai dari parameter fisik formasi menjadi tidak akurat. Hal ini akan berdampak pula pada interpretasi hasil logging yang dilakukan. Bad hole, kerusakan alat, dan alasan ekonomi menjadi beberapa penyebabnya. Metode pembelajaran me...
Saved in:
Main Author: | |
---|---|
Format: | Final Project |
Language: | Indonesia |
Subjects: | |
Online Access: | https://digilib.itb.ac.id/gdl/view/57793 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Institution: | Institut Teknologi Bandung |
Language: | Indonesia |
Summary: | Masalah yang timbul dalam aktivitas well log mengakibatkan pencatatan nilai dari parameter fisik formasi menjadi tidak akurat. Hal ini akan berdampak pula pada interpretasi hasil logging yang dilakukan. Bad hole, kerusakan alat, dan alasan ekonomi menjadi beberapa penyebabnya. Metode pembelajaran mesin atau sering disebut machine learning adalah ilmu yang mempelajari sekumpulan data atau pola untuk nantinya akan dijadikan model untuk memprediksi nilai atau membuat keputusan. Aplikasi machine learning dalam aktivitas well logging sudah dilakukan oleh banyak peneliti. Salah satunya adalah pembuatan data sintetis well logging. Pengaplikasian metode ini dapat mengatasi kekurangan data akibat formasi yang rusak atau kecacatan alat.
Pada studi kasus ini, akan dibahas tentang aplikasi berbagai macam metode machine learning terhadap sebuah well logging dataset. Dari parameter data well log yang tersedia, akan diuji dua kasus yang berbeda. Kasus pertama adalah prediksi nilai bulk density dari 6 prediktor yaitu CGR, GR, NPHI, RS, RD, dan RMSF. Kasus kedua adalah prediksi nilai Poisson’s ratio dari 5 prediktor yaitu CGR, GR, NPHI, DTDRT, dan DTCRT. Dataset yang dipakai mengandung nilai yang hilang (sering disebut nilai NaN), sehingga, akan dilakukan penyaringan data yang hilang. Pada setiap kasus akan diperlakukan 2 perlakuan yang berbeda. Perlakuan pertama adalah pengisian data yang hilang dengan metode k-nearest neighbor (k-NN) imputation. Perlakuan kedua adalah eliminasi baris data yang hilang. Hasil dari perbedaan perlakuan ini akan dibandingkan untuk kemudian akan dipilih perlakuan mana yang memberikan hasil yang terbaik.
Dari aktivitas pembuatan data well log sintetis, diperoleh 20 data log yang dikombinasikan dari 5 metode machine learning yaitu linier regression, decision tress, random forest, gradient boosting, dan artificial neural network (ANN). Untuk kasus pertama diperoleh bahwa model yang paling bagus adalah model random forest dengan perlakuan eliminasi data yang hilang. Sedangkan pada kasus kedua, model yang paling bagus adalah model gradient boosting dengan perlakuan eliminasi data yang hilang. Dari tren 20 data log, diperoleh bahwa perlakuan yang paling cocok dan memberikan hasil yang terbaik adalah perlakuan eliminasi data yang hilang. Hal ini ditunjukkan dengan nilai root mean squared eroor (RMSE) yang kecil. Selain itu, sensitivitas parameter predictor dilakukan untuk mengetahui variabel mana yang paling kuat mempengaruhi hasil. Untuk kasus pertama diperoleh bahwa parameter yang paling sensitif adalah neutron porosity (NPHI) dan untuk kasus kedua parameter yang paling sensitif adalah Delta-T Shear (DTDRT) atau waktu interval yang ditempuh oleh secondary wave. |
---|