تخمین لاگ صوتی برشی با استفاده از روشهای یادگیری ماشین، و مقایسه با دادههای حاصل از مغزه
محورهای موضوعی :
هوشنگ مهرابی
1
,
ابراهیم سفیداری
2
,
سیده سپیده میرربیع
3
,
صادق براتی بلداجی
4
,
سید محمد زمانزاده
5
1 - گروه زمینشناسی نفت، پژوهشکده علوم پایه کاربردی، جهاد دانشگاهی ، تهران، ایران
2 - استادیار گروه زمینشناسی نفت، پژوهشکده علوم پایه کاربردی، جهاد دانشگاهی شهید بهشتی، تهران، ایران
3 - دانش آموخته کارشناسی ارشد، دانشکده زمینشناسی، پردیس علوم، دانشگاه تهران، تهران، ایران
4 - کارشناس ارشد، گروه زمینشناسی نفت، پژوهشکده علوم پایه کاربردی، جهاد دانشگاهی شهید بهشتی، تهران، ایران
5 - دانشگاه تهران
کلید واژه: پایتون, تخمین, لاگ صوتی برشی, یادگیری ماشین,
چکیده مقاله :
امروزه استفاده از روشهای یادگیری ماشین در تخمین دادههای پتروفیزیکی کاربرد فراوانی دارد. در این مطالعه سعی شده لاگ صوتی برشی از دیگر دادههای پتروفیزیکی با روشهای یادگیری ماشین محاسبه و با دادههای صوتی حاصل از مغزه مقایسه شوند. برای این منظور در ابتدا برای نرمالسازی دادهها روشهای محاسباتی انحراف معیار، جنگل انزوا، حداقل کوواریانس و فاکتور پرتی استفاده و مورد مقایسه قرار گرفتند. با توجه به مقدار دادههای حذفی و نمودارهای جعبهای رسم شده، روش انحراف معیار برای نرمالسازی انتخاب شد. روشهای یادگیری ماشین استفاده شده شامل جنگل تصادفی، رگرسیون چندگانه، رگرسیون تقویت شده، رگرسیون بردار پشتیبان، K نزدیکترین همسایه و پرسپترون چندلایه میباشند. رگرسیون چندگانه پایینترین اندیس ارزیابی (94/0 = R2) را داشت درحالیکه رگرسیون جنگل تصمیمگیری با اندیس ارزیابی برابر 98/0، بالاترین همبستگی بین لاگهای صوتی برشی تخمین زده شده و لاگ صوتی اصلی را داشتند. بنابراین برای تخمین نهایی از رگرسیون جنگل تصادفی استفاده شد و برای جلوگیری از کلیت بخشی یا بیش برازش دادهها، از تابع GridSearchCV هایپرپارامترهای بهینه محاسبه و تخمین نهایی انجام شد. لاگ صوتی برشی تخمینی، با دادههای صوتی حاصل از مغزه قرابت بسیار بالایی را نشان دادند.
Machine learning methods are widely used today to estimate petrophysical data. In this study, an attempt has been made to calculate shear sonic log (DTS) from other petrophysical data using machine learning methods and compare it with the sonic data obtained from the core. For this purpose, computational methods such as Standard Deviation, Isolation Forest, Min. Covariance, and Outlier Factors were used to normalize the data and were compared. Given the amount of missing data and box plots, the Standard Deviation method was selected for normalization. The machine learning methods used include Random Forest, Multiple Regression, Boosted Regression, Support Vector Regression, K-Nearest Neighbor, and MLP Regressor. Multiple regression had the lowest evaluation index (R2=0.94), while Random Forest regression had the highest correlation between the estimated shear sonic log and the original shear sonic log with an evaluation index of 0.98. Therefore, Random Forest regression was used for the final estimation, and to prevent data generalization or overfitting, the GridSearchCV function was used to calculate optimal hyperparameters and final estimation. The estimated sonic log showed a very high similarity with the core data.
