Research Article
BibTex RIS Cite

Comparative analysis of regression models for predicting diamond price

Year 2022, Volume: 11 Issue: 4, 838 - 845, 14.10.2022
https://doi.org/10.28948/ngumuh.1088916

Abstract

With the developments in informatics and the increasing volume and diversity of data, the concept of big data has entered our lives and brought many challenges with it. The usefulness of data has gained great importance and the performance of some commonly used data processing methods have begun to be insufficient. These problems have been tried to be solved by using artificial intelligence and machine learning techniques that find more effective solutions. The aim of this study is to run well-known and frequently used machine learning algorithms on a public dataset, to compare their performance results comparatively, and present the best performant ones. A public data on diamonds is preprocessed, descriptive analysis is performed, and various regression models to predict the corresponding prices are run, both in their primitive and optimized forms, GBM models (especially Light GBM) and random forest algorithm have the lowest RMSE values and highest r2 values compared to other models.

References

  • Kaggle Diamonds Dataset. https://www.kaggle.com /shivam2503/diamonds, Accessed 02 March 2022.
  • G. Sharma, V. Tripathi, M. Mahajan and A. K. Srivastava, Comparative analysis of supervised models for diamond price prediction. Proceedings of 11th International Conference on Cloud Computing, Data Science & Engineering (Confluence), pp. 1019-1022, Uttar Prades, India, 2021.
  • W. Alsuraihi, E. Al-hazmi, K. Bawazeer and H. Alghamdi, Machine learning algorithms for diamond price prediction. Proceedings of 2nd ACM International Conference on Image, Video and Signal Processing (IVSP '20), pp. 150–154, Singapour, 2020.
  • A. C. Pandey, S. Misra and M. Saxena, Gold and diamond price prediction using enhanced ensemble learning. Proceedings of 12th International Conference on Contemporary Computing (IC3), pp. 1-4, Noida, India, 2019.
  • H. Mihir, M. I. Patel, S. Jani and R. Gajjar, Diamond price prediction using machine learning. Proceedings of 2nd IEEE International Conference on Communication, Computing and Industry 4.0 (C2I4), pp. 1-5, Bangalore, India, 2021.
  • N. Monburinon, P. Chertchom, T. Kaewkiriya, S. Rungpheung, S. Buya and P. Boonpou, Prediction of prices for used car by using regression models. Proceedings of 5th International Conference on Business and Industrial Research (ICBIR), pp. 115-119, Thailand, 2018.
  • C. R. Madhuri, G. Anuradha and M. V. Pujitha, House price prediction using regression techniques: A comparative study. Proceedings of International Conference on Smart Structures and Systems (ICSSS), pp. 1-5, Madras, India, 2019.
  • M. C. Satıoğlu, Y. Ar ve B. Tuğrul, Automobile price prediction in Turkey marketplace with linear regression. Proceedings of 5th International Symposium on Multidisciplinary Studies and Innovative Technologies (ISMSIT), pp. 329-333, Turkey, 2021.
  • V. Gupta, K. Singh, S. K. Arjaria and B. Biswas, Dynamic pricing in movie tickets using regression techniques. Proceedings of International Conference on Advanced Computation and Telecommunication (ICACAT), pp. 1-4, India, 2018.
  • G. K. Kumar, D. M. Rani, N. Koppula and S. Ashraf, Prediction of house price using machine learning algorithms. Proceedings of 5th International Conference on Trends in Electronics and Informatics (ICOEI), pp. 1268-1271, India, 2021.
  • G. Yin, F. J. I. Alazzawi, S. Mironov, F. Reegu, A. S. El-Shafay, M. L. Rahman, C. H. Su, Y. Z. Lu and H. C. Nguyen, Machine learning method for simulation of adsorption separation: Comparisons of model’s performance in predicting equilibrium concentrations, Arabian Journal of Chemistry. 15 (3), 103612, 1-10, 2022. https://doi.org/10.1016/j.arabjc.2021.103612.
  • LightGBM, https://www.microsoft.com/en-us/research/project/lightgbm/, Accessed 03 March 2022.

Pırlanta fiyat tahmini için regresyon modellerinin karşılaştırmalı analizi

Year 2022, Volume: 11 Issue: 4, 838 - 845, 14.10.2022
https://doi.org/10.28948/ngumuh.1088916

Abstract

Bilişim dünyasındaki gelişmeler ile artan veri hacmi ve çeşitliliği ile birlikte, hayatımıza büyük veri kavramı girmiş ve beraberinde birçok zorluğu da peşinde getirmiştir. Verinin işlenebilirliği büyük bir önem kazanmış ve güncel kullanılan bazı veri işleme yöntemlerinin performansı yetersiz gelmeye başlamıştır. Büyük veri analizinde yapay zekâ ve makine öğrenmesi teknikleri kullanılarak bu sorunlar çözülmeye çalışılmakta ve gün geçtikçe daha etkin çözümler bulan algoritmalar önerilmeye devam edilmektedir. Bu çalışmanın amacı, iyi bilinen ve sıklıkla kullanılan regresyon algoritmalarını bir veri kümesi üzerinde çalıştırmak, performans sonuçlarını karşılaştırarak en iyi sonuç verenleri sunmaktır. Makalede pırlantaların kesimi, rengi, berraklığı ve fiyatı gibi özellikleri barındıran açık bir veri kümesi kullanılmıştır. Verilerin ön işlemesi yapılmış, tanımlayıcı analiz gerçekleştirilmiş ve fiyatlarının tahmini için farklı regresyon modelleri hem ilkel hem de optimize edilmiş halleriyle çalıştırılmıştır. Regresyon modelleri içinden diğerlerine kıyasla daha düşük RMSE ve daha yüksek r2 değerleri GBM modelleri (özellikle Light GBM) ve rassal orman algoritmasında alınmıştır.

References

  • Kaggle Diamonds Dataset. https://www.kaggle.com /shivam2503/diamonds, Accessed 02 March 2022.
  • G. Sharma, V. Tripathi, M. Mahajan and A. K. Srivastava, Comparative analysis of supervised models for diamond price prediction. Proceedings of 11th International Conference on Cloud Computing, Data Science & Engineering (Confluence), pp. 1019-1022, Uttar Prades, India, 2021.
  • W. Alsuraihi, E. Al-hazmi, K. Bawazeer and H. Alghamdi, Machine learning algorithms for diamond price prediction. Proceedings of 2nd ACM International Conference on Image, Video and Signal Processing (IVSP '20), pp. 150–154, Singapour, 2020.
  • A. C. Pandey, S. Misra and M. Saxena, Gold and diamond price prediction using enhanced ensemble learning. Proceedings of 12th International Conference on Contemporary Computing (IC3), pp. 1-4, Noida, India, 2019.
  • H. Mihir, M. I. Patel, S. Jani and R. Gajjar, Diamond price prediction using machine learning. Proceedings of 2nd IEEE International Conference on Communication, Computing and Industry 4.0 (C2I4), pp. 1-5, Bangalore, India, 2021.
  • N. Monburinon, P. Chertchom, T. Kaewkiriya, S. Rungpheung, S. Buya and P. Boonpou, Prediction of prices for used car by using regression models. Proceedings of 5th International Conference on Business and Industrial Research (ICBIR), pp. 115-119, Thailand, 2018.
  • C. R. Madhuri, G. Anuradha and M. V. Pujitha, House price prediction using regression techniques: A comparative study. Proceedings of International Conference on Smart Structures and Systems (ICSSS), pp. 1-5, Madras, India, 2019.
  • M. C. Satıoğlu, Y. Ar ve B. Tuğrul, Automobile price prediction in Turkey marketplace with linear regression. Proceedings of 5th International Symposium on Multidisciplinary Studies and Innovative Technologies (ISMSIT), pp. 329-333, Turkey, 2021.
  • V. Gupta, K. Singh, S. K. Arjaria and B. Biswas, Dynamic pricing in movie tickets using regression techniques. Proceedings of International Conference on Advanced Computation and Telecommunication (ICACAT), pp. 1-4, India, 2018.
  • G. K. Kumar, D. M. Rani, N. Koppula and S. Ashraf, Prediction of house price using machine learning algorithms. Proceedings of 5th International Conference on Trends in Electronics and Informatics (ICOEI), pp. 1268-1271, India, 2021.
  • G. Yin, F. J. I. Alazzawi, S. Mironov, F. Reegu, A. S. El-Shafay, M. L. Rahman, C. H. Su, Y. Z. Lu and H. C. Nguyen, Machine learning method for simulation of adsorption separation: Comparisons of model’s performance in predicting equilibrium concentrations, Arabian Journal of Chemistry. 15 (3), 103612, 1-10, 2022. https://doi.org/10.1016/j.arabjc.2021.103612.
  • LightGBM, https://www.microsoft.com/en-us/research/project/lightgbm/, Accessed 03 March 2022.
There are 12 citations in total.

Details

Primary Language Turkish
Subjects Computer Software
Journal Section Computer Engineering
Authors

Merve Asil 0000-0002-6331-5734

Gülfem Işıklar Alptekin 0000-0003-0146-1581

Publication Date October 14, 2022
Submission Date March 16, 2022
Acceptance Date July 18, 2022
Published in Issue Year 2022 Volume: 11 Issue: 4

Cite

APA Asil, M., & Işıklar Alptekin, G. (2022). Pırlanta fiyat tahmini için regresyon modellerinin karşılaştırmalı analizi. Niğde Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi, 11(4), 838-845. https://doi.org/10.28948/ngumuh.1088916
AMA Asil M, Işıklar Alptekin G. Pırlanta fiyat tahmini için regresyon modellerinin karşılaştırmalı analizi. NOHU J. Eng. Sci. October 2022;11(4):838-845. doi:10.28948/ngumuh.1088916
Chicago Asil, Merve, and Gülfem Işıklar Alptekin. “Pırlanta Fiyat Tahmini için Regresyon Modellerinin karşılaştırmalı Analizi”. Niğde Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi 11, no. 4 (October 2022): 838-45. https://doi.org/10.28948/ngumuh.1088916.
EndNote Asil M, Işıklar Alptekin G (October 1, 2022) Pırlanta fiyat tahmini için regresyon modellerinin karşılaştırmalı analizi. Niğde Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi 11 4 838–845.
IEEE M. Asil and G. Işıklar Alptekin, “Pırlanta fiyat tahmini için regresyon modellerinin karşılaştırmalı analizi”, NOHU J. Eng. Sci., vol. 11, no. 4, pp. 838–845, 2022, doi: 10.28948/ngumuh.1088916.
ISNAD Asil, Merve - Işıklar Alptekin, Gülfem. “Pırlanta Fiyat Tahmini için Regresyon Modellerinin karşılaştırmalı Analizi”. Niğde Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi 11/4 (October 2022), 838-845. https://doi.org/10.28948/ngumuh.1088916.
JAMA Asil M, Işıklar Alptekin G. Pırlanta fiyat tahmini için regresyon modellerinin karşılaştırmalı analizi. NOHU J. Eng. Sci. 2022;11:838–845.
MLA Asil, Merve and Gülfem Işıklar Alptekin. “Pırlanta Fiyat Tahmini için Regresyon Modellerinin karşılaştırmalı Analizi”. Niğde Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi, vol. 11, no. 4, 2022, pp. 838-45, doi:10.28948/ngumuh.1088916.
Vancouver Asil M, Işıklar Alptekin G. Pırlanta fiyat tahmini için regresyon modellerinin karşılaştırmalı analizi. NOHU J. Eng. Sci. 2022;11(4):838-45.

download