Синтез моделей виявлення шахрайства в цифрових платіжних системах з використанням алгоритмів автоматичного машинного навчання

Автор(и)

  • Oleh Kolodiziev Харківський національний економічний університет імені Семена Кузнеця пр. Науки, 9-А, м. Харків, Україна, 61166, Україна https://orcid.org/0000-0002-6715-2901
  • Aleksey Mints Приазовський державний технічний університет вул. Університетська, 7, м. Маріуполь, Україна, 87555, Україна https://orcid.org/0000-0002-8032-005X
  • Pavlo Sidelov Приазовський державний технічний університет вул. Університетська, 7, м. Маріуполь, Україна, 87555, Україна https://orcid.org/0000-0001-5672-8189
  • Inna Pleskun Харківський національний економічний університет імені Семена Кузнеця пр. Науки, 9-А, м. Харків, Україна, 61166, Україна https://orcid.org/0000-0002-6974-8282
  • Olha Lozynska Харківський національний економічний університет імені Семена Кузнеця пр. Науки, 9-А, м. Харків, Україна, 61166, Україна https://orcid.org/0000-0003-2882-3546

DOI:

https://doi.org/10.15587/1729-4061.2020.212830

Ключові слова:

цифрові платежі, машинне навчання, автоматичний синтез, виявлення шахрайства, наука про дані

Анотація

Дані глобальної фінансової статистики свідчать, що загальні втрати від шахрайських транзакцій у всьому світі постійно зростають. Проблему платіжного шахрайства загострює цифровізація економічних відносин, зокрема впровадження банками концепції "Bank-as-a-Service", що підвищить навантаження на платіжні сервіси.

Метою дослідження є синтез ефективних моделей виявлення шахрайства в цифрових платіжних системах з використанням алгоритмів автоматичного машинного навчання та аналізу BigData.

Запропоновано і систематизовано підходи до розширення інформаційної бази для виявлення шахрайських транзакцій. Обґрунтовано вибір метрик ефективності для побудови і порівняння моделей.

Для розв’язання задачі запропоновано використання алгоритмів автоматичного машинного навчання, які дозволяють за короткий час перебрати велику кількість варіантів моделей, їх ансамблів і наборів вхідних даних. За рахунок цього в проведених експериментах вдалося отримати якість класифікації по метриці AUC на рівні 0.977–0.982. Це перевищує ефективність класифікаторів, розроблених традиційними методами, при тому, що витрати часу на синтез моделей набагато нижче і вимірюються годинами. Ансамбль моделей дозволив виділити до 85,7 % шахрайських транзакцій в вибірці. Точність виявлення шахрайських транзакцій також є високою (79 %–85 %).

Результати дослідження підтверджують ефективність використання алгоритмів автоматичного машинного навчання для синтезу моделей виявлення шахрайства в цифрових платіжних системах. Причому ефективність проявляється не тільки в якості отриманих класифікаторів, але і в зниженні витрат на їх розробку, а також у високому потенціалі інтерпретованості. Використання результатів дослідження дозволить фінансовим установам скоротити фінансові і часові витрати на розробку та актуалізацію активних систем протидії платіжному шахрайству, підвищити ефективність моніторингу фінансових операцій

Дані глобальної фінансової статистики свідчать, що загальні втрати від шахрайських транзакцій у всьому світі постійно зростають. Проблему платіжного шахрайства загострює цифровізація економічних відносин, зокрема впровадження банками концепції "Bank-as-a-Service", що підвищить навантаження на платіжні сервіси.

Метою дослідження є синтез ефективних моделей виявлення шахрайства в цифрових платіжних системах з використанням алгоритмів автоматичного машинного навчання та аналізу Big Data.

Запропоновано і систематизовано підходи до розширення інформаційної бази для виявлення шахрайських транзакцій. Обґрунтовано вибір метрик ефективності для побудови і порівняння моделей.

Для розв’язання задачі запропоновано використання алгоритмів автоматичного машинного навчання, які дозволяють за короткий час перебрати велику кількість варіантів моделей, їх ансамблів і наборів вхідних даних. За рахунок цього в проведених експериментах вдалося отримати якість класифікації по метриці AUC на рівні 0.977–0.982. Це перевищує ефективність класифікаторів, розроблених традиційними методами, при тому, що витрати часу на синтез моделей набагато нижче і вимірюються годинами. Ансамбль моделей дозволив виділити до 85,7 % шахрайських транзакцій в вибірці. Точність виявлення шахрайських транзакцій також є високою (79 %–85 %).

Результати дослідження підтверджують ефективність використання алгоритмів автоматичного машинного навчання для синтезу моделей виявлення шахрайства в цифрових платіжних системах. Причому ефективність проявляється не тільки в якості отриманих класифікаторів, але і в зниженні витрат на їх розробку, а також у високому потенціалі інтерпретованості. Використання результатів дослідження дозволить фінансовим установам скоротити фінансові і часові витрати на розробку та актуалізацію активних систем протидії платіжному шахрайству, підвищити ефективність моніторингу фінансових операцій

Біографії авторів

Oleh Kolodiziev, Харківський національний економічний університет імені Семена Кузнеця пр. Науки, 9-А, м. Харків, Україна, 61166

Доктор економічних наук, професор, завідувач кафедри

Кафедра банківської справи і фінансових послуг

Aleksey Mints, Приазовський державний технічний університет вул. Університетська, 7, м. Маріуполь, Україна, 87555

Доктор економічних наук, доцент, завідувач кафедри

Кафедра фінансів і банківської справи

Pavlo Sidelov, Приазовський державний технічний університет вул. Університетська, 7, м. Маріуполь, Україна, 87555

Аспірант

Кафедра фінансів і банківської справи

Inna Pleskun, Харківський національний економічний університет імені Семена Кузнеця пр. Науки, 9-А, м. Харків, Україна, 61166

Аспірант

Кафедра банківської справи і фінансових послуг

Olha Lozynska, Харківський національний економічний університет імені Семена Кузнеця пр. Науки, 9-А, м. Харків, Україна, 61166

Аспірант

Кафедра банківської справи і фінансових послуг

Посилання

  1. The Nilson Report (2013). Issue 1023. Available at: https://nilsonreport.com/publication_newsletter_archive_issue.php?issue=1023
  2. The Nilson Report (2017). Issue 1118. Available at: https://nilsonreport.com/publication_newsletter_archive_issue.php?issue=1118
  3. Pozzolo, A. D., Caelen, O., Johnson, R. A., Bontempi, G. (2015). Calibrating Probability with Undersampling for Unbalanced Classification. 2015 IEEE Symposium Series on Computational Intelligence. doi: https://doi.org/10.1109/ssci.2015.33
  4. Dal Pozzolo, A., Caelen, O., Waterschoot, S., Bontempi, G. (2013). Racing for Unbalanced Methods Selection. Lecture Notes in Computer Science, 24–31. doi: https://doi.org/10.1007/978-3-642-41278-3_4
  5. Polozhennia pro orhanizatsiyu zakhodiv iz zabezpechennia informatsiynoi bezpeky v bankivskiy systemi Ukrainy 28.09.2017 No. 95. Available at: https://zakon.rada.gov.ua/laws/show/v0095500-17#Text
  6. Pro zapobihannia ta protydiu lehalizatsiyi (vidmyvanniu) dokhodiv, oderzhanykh zlochynnym shliakhom, finansuvanniu teroryzmu ta finansuvanniu rozpovsiudzhennia zbroi masovoho znyshchennia 2020, No. 25, st. 17. Available at: https://zakon.rada.gov.ua/laws/show/361-20#n831
  7. Dal Pozzolo, A. (2015). Adaptive Machine learning for credit card fraud detection. Université Libre de Bruxelles. Available at: http://di.ulb.ac.be/map/adalpozz/pdf/Dalpozzolo2015PhD.pdf
  8. Russac, Y., Caelen, O., He-Guelton, L. (2018). Embeddings of Categorical Variables for Sequential Data in Fraud Context. Advances in Intelligent Systems and Computing, 542–552. doi: https://doi.org/10.1007/978-3-319-74690-6_53
  9. Carcillo, F., Le Borgne, Y.-A., Caelen, O., Kessaci, Y., Oblé, F., Bontempi, G. (2019). Combining unsupervised and supervised learning in credit card fraud detection. Information Sciences. doi: https://doi.org/10.1016/j.ins.2019.05.042
  10. Lebichot, B., Braun, F., Caelen, O., Saerens, M. (2016). A graph-based, semi-supervised, credit card fraud detection system. Complex Networks & Their Applications V, 721–733. doi: https://doi.org/10.1007/978-3-319-50901-3_57
  11. Lebichot, B., Le Borgne, Y.-A., He-Guelton, L., Oblé, F., Bontempi, G. (2019). Deep-Learning Domain Adaptation Techniques for Credit Cards Fraud Detection. Recent Advances in Big Data and Deep Learning, 78–88. doi: https://doi.org/10.1007/978-3-030-16841-4_8
  12. Georgieva, S., Markova, M., Pavlov, V. (2019). Using neural network for credit card fraud detection. Renewable energy sources and technologies. doi: https://doi.org/10.1063/1.5127478
  13. Lucas, Y., Portier, P.-E., Laporte, L. et. al. (2019). Towards automated feature engineering for credit card fraud detection using multi-perspective HMMs. Available at: https://www.researchgate.net/publication/335600419
  14. Fraud detection with machine learning. Available at: https://www.researchgate.net/project/Fraud-detection-with-machine-learning
  15. Wei, W., Li, J., Cao, L., Ou, Y., Chen, J. (2012). Effective detection of sophisticated online banking fraud on extremely imbalanced data. World Wide Web, 16 (4), 449–475. doi: https://doi.org/10.1007/s11280-012-0178-0
  16. Mahmoudi, N., Duman, E. (2015). Detecting credit card fraud by Modified Fisher Discriminant Analysis. Expert Systems with Applications, 42 (5), 2510–2516. doi: https://doi.org/10.1016/j.eswa.2014.10.037
  17. Sudjianto, A., Nair, S., Yuan, M., Zhang, A., Kern, D., Cela-Díaz, F. (2010). Statistical Methods for Fighting Financial Crimes. Technometrics, 52 (1), 5–19. doi: https://doi.org/10.1198/tech.2010.07032
  18. Patidar, R., Sharma, L. (2011). Credit card fraud detection using neural network. International Journal of Soft Computing and Engineering (IJSCE), 1, 32–38. Available at: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.301.8231&rep=rep1&type=pdf
  19. Mints, A. (2017). Classification of tasks of data mining and data processing in the economy. Baltic Journal of Economic Studies, 3 (3), 47–52. doi: https://doi.org/10.30525/2256-0742/2017-3-3-47-52
  20. Sahin, Y., Bulkan, S., Duman, E. (2013). A cost-sensitive decision tree approach for fraud detection. Expert Systems with Applications, 40 (15), 5916–5923. doi: https://doi.org/10.1016/j.eswa.2013.05.021
  21. Xuan, S., Liu, G., Li, Z., Zheng, L., Wang, S., Jiang, C. (2018). Random forest for credit card fraud detection. 2018 IEEE 15th International Conference on Networking, Sensing and Control (ICNSC). doi: https://doi.org/10.1109/icnsc.2018.8361343
  22. Fu, K., Cheng, D., Tu, Y., Zhang, L. (2016). Credit Card Fraud Detection Using Convolutional Neural Networks. Lecture Notes in Computer Science, 483–490. doi: https://doi.org/10.1007/978-3-319-46675-0_53
  23. Zareapoor, M., Shamsolmoali, P. (2015). Application of Credit Card Fraud Detection: Based on Bagging Ensemble Classifier. Procedia Computer Science, 48, 679–685. doi: https://doi.org/10.1016/j.procs.2015.04.201
  24. Schapire, R. E. (1990). The strength of weak learnability. Machine Learning, 5 (2), 197–227. doi: https://doi.org/10.1007/bf00116037
  25. Sammut, C., Webb, G. I. (Eds.) (2010). Encyclopedia of machine learning. Springer. doi: https://doi.org/10.1007/978-0-387-30164-8
  26. Vnukova, N., Kavun, S., Kolodiziev, O., Achkasova, S., Hontar, D. (2019). Determining the level of bank connectivity for combating money laundering, terrorist financing and proliferation of weapons of mass destruction. Banks and Bank Systems, 14 (4), 42–54. doi: https://doi.org/10.21511/bbs.14(4).2019.05
  27. Malyaretz, L., Dorokhov, O., Dorokhova, L. (2018). Method of Constructing the Fuzzy Regression Model of Bank Competitiveness. Journal of Central Banking Theory and Practice, 7 (2), 139–164. doi: https://doi.org/10.2478/jcbtp-2018-0016
  28. Minsky, M., Papert, S. (2017). Perceptrons. MIT Press. doi: https://doi.org/10.7551/mitpress/11301.001.0001
  29. Driverless AI Documentation - Overview. Available at: http://docs.h2o.ai/driverless-ai/latest-stable/docs/userguide/index.html
  30. Driverless AI Documentation - Scorers. Available at: http://docs.h2o.ai/driverless-ai/latest-stable/docs/userguide/scorers.html
  31. Fabuš, M., Dubrovina, N., Guryanova, L., Chernova, N., Zyma, O. (2019). Strengthening financial decentralization: driver or risk factor for sustainable socio-economic development of territories? Entrepreneurship and Sustainability Issues, 7 (2), 875–890. doi: https://doi.org/10.9770/jesi.2019.7.2(6)
  32. Mints, O., Marhasova, V., Hlukha, H., Kurok, R., Kolodizieva, T. (2019). Analysis of the stability factors of Ukrainian banks during the 2014–2017 systemic crisis using the Kohonen self-organizing neural networks. Banks and Bank Systems, 14 (3), 86–98. doi: https://doi.org/10.21511/bbs.14(3).2019.08

##submission.downloads##

Опубліковано

2020-10-31

Як цитувати

Kolodiziev, O., Mints, A., Sidelov, P., Pleskun, I., & Lozynska, O. (2020). Синтез моделей виявлення шахрайства в цифрових платіжних системах з використанням алгоритмів автоматичного машинного навчання. Eastern-European Journal of Enterprise Technologies, 5(9 (107), 14–26. https://doi.org/10.15587/1729-4061.2020.212830

Номер

Розділ

Інформаційно-керуючі системи