Знаходження найвпливовіших факторних ознак при побудові лінійних регресійних моделей

Автор(и)

  • Fedir Geche ДВНЗ «Ужгородський національний університет», пл. Народна, 3, м. Ужгород, Україна, 88000, Україна https://orcid.org/0000-0002-4757-9828
  • Oksana Mulesa ДВНЗ «Ужгородський національний університет», пл. Народна, 3, м. Ужгород, Україна, 88000, Україна https://orcid.org/0000-0002-6117-5846
  • Viktor Hrynenko ДВНЗ «Ужгородський національний університет», пл. Народна, 3, м. Ужгород, Україна, 88000, Україна https://orcid.org/0000-0002-4606-0792
  • Veronika Smolanka ДВНЗ «Ужгородський національний університет», пл. Народна, 3, м. Ужгород, Україна, 88000, Україна https://orcid.org/0000-0002-8380-1967

DOI:

https://doi.org/10.15587/2312-8372.2019.175020

Ключові слова:

множинна лінійна регресія, частинні коефіцієнти кореляції, факторні ознаки, адекватність моделі

Анотація

Об’єктом дослідження є задача побудови лінійної регресійної моделі, яка виникає в процесі вирішення проблеми прогнозування значень залежної змінної від сукупності незалежних факторних ознак. Ця задача часто виникає в процесі аналізу показників економічної діяльності підприємств. Процес побудови рівняння регресії, яке адекватно відображає залежність між факторними ознаками та досліджуваними результуючими ознаками, є багатоетапною і трудомісткою процедурою. Важливим при цьому є етап вибору найвпливовіших факторних ознак. Від ефективності проведення такого етапу та правильності вибору системи ознак залежить адекватність регресійної моделі та ефективність аналізу діяльності підприємств. В наукових джерелах пропонується ряд методів та алгоритмів для вибору найвпливовіших факторних ознак. Деякі з них базуються на кореляційно-регресійному аналізі, проте є ряд евристичних методів. В дослідженнях показано, що використання різних методів відбору найвпливовіших факторних ознак для розв’язання конкретних задач, в загальному випадку призводить до отримання різних результатів. При цьому особливістю більшості методів є їх обчислювальна складність або нестійкість щодо умов застосування. Основним критерієм ефективності алгоритмів вибору факторних ознак є адекватність побудованої регресійної моделі.

В дослідженні проведено аналіз процесу побудови множинних лінійний регресійних моделей. Визначено основні його етапи та наведено базові поняття і розрахункові формули. Авторами пропонується алгоритм вибору найвпливовіших факторних ознак при побудові лінійних регресійних моделей. Особливістю запропонованого підходу є те, що він базується на властивостях частинних коефіцієнтів кореляції. Застосування розробленого алгоритму дозволяє зменшувати обчислювальну складність процесу вибору факторних ознак в порівнянні з відомими алгоритмами.

Виконана експериментальна верифікація розробленого алгоритму для задачі побудови залежностей між різними показниками діяльності двох підприємств у вигляді множинної лінійної регресії. В результаті проведених обчислень з системи 17 факторних ознак для кожного досліджуваного показника було відібрано одну або дві впливові ознаки. Побудовані при цьому рівняння множинної лінійної регресії мали достовірність, яка перевищує 90 %.

Біографії авторів

Fedir Geche, ДВНЗ «Ужгородський національний університет», пл. Народна, 3, м. Ужгород, Україна, 88000

Доктор технічних наук, професор, завідувач кафедри

Кафедра кібернетики і прикладної математики

Oksana Mulesa, ДВНЗ «Ужгородський національний університет», пл. Народна, 3, м. Ужгород, Україна, 88000

Кандидат технічних наук, доцент

Кафедра кібернетики і прикладної математики

Viktor Hrynenko, ДВНЗ «Ужгородський національний університет», пл. Народна, 3, м. Ужгород, Україна, 88000

Аспірант

Кафедра кібернетики і прикладної математики

Veronika Smolanka, ДВНЗ «Ужгородський національний університет», пл. Народна, 3, м. Ужгород, Україна, 88000

Аспірант

Кафедра кібернетики і прикладної математики

Посилання

  1. Smeekes, S., Wijler, E. (2018). Macroeconomic forecasting using penalized regression methods. International Journal of Forecasting, 34 (3), 408–430. doi: https://doi.org/10.1016/j.ijforecast.2018.01.001
  2. Alvarez-Diaz, M., Alvarez, A. (2010). Forecasting exchange rates using local regression. Applied Economics Letters, 17 (5), 509–514. doi: https://doi.org/10.1080/13504850801987217
  3. Cleland, A. C., Earle, M. D., Boag, I. F. (2007). Application of multiple linear regression to analysis of data from factory energy surveys. International Journal of Food Science & Technology, 16 (5), 481–492. doi: https://doi.org/10.1111/j.1365-2621.1981.tb01841.x
  4. Heche, F. E. (2019). Teoriya ymovirnostei i matematychna statystyka. Uzhhorod: AUTDOR-ShARK, 235.
  5. Baltagi, B. (2008). Econometric analysis of panel data. John Wiley & Sons, 388.
  6. Shojima, K., Usami, S., Hashimoto, T., Todo, N., Takano, K. (2018). Understanding Differences in Statistical Models. The Annual Report of Educational Psychology in Japan, 57, 302–308. doi: https://doi.org/10.5926/arepj.57.302
  7. Depczynski, U., Frost, V. J., Molt, K. (2000). Genetic algorithms applied to the selection of factors in principal component regression. Analytica Chimica Acta, 420 (2), 217–227. doi: https://doi.org/10.1016/s0003-2670(00)00893-x
  8. Tibshirani, R. (1996). Regression Shrinkage and Selection Via the Lasso. Journal of the Royal Statistical Society: Series B (Methodological), 58 (1), 267–288. doi: https://doi.org/10.1111/j.2517-6161.1996.tb02080.x
  9. Mulesa, O. (2016). Development of evolutionary methods of the structural and parametric identification for tabular dependencies. Technology audit and production reserves, 4 (2 (30)), 13–19. doi: https://doi.org/10.15587/2312-8372.2016.74482
  10. Azadeh, A., Ziaei, B., Moghaddam, M. (2012). A hybrid fuzzy regression-fuzzy cognitive map algorithm for forecasting and optimization of housing market fluctuations. Expert Systems with Applications, 39 (1), 298–315. doi: https://doi.org/10.1016/j.eswa.2011.07.020
  11. Ahentstvo z rozvytku infrastruktury fondovoho rynku Ukrainy. Available at: https://smida.gov.ua/

##submission.downloads##

Опубліковано

2019-06-30

Як цитувати

Geche, F., Mulesa, O., Hrynenko, V., & Smolanka, V. (2019). Знаходження найвпливовіших факторних ознак при побудові лінійних регресійних моделей. Technology Audit and Production Reserves, 3(2(47), 20–25. https://doi.org/10.15587/2312-8372.2019.175020

Номер

Розділ

Математичне моделювання: Оригінальне дослідження