Знаходження найвпливовіших факторних ознак при побудові лінійних регресійних моделей
DOI:
https://doi.org/10.15587/2312-8372.2019.175020Ключові слова:
множинна лінійна регресія, частинні коефіцієнти кореляції, факторні ознаки, адекватність моделіАнотація
Об’єктом дослідження є задача побудови лінійної регресійної моделі, яка виникає в процесі вирішення проблеми прогнозування значень залежної змінної від сукупності незалежних факторних ознак. Ця задача часто виникає в процесі аналізу показників економічної діяльності підприємств. Процес побудови рівняння регресії, яке адекватно відображає залежність між факторними ознаками та досліджуваними результуючими ознаками, є багатоетапною і трудомісткою процедурою. Важливим при цьому є етап вибору найвпливовіших факторних ознак. Від ефективності проведення такого етапу та правильності вибору системи ознак залежить адекватність регресійної моделі та ефективність аналізу діяльності підприємств. В наукових джерелах пропонується ряд методів та алгоритмів для вибору найвпливовіших факторних ознак. Деякі з них базуються на кореляційно-регресійному аналізі, проте є ряд евристичних методів. В дослідженнях показано, що використання різних методів відбору найвпливовіших факторних ознак для розв’язання конкретних задач, в загальному випадку призводить до отримання різних результатів. При цьому особливістю більшості методів є їх обчислювальна складність або нестійкість щодо умов застосування. Основним критерієм ефективності алгоритмів вибору факторних ознак є адекватність побудованої регресійної моделі.
В дослідженні проведено аналіз процесу побудови множинних лінійний регресійних моделей. Визначено основні його етапи та наведено базові поняття і розрахункові формули. Авторами пропонується алгоритм вибору найвпливовіших факторних ознак при побудові лінійних регресійних моделей. Особливістю запропонованого підходу є те, що він базується на властивостях частинних коефіцієнтів кореляції. Застосування розробленого алгоритму дозволяє зменшувати обчислювальну складність процесу вибору факторних ознак в порівнянні з відомими алгоритмами.
Виконана експериментальна верифікація розробленого алгоритму для задачі побудови залежностей між різними показниками діяльності двох підприємств у вигляді множинної лінійної регресії. В результаті проведених обчислень з системи 17 факторних ознак для кожного досліджуваного показника було відібрано одну або дві впливові ознаки. Побудовані при цьому рівняння множинної лінійної регресії мали достовірність, яка перевищує 90 %.Посилання
- Smeekes, S., Wijler, E. (2018). Macroeconomic forecasting using penalized regression methods. International Journal of Forecasting, 34 (3), 408–430. doi: https://doi.org/10.1016/j.ijforecast.2018.01.001
- Alvarez-Diaz, M., Alvarez, A. (2010). Forecasting exchange rates using local regression. Applied Economics Letters, 17 (5), 509–514. doi: https://doi.org/10.1080/13504850801987217
- Cleland, A. C., Earle, M. D., Boag, I. F. (2007). Application of multiple linear regression to analysis of data from factory energy surveys. International Journal of Food Science & Technology, 16 (5), 481–492. doi: https://doi.org/10.1111/j.1365-2621.1981.tb01841.x
- Heche, F. E. (2019). Teoriya ymovirnostei i matematychna statystyka. Uzhhorod: AUTDOR-ShARK, 235.
- Baltagi, B. (2008). Econometric analysis of panel data. John Wiley & Sons, 388.
- Shojima, K., Usami, S., Hashimoto, T., Todo, N., Takano, K. (2018). Understanding Differences in Statistical Models. The Annual Report of Educational Psychology in Japan, 57, 302–308. doi: https://doi.org/10.5926/arepj.57.302
- Depczynski, U., Frost, V. J., Molt, K. (2000). Genetic algorithms applied to the selection of factors in principal component regression. Analytica Chimica Acta, 420 (2), 217–227. doi: https://doi.org/10.1016/s0003-2670(00)00893-x
- Tibshirani, R. (1996). Regression Shrinkage and Selection Via the Lasso. Journal of the Royal Statistical Society: Series B (Methodological), 58 (1), 267–288. doi: https://doi.org/10.1111/j.2517-6161.1996.tb02080.x
- Mulesa, O. (2016). Development of evolutionary methods of the structural and parametric identification for tabular dependencies. Technology audit and production reserves, 4 (2 (30)), 13–19. doi: https://doi.org/10.15587/2312-8372.2016.74482
- Azadeh, A., Ziaei, B., Moghaddam, M. (2012). A hybrid fuzzy regression-fuzzy cognitive map algorithm for forecasting and optimization of housing market fluctuations. Expert Systems with Applications, 39 (1), 298–315. doi: https://doi.org/10.1016/j.eswa.2011.07.020
- Ahentstvo z rozvytku infrastruktury fondovoho rynku Ukrainy. Available at: https://smida.gov.ua/
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2019 Fedir Geche, Oksana Mulesa, Viktor Hrynenko, Veronika Smolanka
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Закріплення та умови передачі авторських прав (ідентифікація авторства) здійснюється у Ліцензійному договорі. Зокрема, автори залишають за собою право на авторство свого рукопису та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons CC BY. При цьому вони мають право укладати самостійно додаткові угоди, що стосуються неексклюзивного поширення роботи у тому вигляді, в якому вона була опублікована цим журналом, але за умови збереження посилання на першу публікацію статті в цьому журналі.