Надійне прогнозування серцево-судинного ризику на невеликих наборах даних з використанням передової інженерії ознак
DOI:
https://doi.org/10.30837/2522-9818.2026.1.055Ключові слова:
класифікація; прогнозування ризику; важливість ознак; машинне навчання; ЕКГ; випадковий лісАнотація
Актуальність. Серцево-судинні захворювання залишаються провідною причиною смертності в усьому світі, що створює високий попит на автоматизовані діагностичні системи. Однак розробка надійних моделей машинного навчання для аналізу електрокардіограми (ЕКГ) часто ускладнюється наявністю лише невеликих за масштабом та незбалансованих наборів даних, що обмежує ефективність підходів глибокого навчання. Об'єктом дослідження є процес автоматизованої обробки та класифікації електрокардіографічних сигналів для діагностичних цілей. Предметом дослідження є методи вилучення ознак на основі серцево-судинних захворювань, стратегії агрегації на рівні пацієнта та алгоритми машинного навчання для прогнозування серцево-судинного ризику. Метою цієї статті є розробка та оцінка надійної системи класифікації, оптимізованої для невеликих наборів даних, яка підвищує точність прогнозування шляхом використання агрегації ознак на рівні пацієнта та моделей машинного навчання, що пояснюються. Результати дослідження. У дослідженні пропонується конвеєр, що починається зі стандартної попередньої обробки сигналу, а потім виконується точне виявлення R-піку та сегментація на основі серцево-судинних захворювань. Фізіологічні ознаки (ВСР, вейвлет, морфологічні) потім витягуються з окремих сегментів та статистично агрегуються на рівні пацієнта. Експерименти на наборі даних із 164 суб'єктів показали, що запропонована стратегія агрегації на рівні пацієнта значно перевершує традиційний аналіз на основі сегментів. Остаточна модель випадкового лісу досягла ROC-AUC балу 0,84. Аналіз важливості ознак підтвердив критичну роль показників варіабельності серцевого ритму (HRV), зокрема SDNN та RMSSD, у диференціації здорових суб'єктів та суб'єктів з високим ризиком.
Посилання
References
"World Heart Report 2023: Confronting the World’s Number One Killer. Geneva, Switzerland. World Heart Federation". available at: https://medbox.org/document/world-heart-report-2023-confronting-the-worlds-number-one-killer
Global, Regional, and National Burden of Cardiovascular Diseases and Risk Factors in 204 Countries and Territories, 1990-2023. JACC Journals, Vol. 86, No. 22, 2025, рр. 2167-2243. DOI: https://doi.org/10.1016/j.jacc.2025.08.015
Berkaya, S. K. et al. (2018), “A Survey on ECG Analysis”, Biomedical Signal Processing and Control, vol. 43, pp. 216-235, doi: https://doi.org/10.1016/j.bspc.2018.03.003
Yong O., Yang L., Kardos A., Zhao Y. (2026), "Non-invasive cardiovascular and vital signs monitoring techniques: review, challenges, and perspectives, Measurement", Vol. 258, part E, 119472 р. DOI: https://doi.org/10.1016/j.measurement.2025.119472
Ghasad, P.P., Vegivada, J.V.S,. Kamble, V.M., et al. (2025), "A systematic review of automated prediction of sudden cardiac death using ECG signals", Physiological Measurement, Vol. 46. DOI: https://doi.org/10.1088/1361-6579/ad9ce5
Wu, Z., Guo, C. (2025), "Deep learning and electrocardiography: systematic review of current techniques in cardiovascular disease diagnosis and management", BioMed Eng OnLine, Vol. 24, No. 23, DOI: https://doi.org/10.1186/s12938-025-01349-w
Singh, A.K, Krishnan, S. (2023), "ECG signal feature extraction trends in methods and applications", Biomed Eng Online, Vol. 22(1):22. DOI: https://doi.org/10.1186/s12938-023-01075-1
Kutlu, Y., Kuntalp, D. (2012), "Feature Extraction for ECG Heartbeats Using Higher Order Statistics of WPD Coefficients", Computer Methods and Programs in Biomedicine, Vol. 105, No. 3, pp. 257-267, DOI: https://doi.org/10.1016/j.cmpb.2011.10.002
Pan, J., Tompkins, W. J. (1985), "A Real-Time QRS Detection Algorithm", IEEE Trans. on Biomedical Engineering, Vol. 32, No. 3, pp. 230-236, DOI: https://doi.org/10.1109/TBME.1985.325532
Zhai, D., Bao, X., Long, X., Ru, T. and Zhou, G. (2023), "Precise Detection and Localization of R-Peaks From ECG Signals", Mathematical Biosciences and Engineering, Vol. 20, No. 11, pp. 19191-19208, DOI: https://doi.org/10.3934/mbe.2023848
Safdar, M.F., Nowak, R.M., Pałka, P. (2023), "Pre-Processing techniques and artificial intelligence algorithms for electrocardiogram (ECG) signals analysis: A comprehensive review", Computers in Biology and Medicine, Vol. 170, 107908 р. DOI: https://doi.org/10.1016/j.compbiomed.2023.107908
Breiman, L. (2001), "Random Forests", Machine Learning, Vol. 45, No. 1, pp. 5-32, DOI: https://doi.org/10.1023/A:1010933404324
Rabcan, J., Zaitseva, E., Levashenko, V., Kvassay, M. (2025), "Advancing ECG Signal Classification with a Fuzzy Classifier Approach", IEEE Access, Vol.13, 2025, pp. 83840-83856. DOI: https://doi.org/10.1109/ACCESS.2025.3568086
Zaitseva, E., Rabcan, J., Levashenko, V., Kvassay, M. (2023), "Importance analysis of decision-making factors based on fuzzy decision trees", Applied Soft Computing, Vol. 134, 109988 р. DOI: https://doi.org/10.1016/j.asoc.2023.109988
Levashenko, V., Zaitseva, E. (2002), "Usage of New Information Estimations for Induction of Fuzzy Decision Trees". In: Yin, H., Allinson, N., Freeman, R., Keane, J., Hubbard, S. (eds) Intelligent Data Engineering and Automated Learning - IDEAL 2002. IDEAL 2002. Lecture Notes in Computer Science, Vol 2412. Springer, Berlin, Heidelberg, DOI: https://doi.org/10.1007/3-540-45675-9_74
Zaitseva, E., Levashenko, V., Puuronen, S. (2007), "Fuzzy classifier based on fuzzy decision tree", Proc. of the Int. Conf. on Computer as a Tool (EUROCON), 2007, pp. 823-827, DOI: https://doi.org/10.1109/EURCON.2007.4400614
Klabunde, R.E. (2021), "Normal Sinus Rhythm", Cardiovascular Physiology Concepts. available at: https://cvphysiology.com/arrhythmias/a009
Zaitseva, E., Levashenko, V., Kvassay, M., Deserno T. (2026), "Reliability estimation of healthcare systems using Fuzzy Decision Trees", Proc. of the Fed. Conf. on Computer Science and Information Systems (FedCSIS), 2016, pp. 331-340, DOI: https://doi.org/10.15439/2016F150
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія

Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Наше видання використовує положення про авторські права Creative Commons для журналів відкритого доступу.
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:
Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License (CC BY-NC-SA 4.0), котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
Автори мають право укладати самостійні додаткові угоди щодо не комерційного та не ексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису опублікованої роботи, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи.












