Гібридний метод відбору генів на основі методу взаємної інформації та алгоритму оптимізації бабок
DOI:
https://doi.org/10.15587/1729-4061.2021.233382Ключові слова:
ВГ “відбір генів”, ВІ “метод взаємної інформації”, БАБ “бінарний алгоритм оптимізації бабок”Анотація
Однією з найбільш поширених проблем з великими даними є те, що багато ознак є незначущими. Показано, що відбір генів дозволяє поліпшити результати багатьох алгоритмів, однак це є складним завданням при аналізі даних мікрочіпів, оскільки більшість наборів даних мікрочіпів містять всього кілька сотень записів, але тисячі змінних. Цей тип набору даних збільшує ймовірність випадкового виявлення невірних прогнозів. Пошук найбільш значущих генів, як правило, є найскладнішою частиною створення надійної моделі класифікації. Незначущі і повторювані ознаки чинять негативний вплив на точність алгоритмів категоризації. З метою підвищення точності зниження розмірності в літературі було досліджено багато методів відбору генів на основі машинного навчання. Відбір генів – це метод вилучення найбільш значущих даних із серії наборів даних. Подальший розвиток методу відбору генів матиме позитивний вплив на метод класифікації, який може бути використаний в машинному навчанні, розпізнаванні образів і обробці сигналів. Метою відбору ознак є вибір найменшої підмножини ознак, що містить якомога більше інформації про клас. У даній статті виконується моделювання методу відбору генів у вигляді бінарного алгоритму дискретної оптимізації, який направляє бінарний алгоритм оптимізації бабок “БАБ” і перевіряє його в обраній функції придатності з використанням точності класифікатора k-найближчих сусідів набору даних. Результати експериментів показали, що запропонований алгоритм, який отримав назву ВІ-БАБ, за точністю результатів, вимірюваною вартістю обчислень і точністю класифікації, перевершує інші алгоритми
Посилання
- Golub, T. R., Slonim, D. K., Tamayo, P., Huard, C., Gaasenbeek, M., Mesirov, J. P. et. al. (1999). Molecular Classification of Cancer: Class Discovery and Class Prediction by Gene Expression Monitoring. Science, 286 (5439), 531–537. doi: https://doi.org/10.1126/science.286.5439.531
- Cai, R., Hao, Z., Yang, X., Wen, W. (2009). An efficient gene selection algorithm based on mutual information. Neurocomputing, 72 (4-6), 991–999. doi: https://doi.org/10.1016/j.neucom.2008.04.005
- Muszyński, M., Osowski, S. (2014). Data mining methods for gene selection on the basis of gene expression arrays. International Journal of Applied Mathematics and Computer Science, 24 (3), 657–668. doi: https://doi.org/10.2478/amcs-2014-0048
- Guyon, I., Elisseeff, A. (2003). An introduction to variable and feature selection. Journal of Machine Learning Research, 3, 1157–1182. Available at: https://www.jmlr.org/papers/volume3/guyon03a/guyon03a.pdf
- Kohavi, R., John, G. H. (1997). Wrappers for feature subset selection. Artificial Intelligence, 97 (1-2), 273–324. doi: https://doi.org/10.1016/s0004-3702(97)00043-x
- Vergara, J. R., Estévez, P. A. (2013). A review of feature selection methods based on mutual information. Neural Computing and Applications, 24 (1), 175–186. doi: https://doi.org/10.1007/s00521-013-1368-0
- Shukla, A. K., Singh, P., Vardhan, M. (2018). A hybrid gene selection method for microarray recognition. Biocybernetics and Biomedical Engineering, 38 (4), 975–991. doi: https://doi.org/10.1016/j.bbe.2018.08.004
- Sun, L., Kong, X., Xu, J., Xue, Z., Zhai, R., Zhang, S. (2019). A Hybrid Gene Selection Method Based on ReliefF and Ant Colony Optimization Algorithm for Tumor Classification. Scientific Reports, 9 (1). doi: https://doi.org/10.1038/s41598-019-45223-x
- Nakariyakul, S. (2019). A hybrid gene selection algorithm based on interaction information for microarray-based cancer classification. PLOS ONE, 14 (2), e0212333. doi: https://doi.org/10.1371/journal.pone.0212333
- Mav, D., Shah, R. R., Howard, B. E., Auerbach, S. S., Bushel, P. R., Collins, J. B. et. al. (2018). A hybrid gene selection approach to create the S1500+ targeted gene sets for use in high-throughput transcriptomics. PLOS ONE, 13 (2), e0191105. doi: https://doi.org/10.1371/journal.pone.0191105
- Mafarja, M. M., Eleyan, D., Jaber, I., Hammouri, A., Mirjalili, S. (2017). Binary Dragonfly Algorithm for Feature Selection. 2017 International Conference on New Trends in Computing Sciences (ICTCS). doi: https://doi.org/10.1109/ictcs.2017.43
- Aljarah, I., Mafarja, M., Heidari, A. A., Faris, H., Zhang, Y., Mirjalili, S. (2018). Asynchronous accelerating multi-leader salp chains for feature selection. Applied Soft Computing, 71, 964–979. doi: https://doi.org/10.1016/j.asoc.2018.07.040
- Zaffar, M., Ahmed, M., Savita, K. S., Sajjad, S. (2018). A Study of Feature Selection Algorithms for Predicting Students Academic Performance. International Journal of Advanced Computer Science and Applications, 9 (5). doi: https://doi.org/10.14569/ijacsa.2018.090569
- Cover, T. M., Thomas, J. A. (2005). Elements of Information Theory. John Wiley & Sons. doi: https://doi.org/10.1002/047174882x
- Liu, H., Sun, J., Liu, L., Zhang, H. (2009). Feature selection with dynamic mutual information. Pattern Recognition, 42 (7), 1330–1339. doi: https://doi.org/10.1016/j.patcog.2008.10.028
- Hammouri, A. I., Mafarja, M., Al-Betar, M. A., Awadallah, M. A., Abu-Doush, I. (2020). An improved Dragonfly Algorithm for feature selection. Knowledge-Based Systems, 203, 106131. doi: https://doi.org/10.1016/j.knosys.2020.106131
- Qasim, O. S., Mahmoud, M. S., Hasan, F. M. (2020). Hybrid Binary Dragonfly Optimization Algorithm with Statistical Dependence for Feature Selection. International Journal of Mathematical, Engineering and Management Sciences, 5 (6), 1420–1428. doi: https://doi.org/10.33889/ijmems.2020.5.6.105
- Sree Ranjini, K. S., Murugan, S. (2017). Memory based Hybrid Dragonfly Algorithm for numerical optimization problems. Expert Systems with Applications, 83, 63–78. doi: https://doi.org/10.1016/j.eswa.2017.04.033
- Mafarja, M., Heidari, A. A., Faris, H., Mirjalili, S., Aljarah, I. (2019). Dragonfly Algorithm: Theory, Literature Review, and Application in Feature Selection. Studies in Computational Intelligence, 47–67. doi: https://doi.org/10.1007/978-3-030-12127-3_4
- Al-Thanoon, N. A., Qasim, O. S., Algamal, Z. Y. (2018). Tuning parameter estimation in SCAD-support vector machine using firefly algorithm with application in gene selection and cancer classification. Computers in Biology and Medicine, 103, 262–268. doi: https://doi.org/10.1016/j.compbiomed.2018.10.034
- Alhafedh, M. A. A., Qasim, O. S. (2019). Two-Stage Gene Selection in Microarray Dataset Using Fuzzy Mutual Information and Binary Particle Swarm Optimization. Indian Journal of Forensic Medicine & Toxicology, 13 (4), 1162. doi: https://doi.org/10.5958/0973-9130.2019.00458.4
- Blake, C. L., Merz, C. J. (1998). UCI Repository of Machine Learning Databases. University of California, Oakland.
- Kashmoola, M. A., Alsaleem, M. Y. anad, Alsaleem, N. Y. A., Moskalets, M. (2019). Model of dynamics of the grouping states of radio electronic means in the problems of ensuring electromagnetic compatibility. Eastern-European Journal of Enterprise Technologies, 6 (9 (102)), 12–20. doi: https://doi.org/10.15587/1729-4061.2019.188976
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2021 Sarah Ghanim Mahmood, Raed Sabeeh Karyakos, Ilham M. Yacoob
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Закріплення та умови передачі авторських прав (ідентифікація авторства) здійснюється у Ліцензійному договорі. Зокрема, автори залишають за собою право на авторство свого рукопису та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons CC BY. При цьому вони мають право укладати самостійно додаткові угоди, що стосуються неексклюзивного поширення роботи у тому вигляді, в якому вона була опублікована цим журналом, але за умови збереження посилання на першу публікацію статті в цьому журналі.
Ліцензійний договір – це документ, в якому автор гарантує, що володіє усіма авторськими правами на твір (рукопис, статтю, тощо).
Автори, підписуючи Ліцензійний договір з ПП «ТЕХНОЛОГІЧНИЙ ЦЕНТР», мають усі права на подальше використання свого твору за умови посилання на наше видання, в якому твір опублікований. Відповідно до умов Ліцензійного договору, Видавець ПП «ТЕХНОЛОГІЧНИЙ ЦЕНТР» не забирає ваші авторські права та отримує від авторів дозвіл на використання та розповсюдження публікації через світові наукові ресурси (власні електронні ресурси, наукометричні бази даних, репозитарії, бібліотеки тощо).
За відсутності підписаного Ліцензійного договору або за відсутністю вказаних в цьому договорі ідентифікаторів, що дають змогу ідентифікувати особу автора, редакція не має права працювати з рукописом.
Важливо пам’ятати, що існує і інший тип угоди між авторами та видавцями – коли авторські права передаються від авторів до видавця. В такому разі автори втрачають права власності на свій твір та не можуть його використовувати в будь-який спосіб.