Порівняльна система для аналізу метрик відстані у високовимірному просторі
DOI:
https://doi.org/10.30837/2522-9818.2025.1.143Ключові слова:
метрики відстані; багатовимірні простори; порівняння метрик; норма ; норма ; аналіз даних; машинне навчання.Анотація
Предмет дослідження – розроблення комплексної рамкової методології для вимірювання та аналізу взаємозв’язків між різними метриками відстані у багатовимірних просторах. Мета дослідження – створити порівняльну методологію, яка кількісно оцінює "відстань" між різними метриками відстані в умовах високої розмірності. Ця методологія має на меті надати глибше розуміння взаємозв’язків між зазначеними метриками та допомогти фахівцям у виборі найбільш відповідної метрики для конкретних завдань аналізу даних. Завдання дослідження охоплюють теоретичне формулювання методів вимірювання "відстані між відстанями", що дає змогу систематично порівнювати різні метрики. Необхідно ґрунтовно проаналізувати зміни цих взаємозв'язків залежно від зростання розмірності. Для цього передбачено розробити математичні моделі та застосувати методи візуалізації з метою ілюстрації та інтерпретації взаємозв’язків між такими метриками, як манхеттенська відстань, евклідова відстань та інші у високорозмірних просторах. Серію експериментів заплановано провести на синтетичних наборах даних для верифікації теоретичних висновків і демонстрації практичної корисності запропонованої методології. Ці набори даних ретельно обрано таким чином, щоб охопити широкий спектр розмірностей і характеристик даних, що забезпечує всебічну оцінку ефективності методології. У межах дослідження застосовано статистичні аналізи та методи візуалізації (зокрема багатовимірне шкалювання і теплові карти), які дають змогу чітко подати взаємозв’язки між метриками відстані. Досягнуті результати свідчать про те, що взаємозв’язки між різними метриками відстані суттєво змінюються зі зростанням розмірності. Спостерігаються як збіги, так і розбіжності між окремими метриками, що дає важливі знання про їх поведінку у високорозмірних просторах. Ці висновки мають вирішальне значення для підвищення точності й ефективності методів аналізу даних, заснованих на обчисленні відстані. Висновки демонструють, що запропонована рамкова методологія успішно дає кількісну оцінку взаємозв’язків між різними метриками відстані у високорозмірних просторах. Розширене розуміння того, як ці метрики взаємопов’язані, дає змогу обґрунтовано обрати потрібну метрику у високорозмірному аналізі даних, сприяючи більш точним і ефективним аналітичним процедурам у сферах машинного навчання, інтелектуального аналізу даних та розпізнавання образів.
Посилання
References
Halder, R. K., Uddin, M. N., Uddin, Md. A., Aryal, S., and Khraisat, A. (2024), "Enhancing K-nearest neighbor algorithm: a comprehensive review and performance analysis of modifications". Journal of Big Data, Springer Science and Business Media LLC. Vol. 11, No. 1. Aug. 11. DOI: 10.1186/s40537-024-00973-y
Aggarwal, C. C., Hinneburg, A., and Keim, D. A. (2001), "On the Surprising Behavior of Distance Metrics in High Dimensional Space". Lecture Notes in Computer Science, Springer Berlin Heidelberg. Vol. 1973. P. 420–434. DOI: 10.1007/3-540-44503-x_27
Silva, E. C. de M. (2024), "Asymptotic behavior of the Manhattan distance in n-dimensions: Estimating multidimensional scenarios in empirical experiments". arXiv. DOI: 10.48550/ARXIV.2406.15441
Jamali, A. R. M. J. U. U., and Alam, Md. A. (2019), "Approximate relations between Manhattan and Euclidean distance regarding Latin hypercube experimental design". Journal of Physics: Conference Series, IOP Publishing. Vol. 1366, No. 1. Nov. 1, 012030 р. DOI: 10.1088/1742-6596/1366/1/012030
Cardarilli, G. C., Di Nunzio, L., Fazzolari, R., Nannarelli, A., Re, M., and Spano, S. (2020), "NN-Dimensional Approximation of Euclidean Distance". IEEE Transactions on Circuits and Systems II: Express Briefs, IEEE. Vol. 67, No. 3. Mar., P. 565–569. DOI: 10.1109/tcsii.2019.2919545
Cahya, F. N., Mahatma, Y., and Rohimah, S. R. (2023), "Perbandingan Metode Perhitungan Jarak Euclidean dengan Perhitungan Jarak Manhattan pada K-Means Clustering Dalam Menentukan Penyebaran Covid di Kota Bekasi". JMT: Jurnal Matematika dan Terapan, Universitas Negeri Jakarta. Vol. 5, No. 1. Feb. 28, P. 43–55. DOI: 10.21009/jmt.5.1.5
Liu, W., and Zhang, W. (2020), "A Quantum Protocol for Secure Manhattan Distance Computation". IEEE Access, IEEE. Vol. 8. P. 16456–16461. DOI: 10.1109/access.2020.2966800
Blackburn, S. R., Homberger, C., and Winkler, P. (2019), "The minimum Manhattan distance and minimum jump of permutations". Journal of Combinatorial Theory, Series A, Elsevier BV. Vol. 161. Jan., P. 364–386. DOI: 10.1016/j.jcta.2018.09.002
Fkih, F. (2022), "Similarity measures for Collaborative Filtering-based Recommender Systems: Review and experimental comparison", Journal of King Saud University - Computer and Information Sciences, Vol. 34, no. 9, Elsevier, Р. 7645–7669, Oct. 2022, DOI: 10.1016/j.jksuci.2021.09.014
Vančura, V.; Kordík, P., Straka, M. (2024), "beeFormer: Bridging the Gap Between Semantic and Interaction Similarity in Recommender Systems", arXiv, DOI: 10.48550/ARXIV.2409.10309
Yang, J. (2025), "DFF: Decision-Focused Fine-tuning for Smarter Predict-then-Optimize with Limited Data,” arXiv, DOI: 10.48550/ARXIV.2501.01874
Monteiro, T. (2024), "AI-Powered Energy Algorithmic Trading: Integrating Hidden Markov Models with Neural Networks", arXiv, DOI: 10.48550/ARXIV.2407.19858
Samantaray, A. K., Rahulkar, A. D. (2019), "Comparison of Similarity Measurement Metrics on Medical Image Data", in 2019 10th International Conference on Computing, Communication and Networking Technologies (ICCCNT), IEEE, Р. 1–5, DOI: 10.1109/icccnt45670.2019.8944781
Maudet, G., Batton-Hébert, M., Maillé, P., Toutain, L. (2022), "Emission Scheduling Strategies for Massive-IoT: Implementation and Performance Optimization", in NOMS 2022 IEEE/IFIP Network Operations and Management Symposium, IEEE, Р. 1–4, Apr. 25, DOI: 10.1109/noms54207.2022.9789769
Shafique, A., Asad, M., Aslam, M., Shaukat, S., Cao, G. (2022), "Multi-hop similarity-based-clustering framework for IoT-oriented software-defined wireless sensor networks", IET Wireless Sensor Systems, Vol. 12, No. 2, Institution of Engineering and Technology (IET), Р. 67–80, DOI: 10.1049/wss2.12037
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія

Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Наше видання використовує положення про авторські права Creative Commons для журналів відкритого доступу.
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:
Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License (CC BY-NC-SA 4.0), котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
Автори мають право укладати самостійні додаткові угоди щодо не комерційного та не ексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису опублікованої роботи, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи.












