Покращення ідентифікації та пошуку автора за допомогою CenSurE та Vision Transformers

Автор(и)

  • Микита Володимирович Шупилюк Харківський національний університет радіоелектроніки, Україна https://orcid.org/0009-0005-3457-9895
  • Віталій Олександрович Мартовицький Харківський національний університет радіоелектроніки, Україна https://orcid.org/0000-0003-2349-0578
  • Юрій Олександрович Романенков Харківський національний університет радіоелектроніки, Україна https://orcid.org/0000-0002-6544-5348

DOI:

https://doi.org/10.15587/2706-5448.2025.343943

Ключові слова:

машинне навчання, ідентифікація автора, трансформер, зображення, нейронні мережі, почерк, попередня обробка

Анотація

Об'єктом дослідження є процес ідентифікації автора на основі рукописного тексту. Незважаючи на значний прогрес, існуючі методи ідентифікації автора за рукописним текстом мають обмеження, що перешкоджають досягненню максимальної точності та надійності.

Дана робота направлена на оптимізацію та підвищення ефективності ідентифікації автора за рукописним текстом шляхом інтеграції методів попередньої обробки зображень, виявлення ознак та сучасних архітектур машинного навчання. Для цього було розроблено функціональну модель, яка використовує алгоритм CenSurE для виявлення ключових точок та вилучення відповідних ділянок зображення, а потім модель Vision Transformer для ідентифікації автора на основі цих вилучених ознак. Щоб зменшити мінливість результатів, експериментальна валідація була проведена з використанням подвійної методології пошуку та класифікації. Використання публічного набору даних CVL підвищує відтворюваність та допомагає у порівняльному аналізі. Результати дослідження показують, що впровадження запропонованого підходу призводить до покращення точності ідентифікації під час пошуку, перевершуючи результати інших досліджень. Про це свідчить збільшення значень точності hard top k та soft top k на 1% та середньої точності на 2%. Крім того, результати показують значне покращення продуктивності на етапі попередньої обробки виявлення ознак. Це покращення кількісно підтверджується скороченням як середнього часу на елемент, так і загальної тривалості обробки на 39%, а також збільшенням загальної кількості вилучених ділянок на 70%.

Отримані результати сприяють підвищенню надійності автоматизованих систем аналізу почерку, особливо для завдання ідентифікації автора. Це досягнення є цінним інструментом для графологів та судово-медичних експертів з документів, підтримуючи такі критично важливі завдання, як судово-медичний процес встановлення авторства.

Біографії авторів

Микита Володимирович Шупилюк, Харківський національний університет радіоелектроніки

Аспірант

Кафедра електронних обчислювальних машин

Віталій Олександрович Мартовицький, Харківський національний університет радіоелектроніки

Кандидат технічних наук, доцент

Кафедра електронних обчислювальних машин

Юрій Олександрович Романенков, Харківський національний університет радіоелектроніки

Доктор технічних наук, проректор з наукової роботи

Посилання

  1. Hengl, M. (2014). Comparison of the Branches of Handwriting Analysis. Chasopys Natsionalnoho universytetu “Ostrozka akademiia”. Seriia: Pravo, 2 (10).
  2. Shupyliuk, M., Martovytskyi, V., Bolohova, N., Romanenkov, Y., Osiievskyi, S., Liashenko, S. et al. (2025). Devising an approach to personality identification based on handwritten text using a vision transformer. Eastern-European Journal of Enterprise Technologies, 1 (2 (133)), 53–65. https://doi.org/10.15587/1729-4061.2025.322726
  3. Aliyev, E. (2024). Forensic Handwriting Analysis to Determine the Psychophysiological Traits. International Journal of Religion, 5 (6), 511–530. https://doi.org/10.61707/2r6bmr11
  4. Pandey, N., Singh, B., Singh, S. (2024). Review on handwriting examination on unusual surface. IP International Journal of Forensic Medicine and Toxicological Sciences, 8 (4), 125–131. https://doi.org/10.18231/j.ijfmts.2023.028
  5. Romanenkov, Y., Pronchakov, Y., Zieiniiev, T. (2020). Algorithmic Support for Auto-modes of adaptive short-term Forecasting in predictive Analytics Systems. 2020 IEEE 15th International Conference on Computer Sciences and Information Technologies (CSIT), 230–233. https://doi.org/10.1109/csit49958.2020.9321875
  6. Christlein, V., Bernecker, D., Hönig, F., Maier, A., Angelopoulou, E. (2017). Writer Identification Using GMM Supervectors and Exemplar-SVMs. Pattern Recognition, 63, 258–267. https://doi.org/10.1016/j.patcog.2016.10.005
  7. Christlein, V., Gropp, M., Fiel, S., Maier, A. (2017). Unsupervised Feature Learning for Writer Identification and Writer Retrieval. 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR), 991–997. https://doi.org/10.1109/icdar.2017.165
  8. Chen, S., Wang, Y., Lin, C.-T., Ding, W., Cao, Z. (2019). Semi-supervised feature learning for improving writer identification. Information Sciences, 482, 156–170. https://doi.org/10.1016/j.ins.2019.01.024
  9. He, S., Schomaker, L. (2019). Deep adaptive learning for writer identification based on single handwritten word images. Pattern Recognition, 88, 64–74. https://doi.org/10.1016/j.patcog.2018.11.003
  10. Helal, L. G., Bertolini, D., Costa, Y. M. G., Cavalcanti, G. D. C., Britto, A. S., Oliveira, L. E. S. (2019). Representation Learning and Dissimilarity for Writer Identification. 2019 International Conference on Systems, Signals and Image Processing (IWSSIP), 63–68. https://doi.org/10.1109/iwssip.2019.8787293
  11. Sulaiman, A., Omar, K., Nasrudin, M. F., Arram, A. (2019). Length Independent Writer Identification Based on the Fusion of Deep and Hand-Crafted Descriptors. IEEE Access, 7, 91772–91784. https://doi.org/10.1109/access.2019.2927286
  12. Kumar, P., Sharma, A. (2020). Segmentation-free writer identification based on convolutional neural network. Computers & Electrical Engineering, 85. https://doi.org/10.1016/j.compeleceng.2020.106707
  13. He, S., Schomaker, L. (2020). FragNet: Writer Identification Using Deep Fragment Networks. IEEE Transactions on Information Forensics and Security, 15, 3013–3022. https://doi.org/10.1109/tifs.2020.2981236
  14. Koepf, M., Kleber, F., Sablatnig, R. (2022). Writer identification and writer retrieval using Vision Transformer for forensic documents. Document Analysis Systems. Cham: Springer, 352–366. https://doi.org/10.1007/978-3-031-06555-2_24
  15. Semma, A., Hannad, Y., Siddiqi, I., Djeddi, C., El Youssfi El Kettani, M. (2021). Writer Identification using Deep Learning with FAST Keypoints and Harris corner detector. Expert Systems with Applications, 184, 115473. https://doi.org/10.1016/j.eswa.2021.115473
  16. He, S., Schomaker, L. (2021). GR-RNN: Global-context residual recurrent neural networks for writer identification. Pattern Recognition, 117. https://doi.org/10.48550/arXiv.2104.05036
  17. Suteddy, W., Agustini, D. A. R., Atmanto, D. A. (2024). Offline Handwriting Writer Identification using Depth-wise Separable Convolution with Siamese Network. JOIV : International Journal on Informatics Visualization, 8 (1), 535–541. https://doi.org/10.62527/joiv.8.1.2148
  18. Kleber, F., Fiel, S., Diem, M., Sablatnig, R. (2013). CVL-DataBase: An Off-Line Database for Writer Retrieval, Writer Identification and Word Spotting. 2013 12th International Conference on Document Analysis and Recognition, 560–564. https://doi.org/10.1109/icdar.2013.117
  19. Smelyakov, K., Sandrkin, D., Ruban, I., Vitalii, M., Romanenkov, Y. (2018). Search by Image. New Search Engine Service Model. 2018 International Scientific-Practical Conference Problems of Infocommunications. Science and Technology (PIC S&T), 181–186. https://doi.org/10.1109/infocommst.2018.8632117
  20. Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T. et al. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. arXiv 2021. https://doi.org/10.48550/arXiv.2010.11929
  21. Shupyliuk, M., Martovytskyi, V. (2025). Analysis of personality detection and writer identification methods. Control, Navigation and Communication Systems, 79 (1), 138–142. https://doi.org/10.26906/SUNZ.2025.1.138-142
  22. Agrawal, M., Konolige, L., Blas, M. (2008). CenSurE: Center Surround Extremas for Realtime Feature Detection and Matching. 10th European Conference on Computer Vision. Berlin, Heidelberg: Springer, 102–115. https://doi.org/10.1007/978-3-540-88693-8_8
  23. Otsu, N. (1979). A Threshold Selection Method from Gray-Level Histograms. IEEE Transactions on Systems, Man, and Cybernetics, 9 (1), 62–66. https://doi.org/10.1109/tsmc.1979.4310076
  24. Hassani, A., Walton, S., Shah, N., Abuduweili, A., Li, J., Shi, H. (2021). Escaping the Big Data Paradigm with Compact Transformers. arXiv:2104.05704. https://doi.org/10.48550/arXiv.2104.05704
Enhancing writer identification and writer retrieval with CenSurE and Vision Transformers

##submission.downloads##

Опубліковано

2025-12-29

Як цитувати

Шупилюк, М. В., Мартовицький, В. О., & Романенков, Ю. О. (2025). Покращення ідентифікації та пошуку автора за допомогою CenSurE та Vision Transformers. Technology Audit and Production Reserves, 6(2(86), 6–14. https://doi.org/10.15587/2706-5448.2025.343943

Номер

Розділ

Інформаційні технології