Enhancing writer identification and writer retrieval with CenSurE and Vision Transformers

Микита Володимирович Шупилюк; Віталій Олександрович Мартовицький; Юрій Олександрович Романенков

doi:10.15587/2706-5448.2025.343943

Автор(и)

Микита Володимирович Шупилюк Харківський національний університет радіоелектроніки, Україна https://orcid.org/0009-0005-3457-9895
Віталій Олександрович Мартовицький Харківський національний університет радіоелектроніки, Україна https://orcid.org/0000-0003-2349-0578
Юрій Олександрович Романенков Харківський національний університет радіоелектроніки, Україна https://orcid.org/0000-0002-6544-5348

DOI:

https://doi.org/10.15587/2706-5448.2025.343943

Ключові слова:

машинне навчання, ідентифікація автора, трансформер, зображення, нейронні мережі, почерк, попередня обробка

Анотація

Об'єктом дослідження є процес ідентифікації автора на основі рукописного тексту. Незважаючи на значний прогрес, існуючі методи ідентифікації автора за рукописним текстом мають обмеження, що перешкоджають досягненню максимальної точності та надійності.

Дана робота направлена на оптимізацію та підвищення ефективності ідентифікації автора за рукописним текстом шляхом інтеграції методів попередньої обробки зображень, виявлення ознак та сучасних архітектур машинного навчання. Для цього було розроблено функціональну модель, яка використовує алгоритм CenSurE для виявлення ключових точок та вилучення відповідних ділянок зображення, а потім модель Vision Transformer для ідентифікації автора на основі цих вилучених ознак. Щоб зменшити мінливість результатів, експериментальна валідація була проведена з використанням подвійної методології пошуку та класифікації. Використання публічного набору даних CVL підвищує відтворюваність та допомагає у порівняльному аналізі. Результати дослідження показують, що впровадження запропонованого підходу призводить до покращення точності ідентифікації під час пошуку, перевершуючи результати інших досліджень. Про це свідчить збільшення значень точності hard top k та soft top k на 1% та середньої точності на 2%. Крім того, результати показують значне покращення продуктивності на етапі попередньої обробки виявлення ознак. Це покращення кількісно підтверджується скороченням як середнього часу на елемент, так і загальної тривалості обробки на 39%, а також збільшенням загальної кількості вилучених ділянок на 70%.

Отримані результати сприяють підвищенню надійності автоматизованих систем аналізу почерку, особливо для завдання ідентифікації автора. Це досягнення є цінним інструментом для графологів та судово-медичних експертів з документів, підтримуючи такі критично важливі завдання, як судово-медичний процес встановлення авторства.

Біографії авторів

Микита Володимирович Шупилюк, Харківський національний університет радіоелектроніки

Аспірант

Кафедра електронних обчислювальних машин

Віталій Олександрович Мартовицький, Харківський національний університет радіоелектроніки

Кандидат технічних наук, доцент

Кафедра електронних обчислювальних машин

Юрій Олександрович Романенков, Харківський національний університет радіоелектроніки

Доктор технічних наук, проректор з наукової роботи

Посилання

Hengl, M. (2014). Comparison of the Branches of Handwriting Analysis. Chasopys Natsionalnoho universytetu “Ostrozka akademiia”. Seriia: Pravo, 2 (10).
Shupyliuk, M., Martovytskyi, V., Bolohova, N., Romanenkov, Y., Osiievskyi, S., Liashenko, S. et al. (2025). Devising an approach to personality identification based on handwritten text using a vision transformer. Eastern-European Journal of Enterprise Technologies, 1 (2 (133)), 53–65. https://doi.org/10.15587/1729-4061.2025.322726
Aliyev, E. (2024). Forensic Handwriting Analysis to Determine the Psychophysiological Traits. International Journal of Religion, 5 (6), 511–530. https://doi.org/10.61707/2r6bmr11
Pandey, N., Singh, B., Singh, S. (2024). Review on handwriting examination on unusual surface. IP International Journal of Forensic Medicine and Toxicological Sciences, 8 (4), 125–131. https://doi.org/10.18231/j.ijfmts.2023.028
Romanenkov, Y., Pronchakov, Y., Zieiniiev, T. (2020). Algorithmic Support for Auto-modes of adaptive short-term Forecasting in predictive Analytics Systems. 2020 IEEE 15th International Conference on Computer Sciences and Information Technologies (CSIT), 230–233. https://doi.org/10.1109/csit49958.2020.9321875
Christlein, V., Bernecker, D., Hönig, F., Maier, A., Angelopoulou, E. (2017). Writer Identification Using GMM Supervectors and Exemplar-SVMs. Pattern Recognition, 63, 258–267. https://doi.org/10.1016/j.patcog.2016.10.005
Christlein, V., Gropp, M., Fiel, S., Maier, A. (2017). Unsupervised Feature Learning for Writer Identification and Writer Retrieval. 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR), 991–997. https://doi.org/10.1109/icdar.2017.165
Chen, S., Wang, Y., Lin, C.-T., Ding, W., Cao, Z. (2019). Semi-supervised feature learning for improving writer identification. Information Sciences, 482, 156–170. https://doi.org/10.1016/j.ins.2019.01.024
He, S., Schomaker, L. (2019). Deep adaptive learning for writer identification based on single handwritten word images. Pattern Recognition, 88, 64–74. https://doi.org/10.1016/j.patcog.2018.11.003
Helal, L. G., Bertolini, D., Costa, Y. M. G., Cavalcanti, G. D. C., Britto, A. S., Oliveira, L. E. S. (2019). Representation Learning and Dissimilarity for Writer Identification. 2019 International Conference on Systems, Signals and Image Processing (IWSSIP), 63–68. https://doi.org/10.1109/iwssip.2019.8787293
Sulaiman, A., Omar, K., Nasrudin, M. F., Arram, A. (2019). Length Independent Writer Identification Based on the Fusion of Deep and Hand-Crafted Descriptors. IEEE Access, 7, 91772–91784. https://doi.org/10.1109/access.2019.2927286
Kumar, P., Sharma, A. (2020). Segmentation-free writer identification based on convolutional neural network. Computers & Electrical Engineering, 85. https://doi.org/10.1016/j.compeleceng.2020.106707
He, S., Schomaker, L. (2020). FragNet: Writer Identification Using Deep Fragment Networks. IEEE Transactions on Information Forensics and Security, 15, 3013–3022. https://doi.org/10.1109/tifs.2020.2981236
Koepf, M., Kleber, F., Sablatnig, R. (2022). Writer identification and writer retrieval using Vision Transformer for forensic documents. Document Analysis Systems. Cham: Springer, 352–366. https://doi.org/10.1007/978-3-031-06555-2_24
Semma, A., Hannad, Y., Siddiqi, I., Djeddi, C., El Youssfi El Kettani, M. (2021). Writer Identification using Deep Learning with FAST Keypoints and Harris corner detector. Expert Systems with Applications, 184, 115473. https://doi.org/10.1016/j.eswa.2021.115473
He, S., Schomaker, L. (2021). GR-RNN: Global-context residual recurrent neural networks for writer identification. Pattern Recognition, 117. https://doi.org/10.48550/arXiv.2104.05036
Suteddy, W., Agustini, D. A. R., Atmanto, D. A. (2024). Offline Handwriting Writer Identification using Depth-wise Separable Convolution with Siamese Network. JOIV : International Journal on Informatics Visualization, 8 (1), 535–541. https://doi.org/10.62527/joiv.8.1.2148
Kleber, F., Fiel, S., Diem, M., Sablatnig, R. (2013). CVL-DataBase: An Off-Line Database for Writer Retrieval, Writer Identification and Word Spotting. 2013 12th International Conference on Document Analysis and Recognition, 560–564. https://doi.org/10.1109/icdar.2013.117
Smelyakov, K., Sandrkin, D., Ruban, I., Vitalii, M., Romanenkov, Y. (2018). Search by Image. New Search Engine Service Model. 2018 International Scientific-Practical Conference Problems of Infocommunications. Science and Technology (PIC S&T), 181–186. https://doi.org/10.1109/infocommst.2018.8632117
Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T. et al. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. arXiv 2021. https://doi.org/10.48550/arXiv.2010.11929
Shupyliuk, M., Martovytskyi, V. (2025). Analysis of personality detection and writer identification methods. Control, Navigation and Communication Systems, 79 (1), 138–142. https://doi.org/10.26906/SUNZ.2025.1.138-142
Agrawal, M., Konolige, L., Blas, M. (2008). CenSurE: Center Surround Extremas for Realtime Feature Detection and Matching. 10th European Conference on Computer Vision. Berlin, Heidelberg: Springer, 102–115. https://doi.org/10.1007/978-3-540-88693-8_8
Otsu, N. (1979). A Threshold Selection Method from Gray-Level Histograms. IEEE Transactions on Systems, Man, and Cybernetics, 9 (1), 62–66. https://doi.org/10.1109/tsmc.1979.4310076
Hassani, A., Walton, S., Shah, N., Abuduweili, A., Li, J., Shi, H. (2021). Escaping the Big Data Paradigm with Compact Transformers. arXiv:2104.05704. https://doi.org/10.48550/arXiv.2104.05704