Покращення ідентифікації та пошуку автора за допомогою CenSurE та Vision Transformers
DOI:
https://doi.org/10.15587/2706-5448.2025.343943Ключові слова:
машинне навчання, ідентифікація автора, трансформер, зображення, нейронні мережі, почерк, попередня обробкаАнотація
Об'єктом дослідження є процес ідентифікації автора на основі рукописного тексту. Незважаючи на значний прогрес, існуючі методи ідентифікації автора за рукописним текстом мають обмеження, що перешкоджають досягненню максимальної точності та надійності.
Дана робота направлена на оптимізацію та підвищення ефективності ідентифікації автора за рукописним текстом шляхом інтеграції методів попередньої обробки зображень, виявлення ознак та сучасних архітектур машинного навчання. Для цього було розроблено функціональну модель, яка використовує алгоритм CenSurE для виявлення ключових точок та вилучення відповідних ділянок зображення, а потім модель Vision Transformer для ідентифікації автора на основі цих вилучених ознак. Щоб зменшити мінливість результатів, експериментальна валідація була проведена з використанням подвійної методології пошуку та класифікації. Використання публічного набору даних CVL підвищує відтворюваність та допомагає у порівняльному аналізі. Результати дослідження показують, що впровадження запропонованого підходу призводить до покращення точності ідентифікації під час пошуку, перевершуючи результати інших досліджень. Про це свідчить збільшення значень точності hard top k та soft top k на 1% та середньої точності на 2%. Крім того, результати показують значне покращення продуктивності на етапі попередньої обробки виявлення ознак. Це покращення кількісно підтверджується скороченням як середнього часу на елемент, так і загальної тривалості обробки на 39%, а також збільшенням загальної кількості вилучених ділянок на 70%.
Отримані результати сприяють підвищенню надійності автоматизованих систем аналізу почерку, особливо для завдання ідентифікації автора. Це досягнення є цінним інструментом для графологів та судово-медичних експертів з документів, підтримуючи такі критично важливі завдання, як судово-медичний процес встановлення авторства.
Посилання
- Hengl, M. (2014). Comparison of the Branches of Handwriting Analysis. Chasopys Natsionalnoho universytetu “Ostrozka akademiia”. Seriia: Pravo, 2 (10).
- Shupyliuk, M., Martovytskyi, V., Bolohova, N., Romanenkov, Y., Osiievskyi, S., Liashenko, S. et al. (2025). Devising an approach to personality identification based on handwritten text using a vision transformer. Eastern-European Journal of Enterprise Technologies, 1 (2 (133)), 53–65. https://doi.org/10.15587/1729-4061.2025.322726
- Aliyev, E. (2024). Forensic Handwriting Analysis to Determine the Psychophysiological Traits. International Journal of Religion, 5 (6), 511–530. https://doi.org/10.61707/2r6bmr11
- Pandey, N., Singh, B., Singh, S. (2024). Review on handwriting examination on unusual surface. IP International Journal of Forensic Medicine and Toxicological Sciences, 8 (4), 125–131. https://doi.org/10.18231/j.ijfmts.2023.028
- Romanenkov, Y., Pronchakov, Y., Zieiniiev, T. (2020). Algorithmic Support for Auto-modes of adaptive short-term Forecasting in predictive Analytics Systems. 2020 IEEE 15th International Conference on Computer Sciences and Information Technologies (CSIT), 230–233. https://doi.org/10.1109/csit49958.2020.9321875
- Christlein, V., Bernecker, D., Hönig, F., Maier, A., Angelopoulou, E. (2017). Writer Identification Using GMM Supervectors and Exemplar-SVMs. Pattern Recognition, 63, 258–267. https://doi.org/10.1016/j.patcog.2016.10.005
- Christlein, V., Gropp, M., Fiel, S., Maier, A. (2017). Unsupervised Feature Learning for Writer Identification and Writer Retrieval. 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR), 991–997. https://doi.org/10.1109/icdar.2017.165
- Chen, S., Wang, Y., Lin, C.-T., Ding, W., Cao, Z. (2019). Semi-supervised feature learning for improving writer identification. Information Sciences, 482, 156–170. https://doi.org/10.1016/j.ins.2019.01.024
- He, S., Schomaker, L. (2019). Deep adaptive learning for writer identification based on single handwritten word images. Pattern Recognition, 88, 64–74. https://doi.org/10.1016/j.patcog.2018.11.003
- Helal, L. G., Bertolini, D., Costa, Y. M. G., Cavalcanti, G. D. C., Britto, A. S., Oliveira, L. E. S. (2019). Representation Learning and Dissimilarity for Writer Identification. 2019 International Conference on Systems, Signals and Image Processing (IWSSIP), 63–68. https://doi.org/10.1109/iwssip.2019.8787293
- Sulaiman, A., Omar, K., Nasrudin, M. F., Arram, A. (2019). Length Independent Writer Identification Based on the Fusion of Deep and Hand-Crafted Descriptors. IEEE Access, 7, 91772–91784. https://doi.org/10.1109/access.2019.2927286
- Kumar, P., Sharma, A. (2020). Segmentation-free writer identification based on convolutional neural network. Computers & Electrical Engineering, 85. https://doi.org/10.1016/j.compeleceng.2020.106707
- He, S., Schomaker, L. (2020). FragNet: Writer Identification Using Deep Fragment Networks. IEEE Transactions on Information Forensics and Security, 15, 3013–3022. https://doi.org/10.1109/tifs.2020.2981236
- Koepf, M., Kleber, F., Sablatnig, R. (2022). Writer identification and writer retrieval using Vision Transformer for forensic documents. Document Analysis Systems. Cham: Springer, 352–366. https://doi.org/10.1007/978-3-031-06555-2_24
- Semma, A., Hannad, Y., Siddiqi, I., Djeddi, C., El Youssfi El Kettani, M. (2021). Writer Identification using Deep Learning with FAST Keypoints and Harris corner detector. Expert Systems with Applications, 184, 115473. https://doi.org/10.1016/j.eswa.2021.115473
- He, S., Schomaker, L. (2021). GR-RNN: Global-context residual recurrent neural networks for writer identification. Pattern Recognition, 117. https://doi.org/10.48550/arXiv.2104.05036
- Suteddy, W., Agustini, D. A. R., Atmanto, D. A. (2024). Offline Handwriting Writer Identification using Depth-wise Separable Convolution with Siamese Network. JOIV : International Journal on Informatics Visualization, 8 (1), 535–541. https://doi.org/10.62527/joiv.8.1.2148
- Kleber, F., Fiel, S., Diem, M., Sablatnig, R. (2013). CVL-DataBase: An Off-Line Database for Writer Retrieval, Writer Identification and Word Spotting. 2013 12th International Conference on Document Analysis and Recognition, 560–564. https://doi.org/10.1109/icdar.2013.117
- Smelyakov, K., Sandrkin, D., Ruban, I., Vitalii, M., Romanenkov, Y. (2018). Search by Image. New Search Engine Service Model. 2018 International Scientific-Practical Conference Problems of Infocommunications. Science and Technology (PIC S&T), 181–186. https://doi.org/10.1109/infocommst.2018.8632117
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T. et al. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. arXiv 2021. https://doi.org/10.48550/arXiv.2010.11929
- Shupyliuk, M., Martovytskyi, V. (2025). Analysis of personality detection and writer identification methods. Control, Navigation and Communication Systems, 79 (1), 138–142. https://doi.org/10.26906/SUNZ.2025.1.138-142
- Agrawal, M., Konolige, L., Blas, M. (2008). CenSurE: Center Surround Extremas for Realtime Feature Detection and Matching. 10th European Conference on Computer Vision. Berlin, Heidelberg: Springer, 102–115. https://doi.org/10.1007/978-3-540-88693-8_8
- Otsu, N. (1979). A Threshold Selection Method from Gray-Level Histograms. IEEE Transactions on Systems, Man, and Cybernetics, 9 (1), 62–66. https://doi.org/10.1109/tsmc.1979.4310076
- Hassani, A., Walton, S., Shah, N., Abuduweili, A., Li, J., Shi, H. (2021). Escaping the Big Data Paradigm with Compact Transformers. arXiv:2104.05704. https://doi.org/10.48550/arXiv.2104.05704
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2025 Mykyta Shupyliuk, Vitalii Martovytskyi, Yuri Romanenkov

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Закріплення та умови передачі авторських прав (ідентифікація авторства) здійснюється у Ліцензійному договорі. Зокрема, автори залишають за собою право на авторство свого рукопису та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons CC BY. При цьому вони мають право укладати самостійно додаткові угоди, що стосуються неексклюзивного поширення роботи у тому вигляді, в якому вона була опублікована цим журналом, але за умови збереження посилання на першу публікацію статті в цьому журналі.




