Elaboration of the hierarchical approach to segmentation of scanned documents images

Alesya Ishchenko; Vladyslav Zhuchkovskyi

doi:10.15587/2312-8372.2019.173913

Автор(и)

Alesya Ishchenko Одеський національний політехнічний університет, пр. Шевченко, 1, м. Одеса, Україна, 65044, Україна https://orcid.org/0000-0002-7882-4718
Vladyslav Zhuchkovskyi Одеський національний політехнічний університет, пр. Шевченко, 1, м. Одеса, Україна, 65044, Україна https://orcid.org/0000-0001-7364-784X

DOI:

https://doi.org/10.15587/2312-8372.2019.173913

Ключові слова:

ієрархічний підхід, відскановані документи, сегментація зображень, обробка зображень, однорідні області.

Анотація

Об'єктом дослідження є процес розпізнавання областей зображень відсканованих документів. У роботі запропоновано ієрархічний підхід до сегментації зображень відсканованих документів. Даний підхід представляє собою зображення відсканованого документа у вигляді багаторівневої структури. На кожному рівні структури виділені зображення, що містять структурні області. Об'єкти нижнього рівня строго співвідносяться з певною областю зображення верхнього рівня: області фото та графіки співвідносяться із зображенням, що містить ілюстрації, а області тексту та фону – із зображенням, що містить і текст, і фон одночасно. Використання ієрархічного підходу дозволяє виконувати обробку окремо для кожної області зображення, а саме: спочатку на оригінальному зображенні відсканованого документа за допомогою аналізу зв'язкових компонент виділяються області ілюстрацій. Тим самим перший рівень ієрархії складають зображення, що містить ілюстрації, та зображення, що містить текст із фоном. Потім області ілюстрацій розділяються на фото та графіку за допомогою розбиття областей ілюстрацій на блоки певного розміру, а текстові області виділяються з фону за допомогою обробки в околиці кожного пікселя. Тим самим другий рівень ієрархічної структури представляють зображення, що містять однорідні області: фото, графіку, текст і фон. Ієрархічний підхід до сегментації дозволив скоротити час обробки в середньому в 80 разів. Скороченню часу обробки зображення сприяло те, що на кожному рівні і в, свою чергу, в окремій частині ієрархічної структури була можливість врахувати структурні ознаки однорідної області зображення, яке відповідає даному рівню. А також вибрати ознаки ідентифікації цих областей з високою обчислювальною ефективністю, використання яких також дозволило скоротити час обробки відсканованого документа.

Біографії авторів

Alesya Ishchenko, Одеський національний політехнічний університет, пр. Шевченко, 1, м. Одеса, Україна, 65044

Старший викладач

Кафедра прикладної математики та інформаційних технологій

Vladyslav Zhuchkovskyi, Одеський національний політехнічний університет, пр. Шевченко, 1, м. Одеса, Україна, 65044

Кафедра прикладної математики та інформаційних технологій

Посилання

Shafait, F., Keysers, D., Breuel, T. M. (2008). Performance Evaluation and Benchmarking of Six-Page Segmentation Algorithms. IEEE Transactions on Pattern Analysis and Machine Intelligence, 30 (6), 941–954. doi: http://doi.org/10.1109/tpami.2007.70837
Kumar, S., Gupta, R., Khanna, N., Chaudhury, S., Joshi, S. D. (2007). Text Extraction and Document Image Segmentation Using Matched Wavelets and MRF Model. IEEE Transactions on Image Processing, 16 (8), 2117–2128. doi: http://doi.org/10.1109/tip.2007.900098
Acharyya, M., Kundu, M. K. (2001). Multiscale Segmentation of Document Images Using M-Band Wavelets. Lecture Notes in Computer Science, 510–517. doi: http://doi.org/10.1007/3-540-44692-3_62
Cesarini, F., Gori, M., Marinai, S., Soda, G. (1999). Structured document segmentation and representation by the modified X-Y tree. Proceedings of the Fifth International Conference on Document Analysis and Recognition. ICDAR’99 (Cat. No.PR00318), 563. doi: http://doi.org/10.1109/icdar.1999.791850
Baird, H. S., Moll, M. A., An, C., Casey, M. R. (2007). Document image content inventories. Document Recognition and Retrieval XIV. doi: http://doi.org/10.1117/12.705094
Vilkin, A., Egorova, M. (2010). Segmentatsiia otskanirovannykh dokumentov. GrafiKon'2010, 339–341.
Moiseev, N. N. (1981). Matematicheskie zadachi sistemnogo analiza. Moscow: Nauka, 487.
de Queiroz, R. L., Buckley, R. R., Xu, M. (1999). Mixed Raster Content (MRC) Model for Compound Image Compression. Visual Communications and Image Processing. San Jose, 3653, 1106–1117. doi: http://doi.org/10.1117/12.334618
Ishchenko, A., Polyakova, M., Kuvaieva, V., Nesteryuk, A. (2018). Elaboration of structural representation of regions of scanned document images for MRC model. Eastern-European Journal of Enterprise Technologies, 6 (2 (96)), 32–38. doi: http://doi.org/10.15587/1729-4061.2018.147671
Polyakova, M., Ishchenko, A., Huliaieva, N. (2018). Document image segmentation using averaging filtering and mathematical morphology. Telecommunications and Computer Engineering (TCSET). Lviv-Slavske. doi: http://doi.org/10.1109/tcset.2018.8336354
Polyakova, M., Ishchenko, A., Volkova, N., Pavlov, O. (2018). Combined method for scanned documents images segmentation using sequential extraction of regions. Eastern-European Journal of Enterprise Technologies, 5 (2 (95)), 6–15. doi: http://doi.org/10.15587/1729-4061.2018.142735
Magnier, B., Montesinos, P., Diep, D. (2011). Ridges and Valleys Detection in Images Using Difference of Rotating Half Smoothing Filters. Lecture Notes in Computer Science. Ghent, 261–272. doi: http://doi.org/10.1007/978-3-642-23687-7_24
Gusak, D. E., Ishhenko, A. V. (2019).Vydelenie tekstovykh fragmentov na izobrazhenii otskanirovannogo dokumenta. Suchasnі іnformatsіinі tekhnologіi. Odessa.
Sauvola, J., Kauniskangas, H. (1999) MediaTeam Document Database II, a CD-ROM collection of document images. University of Oulu.