Розробка ієрархічного підходу до сегментації зображень відсканованих документів
DOI:
https://doi.org/10.15587/2312-8372.2019.173913Ключові слова:
ієрархічний підхід, відскановані документи, сегментація зображень, обробка зображень, однорідні області.Анотація
Об'єктом дослідження є процес розпізнавання областей зображень відсканованих документів. У роботі запропоновано ієрархічний підхід до сегментації зображень відсканованих документів. Даний підхід представляє собою зображення відсканованого документа у вигляді багаторівневої структури. На кожному рівні структури виділені зображення, що містять структурні області. Об'єкти нижнього рівня строго співвідносяться з певною областю зображення верхнього рівня: області фото та графіки співвідносяться із зображенням, що містить ілюстрації, а області тексту та фону – із зображенням, що містить і текст, і фон одночасно. Використання ієрархічного підходу дозволяє виконувати обробку окремо для кожної області зображення, а саме: спочатку на оригінальному зображенні відсканованого документа за допомогою аналізу зв'язкових компонент виділяються області ілюстрацій. Тим самим перший рівень ієрархії складають зображення, що містить ілюстрації, та зображення, що містить текст із фоном. Потім області ілюстрацій розділяються на фото та графіку за допомогою розбиття областей ілюстрацій на блоки певного розміру, а текстові області виділяються з фону за допомогою обробки в околиці кожного пікселя. Тим самим другий рівень ієрархічної структури представляють зображення, що містять однорідні області: фото, графіку, текст і фон. Ієрархічний підхід до сегментації дозволив скоротити час обробки в середньому в 80 разів. Скороченню часу обробки зображення сприяло те, що на кожному рівні і в, свою чергу, в окремій частині ієрархічної структури була можливість врахувати структурні ознаки однорідної області зображення, яке відповідає даному рівню. А також вибрати ознаки ідентифікації цих областей з високою обчислювальною ефективністю, використання яких також дозволило скоротити час обробки відсканованого документа.
Посилання
- Shafait, F., Keysers, D., Breuel, T. M. (2008). Performance Evaluation and Benchmarking of Six-Page Segmentation Algorithms. IEEE Transactions on Pattern Analysis and Machine Intelligence, 30 (6), 941–954. doi: http://doi.org/10.1109/tpami.2007.70837
- Kumar, S., Gupta, R., Khanna, N., Chaudhury, S., Joshi, S. D. (2007). Text Extraction and Document Image Segmentation Using Matched Wavelets and MRF Model. IEEE Transactions on Image Processing, 16 (8), 2117–2128. doi: http://doi.org/10.1109/tip.2007.900098
- Acharyya, M., Kundu, M. K. (2001). Multiscale Segmentation of Document Images Using M-Band Wavelets. Lecture Notes in Computer Science, 510–517. doi: http://doi.org/10.1007/3-540-44692-3_62
- Cesarini, F., Gori, M., Marinai, S., Soda, G. (1999). Structured document segmentation and representation by the modified X-Y tree. Proceedings of the Fifth International Conference on Document Analysis and Recognition. ICDAR’99 (Cat. No.PR00318), 563. doi: http://doi.org/10.1109/icdar.1999.791850
- Baird, H. S., Moll, M. A., An, C., Casey, M. R. (2007). Document image content inventories. Document Recognition and Retrieval XIV. doi: http://doi.org/10.1117/12.705094
- Vilkin, A., Egorova, M. (2010). Segmentatsiia otskanirovannykh dokumentov. GrafiKon'2010, 339–341.
- Moiseev, N. N. (1981). Matematicheskie zadachi sistemnogo analiza. Moscow: Nauka, 487.
- de Queiroz, R. L., Buckley, R. R., Xu, M. (1999). Mixed Raster Content (MRC) Model for Compound Image Compression. Visual Communications and Image Processing. San Jose, 3653, 1106–1117. doi: http://doi.org/10.1117/12.334618
- Ishchenko, A., Polyakova, M., Kuvaieva, V., Nesteryuk, A. (2018). Elaboration of structural representation of regions of scanned document images for MRC model. Eastern-European Journal of Enterprise Technologies, 6 (2 (96)), 32–38. doi: http://doi.org/10.15587/1729-4061.2018.147671
- Polyakova, M., Ishchenko, A., Huliaieva, N. (2018). Document image segmentation using averaging filtering and mathematical morphology. Telecommunications and Computer Engineering (TCSET). Lviv-Slavske. doi: http://doi.org/10.1109/tcset.2018.8336354
- Polyakova, M., Ishchenko, A., Volkova, N., Pavlov, O. (2018). Combined method for scanned documents images segmentation using sequential extraction of regions. Eastern-European Journal of Enterprise Technologies, 5 (2 (95)), 6–15. doi: http://doi.org/10.15587/1729-4061.2018.142735
- Magnier, B., Montesinos, P., Diep, D. (2011). Ridges and Valleys Detection in Images Using Difference of Rotating Half Smoothing Filters. Lecture Notes in Computer Science. Ghent, 261–272. doi: http://doi.org/10.1007/978-3-642-23687-7_24
- Gusak, D. E., Ishhenko, A. V. (2019).Vydelenie tekstovykh fragmentov na izobrazhenii otskanirovannogo dokumenta. Suchasnі іnformatsіinі tekhnologіi. Odessa.
- Sauvola, J., Kauniskangas, H. (1999) MediaTeam Document Database II, a CD-ROM collection of document images. University of Oulu.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2019 Alesya Ishchenko, Vladyslav Zhuchkovskyi
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Закріплення та умови передачі авторських прав (ідентифікація авторства) здійснюється у Ліцензійному договорі. Зокрема, автори залишають за собою право на авторство свого рукопису та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons CC BY. При цьому вони мають право укладати самостійно додаткові угоди, що стосуються неексклюзивного поширення роботи у тому вигляді, в якому вона була опублікована цим журналом, але за умови збереження посилання на першу публікацію статті в цьому журналі.