Розробка ієрархічного підходу до сегментації зображень відсканованих документів

Автор(и)

  • Alesya Ishchenko Одеський національний політехнічний університет, пр. Шевченко, 1, м. Одеса, Україна, 65044, Україна https://orcid.org/0000-0002-7882-4718
  • Vladyslav Zhuchkovskyi Одеський національний політехнічний університет, пр. Шевченко, 1, м. Одеса, Україна, 65044, Україна https://orcid.org/0000-0001-7364-784X

DOI:

https://doi.org/10.15587/2312-8372.2019.173913

Ключові слова:

ієрархічний підхід, відскановані документи, сегментація зображень, обробка зображень, однорідні області.

Анотація

Об'єктом дослідження є процес розпізнавання областей зображень відсканованих документів. У роботі запропоновано ієрархічний підхід до сегментації зображень відсканованих документів. Даний підхід представляє собою зображення відсканованого документа у вигляді багаторівневої структури. На кожному рівні структури виділені зображення, що містять структурні області. Об'єкти нижнього рівня строго співвідносяться з певною областю зображення верхнього рівня: області фото та графіки співвідносяться із зображенням, що містить ілюстрації, а області тексту та фону – із зображенням, що містить і текст, і фон одночасно. Використання ієрархічного підходу дозволяє виконувати обробку окремо для кожної області зображення, а саме: спочатку на оригінальному зображенні відсканованого документа за допомогою аналізу зв'язкових компонент виділяються області ілюстрацій. Тим самим перший рівень ієрархії складають зображення, що містить ілюстрації, та зображення, що містить текст із фоном. Потім області ілюстрацій розділяються на фото та графіку за допомогою розбиття областей ілюстрацій на блоки певного розміру, а текстові області виділяються з фону за допомогою обробки в околиці кожного пікселя. Тим самим другий рівень ієрархічної структури представляють зображення, що містять однорідні області: фото, графіку, текст і фон. Ієрархічний підхід до сегментації дозволив скоротити час обробки в середньому в 80 разів. Скороченню часу обробки зображення сприяло те, що на кожному рівні і в, свою чергу, в окремій частині ієрархічної структури була можливість врахувати структурні ознаки однорідної області зображення, яке відповідає даному рівню. А також вибрати ознаки ідентифікації цих областей з високою обчислювальною ефективністю, використання яких також дозволило скоротити час обробки відсканованого документа.

Біографії авторів

Alesya Ishchenko, Одеський національний політехнічний університет, пр. Шевченко, 1, м. Одеса, Україна, 65044

Старший викладач

Кафедра прикладної математики та інформаційних технологій

Vladyslav Zhuchkovskyi, Одеський національний політехнічний університет, пр. Шевченко, 1, м. Одеса, Україна, 65044

Кафедра прикладної математики та інформаційних технологій

Посилання

  1. Shafait, F., Keysers, D., Breuel, T. M. (2008). Performance Evaluation and Benchmarking of Six-Page Segmentation Algorithms. IEEE Transactions on Pattern Analysis and Machine Intelligence, 30 (6), 941–954. doi: http://doi.org/10.1109/tpami.2007.70837
  2. Kumar, S., Gupta, R., Khanna, N., Chaudhury, S., Joshi, S. D. (2007). Text Extraction and Document Image Segmentation Using Matched Wavelets and MRF Model. IEEE Transactions on Image Processing, 16 (8), 2117–2128. doi: http://doi.org/10.1109/tip.2007.900098
  3. Acharyya, M., Kundu, M. K. (2001). Multiscale Segmentation of Document Images Using M-Band Wavelets. Lecture Notes in Computer Science, 510–517. doi: http://doi.org/10.1007/3-540-44692-3_62
  4. Cesarini, F., Gori, M., Marinai, S., Soda, G. (1999). Structured document segmentation and representation by the modified X-Y tree. Proceedings of the Fifth International Conference on Document Analysis and Recognition. ICDAR’99 (Cat. No.PR00318), 563. doi: http://doi.org/10.1109/icdar.1999.791850
  5. Baird, H. S., Moll, M. A., An, C., Casey, M. R. (2007). Document image content inventories. Document Recognition and Retrieval XIV. doi: http://doi.org/10.1117/12.705094
  6. Vilkin, A., Egorova, M. (2010). Segmentatsiia otskanirovannykh dokumentov. GrafiKon'2010, 339–341.
  7. Moiseev, N. N. (1981). Matematicheskie zadachi sistemnogo analiza. Moscow: Nauka, 487.
  8. de Queiroz, R. L., Buckley, R. R., Xu, M. (1999). Mixed Raster Content (MRC) Model for Compound Image Compression. Visual Communications and Image Processing. San Jose, 3653, 1106–1117. doi: http://doi.org/10.1117/12.334618
  9. Ishchenko, A., Polyakova, M., Kuvaieva, V., Nesteryuk, A. (2018). Elaboration of structural representation of regions of scanned document images for MRC model. Eastern-European Journal of Enterprise Technologies, 6 (2 (96)), 32–38. doi: http://doi.org/10.15587/1729-4061.2018.147671
  10. Polyakova, M., Ishchenko, A., Huliaieva, N. (2018). Document image segmentation using averaging filtering and mathematical morphology. Telecommunications and Computer Engineering (TCSET). Lviv-Slavske. doi: http://doi.org/10.1109/tcset.2018.8336354
  11. Polyakova, M., Ishchenko, A., Volkova, N., Pavlov, O. (2018). Combined method for scanned documents images segmentation using sequential extraction of regions. Eastern-European Journal of Enterprise Technologies, 5 (2 (95)), 6–15. doi: http://doi.org/10.15587/1729-4061.2018.142735
  12. Magnier, B., Montesinos, P., Diep, D. (2011). Ridges and Valleys Detection in Images Using Difference of Rotating Half Smoothing Filters. Lecture Notes in Computer Science. Ghent, 261–272. doi: http://doi.org/10.1007/978-3-642-23687-7_24
  13. Gusak, D. E., Ishhenko, A. V. (2019).Vydelenie tekstovykh fragmentov na izobrazhenii otskanirovannogo dokumenta. Suchasnі іnformatsіinі tekhnologіi. Odessa.
  14. Sauvola, J., Kauniskangas, H. (1999) MediaTeam Document Database II, a CD-ROM collection of document images. University of Oulu.

Опубліковано

2019-06-30

Як цитувати

Ishchenko, A., & Zhuchkovskyi, V. (2019). Розробка ієрархічного підходу до сегментації зображень відсканованих документів. Technology Audit and Production Reserves, 3(2(47), 39–42. https://doi.org/10.15587/2312-8372.2019.173913

Номер

Розділ

Звіт про науково-дослідні роботи