Розробка структурного представлення областей зображень відсканованих документів для моделі MRC

Автор(и)

  • Alesya Ishchenko Одеський національний політехнічний університет пр. Шевченка, 1, м. Одеса, Україна, 65044, Україна https://orcid.org/0000-0002-7882-4718
  • Marina Polyakova Одеський національний політехнічний університет пр. Шевченка, 1, м. Одеса, Україна, 65044, Україна https://orcid.org/0000-0002-1597-8867
  • Varvara Kuvaieva Одеський національний політехнічний університет пр. Шевченка, 1, м. Одеса, Україна, 65044, Україна https://orcid.org/0000-0002-9350-1108
  • Alexandr Nesteryuk Одеський національний політехнічний університет пр. Шевченка, 1, м. Одеса, Україна, 65044, Україна https://orcid.org/0000-0002-0806-8259

DOI:

https://doi.org/10.15587/1729-4061.2018.147671

Ключові слова:

зображення відсканованих документів, модель змішаного растрового контенту, виділення тексту, шар зображення

Анотація

Модель змішаного растрового контенту – Mixed Raster Content – є поширеною формою представлення зображення відсканованого документа. Запропоновано подальший розвиток цієї моделі, який полягає в структурному представленні однорідних областей на кожному шарі MRC моделі зображення. Метою такого представлення зображення є подальше виділення областей зображення, які цікавлять, та їх ідентифікація для вирішення задачі сегментації зображень відсканованих документів.

Шар, що містить графічні та фотозображення, представлявся у вигляді об'єднання кількох областей за допомогою кусочно-постійної функції інтенсивності області зображення. Для цього графічне та фотозображення представлялися у вигляді розбиття на сегменти, що містять пікселі однорідної інтенсивності. Для визначення цих областей з метою відділення графіки від фотозображень розглядалися значення перепаду інтенсивності пікселів на границях множин, що містять дані області.

Шар, що містить текст, представлявся як зображення областей структурної текстури на однорідному фоні. Ці області містили фрагменти звичайного тексту та заголовка, що мають однакову інтенсивність пікселів і розрізняються формою та розміром символів, а також відстанню між ними. Таке уявлення шару дозволило врахувати просторові зв'язки між пікселями в зображенні символу і надалі виділити область тексту з фону.

Запропонована модель представлення зображення відсканованого документа дозволяє виділити шари зображення, що містять однорідні області, та звести процес сегментації всього зображення до сегментації окремих однорідних областей зображення. Це дозволяє підвищити швидкодію обробки при збереженні високої якості сегментації зображення

Біографії авторів

Alesya Ishchenko, Одеський національний політехнічний університет пр. Шевченка, 1, м. Одеса, Україна, 65044

Старший викладач

Кафедра прикладної математики та інформаційних технологій

Marina Polyakova, Одеський національний політехнічний університет пр. Шевченка, 1, м. Одеса, Україна, 65044

Доктор технічних наук, доцент

Кафедра прикладної математики та інформаційних технологій

Varvara Kuvaieva, Одеський національний політехнічний університет пр. Шевченка, 1, м. Одеса, Україна, 65044

Асистент

Кафедра інформаційних систем

Alexandr Nesteryuk, Одеський національний політехнічний університет пр. Шевченка, 1, м. Одеса, Україна, 65044

Кандидат технічних наук, доцент

Кафедра комп’ютерних систем

Посилання

  1. De Queiroz, R. L., Buckley, R. R., Xu, M. (1999). Mixed Raster Content (MRC) Model for Compound Image Compression. Visual Communications and Image Processing '99. San Jose, 3653. doi: https://doi.org/10.1117/12.334618
  2. Banupriya, D., Sundaresan, M. (2016). Enhanced hybrid compression method for compound images. International Journal of Computational Inteligence and Informatics, 6 (1), 18–24.
  3. Maheswari, D., Radha, V. (2010). Enhanced layer based compound image compression. Proceedings of the 1st Amrita ACM-W Celebration on Women in Computing in India – A2CWiC ’10. doi: https://doi.org/10.1145/1858378.1858418
  4. Huttenlocher, D., Felzenszwalb, P., Rucklidge, W. (1999). Digipaper: a versatile color document image representation. Proceedings 1999 International Conference on Image Processing (Cat. 99CH36348). doi: https://doi.org/10.1109/icip.1999.821601
  5. Melnakshi, P., Jabanesh, P. (2014). An Efficient Compound Image compression by exploiting spatial correlation. International Journal of Engineering Research&Technology, 3 (1), 2962–2967.
  6. Bross, B. et. al. (2013). High efficiency video coding (HEVC) text specification draft 10. Doc. JCTVC-L1003. Switzerland.
  7. Sullivan, G. J., Ohm, J.-R., Han, W.-J., Wiegand, T. (2012). Overview of the High Efficiency Video Coding (HEVC) Standard. IEEE Transactions on Circuits and Systems for Video Technology, 22 (12), 1649–1668. doi: https://doi.org/10.1109/tcsvt.2012.2221191
  8. Xu, J., Joshi, R., Cohen, R. A. (2016). Overview of the Emerging HEVC Screen Content Coding Extension. IEEE Transactions on Circuits and Systems for Video Technology, 26 (1), 50–62. doi: https://doi.org/10.1109/tcsvt.2015.2478706
  9. Juliet, S. E., Sadasivam, V., Florinabel, D. J. (2011). Effective layer-based segmentation of compound images using morphology. Journal of Real-Time Image Processing, 9 (2), 299–314. doi: https://doi.org/10.1007/s11554-011-0223-8
  10. Haneda, E., Bouman, C. A. (2011). Text Segmentation for MRC Document Compression. IEEE Transactions on Image Processing, 20 (6), 1611–1626. doi: https://doi.org/10.1109/tip.2010.2101611
  11. Minaee, S., Wang, Y. (2015). Screen content image segmentation using least absolute deviation fitting. 2015 IEEE International Conference on Image Processing (ICIP). doi: https://doi.org/10.1109/icip.2015.7351413
  12. Sherstobitov, A. I., Fedosov, V. P., Prihodchenko, V. A., Timofeev, D. V. (2013). Raspoznavanie lic na gruppovyh fotografiyah s ispol'zovaniem algoritmov segmentacii. Izvestiya Yuzhnogo federal'nogo universiteta. Tekhnicheskie nauki, 66–73.
  13. Haralik, R. (1979). Statisticheskiy i strukturnyy pohody k opisaniyu tekstur. TIIER, 67 (5), 98–120.
  14. Dunn, D., Higgins, W. E., Wakeley, J. (1994). Texture segmentation using 2-D Gabor elementary functions. IEEE Transactions on Pattern Analysis and Machine Intelligence, 16 (2), 130–149. doi: https://doi.org/10.1109/34.273736
  15. Polyakova, M. V., Krylov, V. N., Ishchenko, A. V. (2014). Elaboration of the transform with generalized comb scaling and wavelet functions for the image segmentation. Eastern-European Journal of Enterprise Technologies, 5 (2 (71)), 33–37. doi: https://doi.org/10.15587/1729-4061.2014.27791
  16. Polyakova, M. V., Krylov, V. N. (2007). Opredelenie granic segmenta uporyadochennoy tekstury na izobrazhenii s odnorodnym fonom v prostranstve preobrazovaniya Gil'berta. Elektronika i svyaz', 5, 54–61.
  17. Gonsales, R. S., Vuds, R. E., Eddins, S. L. (2006). Cifrovaya obrabotka izobrazheniy v srede MATLAB. Moscow: Tekhnosfera, 616.
  18. Polyakova, M., Ishchenko, O., Volkova, N., Pavlov, O. (2018). Combined method for scanned documents images segmentation using sequential extraction of regions. Eastern-European Journal of Enterprise Technologies, 5 (2 (95)), 6–15. doi: https://doi.org/10.15587/1729-4061.2018.142735

##submission.downloads##

Опубліковано

2018-11-19

Як цитувати

Ishchenko, A., Polyakova, M., Kuvaieva, V., & Nesteryuk, A. (2018). Розробка структурного представлення областей зображень відсканованих документів для моделі MRC. Eastern-European Journal of Enterprise Technologies, 6(2 (96), 32–38. https://doi.org/10.15587/1729-4061.2018.147671