Elaboration of structural representation of regions of scanned document images for MRC model

Alesya Ishchenko; Marina Polyakova; Varvara Kuvaieva; Alexandr Nesteryuk

doi:10.15587/1729-4061.2018.147671

Розробка структурного представлення областей зображень відсканованих документів для моделі MRC

Автор(и)

Alesya Ishchenko Одеський національний політехнічний університет пр. Шевченка, 1, м. Одеса, Україна, 65044, Україна https://orcid.org/0000-0002-7882-4718
Marina Polyakova Одеський національний політехнічний університет пр. Шевченка, 1, м. Одеса, Україна, 65044, Україна https://orcid.org/0000-0002-1597-8867
Varvara Kuvaieva Одеський національний політехнічний університет пр. Шевченка, 1, м. Одеса, Україна, 65044, Україна https://orcid.org/0000-0002-9350-1108
Alexandr Nesteryuk Одеський національний політехнічний університет пр. Шевченка, 1, м. Одеса, Україна, 65044, Україна https://orcid.org/0000-0002-0806-8259

DOI:

https://doi.org/10.15587/1729-4061.2018.147671

Ключові слова:

зображення відсканованих документів, модель змішаного растрового контенту, виділення тексту, шар зображення

Анотація

Модель змішаного растрового контенту – Mixed Raster Content – є поширеною формою представлення зображення відсканованого документа. Запропоновано подальший розвиток цієї моделі, який полягає в структурному представленні однорідних областей на кожному шарі MRC моделі зображення. Метою такого представлення зображення є подальше виділення областей зображення, які цікавлять, та їх ідентифікація для вирішення задачі сегментації зображень відсканованих документів.

Шар, що містить графічні та фотозображення, представлявся у вигляді об'єднання кількох областей за допомогою кусочно-постійної функції інтенсивності області зображення. Для цього графічне та фотозображення представлялися у вигляді розбиття на сегменти, що містять пікселі однорідної інтенсивності. Для визначення цих областей з метою відділення графіки від фотозображень розглядалися значення перепаду інтенсивності пікселів на границях множин, що містять дані області.

Шар, що містить текст, представлявся як зображення областей структурної текстури на однорідному фоні. Ці області містили фрагменти звичайного тексту та заголовка, що мають однакову інтенсивність пікселів і розрізняються формою та розміром символів, а також відстанню між ними. Таке уявлення шару дозволило врахувати просторові зв'язки між пікселями в зображенні символу і надалі виділити область тексту з фону.

Запропонована модель представлення зображення відсканованого документа дозволяє виділити шари зображення, що містять однорідні області, та звести процес сегментації всього зображення до сегментації окремих однорідних областей зображення. Це дозволяє підвищити швидкодію обробки при збереженні високої якості сегментації зображення

Біографії авторів

Alesya Ishchenko, Одеський національний політехнічний університет пр. Шевченка, 1, м. Одеса, Україна, 65044

Старший викладач

Кафедра прикладної математики та інформаційних технологій

Marina Polyakova, Одеський національний політехнічний університет пр. Шевченка, 1, м. Одеса, Україна, 65044

Доктор технічних наук, доцент

Кафедра прикладної математики та інформаційних технологій

Varvara Kuvaieva, Одеський національний політехнічний університет пр. Шевченка, 1, м. Одеса, Україна, 65044

Асистент

Кафедра інформаційних систем

Alexandr Nesteryuk, Одеський національний політехнічний університет пр. Шевченка, 1, м. Одеса, Україна, 65044

Кандидат технічних наук, доцент

Кафедра комп’ютерних систем

Посилання

De Queiroz, R. L., Buckley, R. R., Xu, M. (1999). Mixed Raster Content (MRC) Model for Compound Image Compression. Visual Communications and Image Processing '99. San Jose, 3653. doi: https://doi.org/10.1117/12.334618
Banupriya, D., Sundaresan, M. (2016). Enhanced hybrid compression method for compound images. International Journal of Computational Inteligence and Informatics, 6 (1), 18–24.
Maheswari, D., Radha, V. (2010). Enhanced layer based compound image compression. Proceedings of the 1st Amrita ACM-W Celebration on Women in Computing in India – A2CWiC ’10. doi: https://doi.org/10.1145/1858378.1858418
Huttenlocher, D., Felzenszwalb, P., Rucklidge, W. (1999). Digipaper: a versatile color document image representation. Proceedings 1999 International Conference on Image Processing (Cat. 99CH36348). doi: https://doi.org/10.1109/icip.1999.821601
Melnakshi, P., Jabanesh, P. (2014). An Efficient Compound Image compression by exploiting spatial correlation. International Journal of Engineering Research&Technology, 3 (1), 2962–2967.
Bross, B. et. al. (2013). High efficiency video coding (HEVC) text specification draft 10. Doc. JCTVC-L1003. Switzerland.
Sullivan, G. J., Ohm, J.-R., Han, W.-J., Wiegand, T. (2012). Overview of the High Efficiency Video Coding (HEVC) Standard. IEEE Transactions on Circuits and Systems for Video Technology, 22 (12), 1649–1668. doi: https://doi.org/10.1109/tcsvt.2012.2221191
Xu, J., Joshi, R., Cohen, R. A. (2016). Overview of the Emerging HEVC Screen Content Coding Extension. IEEE Transactions on Circuits and Systems for Video Technology, 26 (1), 50–62. doi: https://doi.org/10.1109/tcsvt.2015.2478706
Juliet, S. E., Sadasivam, V., Florinabel, D. J. (2011). Effective layer-based segmentation of compound images using morphology. Journal of Real-Time Image Processing, 9 (2), 299–314. doi: https://doi.org/10.1007/s11554-011-0223-8
Haneda, E., Bouman, C. A. (2011). Text Segmentation for MRC Document Compression. IEEE Transactions on Image Processing, 20 (6), 1611–1626. doi: https://doi.org/10.1109/tip.2010.2101611
Minaee, S., Wang, Y. (2015). Screen content image segmentation using least absolute deviation fitting. 2015 IEEE International Conference on Image Processing (ICIP). doi: https://doi.org/10.1109/icip.2015.7351413
Sherstobitov, A. I., Fedosov, V. P., Prihodchenko, V. A., Timofeev, D. V. (2013). Raspoznavanie lic na gruppovyh fotografiyah s ispol'zovaniem algoritmov segmentacii. Izvestiya Yuzhnogo federal'nogo universiteta. Tekhnicheskie nauki, 66–73.
Haralik, R. (1979). Statisticheskiy i strukturnyy pohody k opisaniyu tekstur. TIIER, 67 (5), 98–120.
Dunn, D., Higgins, W. E., Wakeley, J. (1994). Texture segmentation using 2-D Gabor elementary functions. IEEE Transactions on Pattern Analysis and Machine Intelligence, 16 (2), 130–149. doi: https://doi.org/10.1109/34.273736
Polyakova, M. V., Krylov, V. N., Ishchenko, A. V. (2014). Elaboration of the transform with generalized comb scaling and wavelet functions for the image segmentation. Eastern-European Journal of Enterprise Technologies, 5 (2 (71)), 33–37. doi: https://doi.org/10.15587/1729-4061.2014.27791
Polyakova, M. V., Krylov, V. N. (2007). Opredelenie granic segmenta uporyadochennoy tekstury na izobrazhenii s odnorodnym fonom v prostranstve preobrazovaniya Gil'berta. Elektronika i svyaz', 5, 54–61.
Gonsales, R. S., Vuds, R. E., Eddins, S. L. (2006). Cifrovaya obrabotka izobrazheniy v srede MATLAB. Moscow: Tekhnosfera, 616.
Polyakova, M., Ishchenko, O., Volkova, N., Pavlov, O. (2018). Combined method for scanned documents images segmentation using sequential extraction of regions. Eastern-European Journal of Enterprise Technologies, 5 (2 (95)), 6–15. doi: https://doi.org/10.15587/1729-4061.2018.142735

##submission.downloads##

PDF (English)

Опубліковано

2018-11-19

Як цитувати

Ishchenko, A., Polyakova, M., Kuvaieva, V., & Nesteryuk, A. (2018). Розробка структурного представлення областей зображень відсканованих документів для моделі MRC. Eastern-European Journal of Enterprise Technologies, 6(2 (96), 32–38. https://doi.org/10.15587/1729-4061.2018.147671

Завантажити посилання

Номер

Том 6 № 2 (96) (2018): Інформаційні технології. Системи управління в промисловості

Розділ

Інформаційні технології

Ліцензія

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.

Закріплення та умови передачі авторських прав (ідентифікація авторства) здійснюється у Ліцензійному договорі. Зокрема, автори залишають за собою право на авторство свого рукопису та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons CC BY. При цьому вони мають право укладати самостійно додаткові угоди, що стосуються неексклюзивного поширення роботи у тому вигляді, в якому вона була опублікована цим журналом, але за умови збереження посилання на першу публікацію статті в цьому журналі.

Ліцензійний договір – це документ, в якому автор гарантує, що володіє усіма авторськими правами на твір (рукопис, статтю, тощо).
Автори, підписуючи Ліцензійний договір з ПП «ТЕХНОЛОГІЧНИЙ ЦЕНТР», мають усі права на подальше використання свого твору за умови посилання на наше видання, в якому твір опублікований. Відповідно до умов Ліцензійного договору, Видавець ПП «ТЕХНОЛОГІЧНИЙ ЦЕНТР» не забирає ваші авторські права та отримує від авторів дозвіл на використання та розповсюдження публікації через світові наукові ресурси (власні електронні ресурси, наукометричні бази даних, репозитарії, бібліотеки тощо).
За відсутності підписаного Ліцензійного договору або за відсутністю вказаних в цьому договорі ідентифікаторів, що дають змогу ідентифікувати особу автора, редакція не має права працювати з рукописом.
Важливо пам’ятати, що існує і інший тип угоди між авторами та видавцями – коли авторські права передаються від авторів до видавця. В такому разі автори втрачають права власності на свій твір та не можуть його використовувати в будь-який спосіб.