Розробка структурного представлення областей зображень відсканованих документів для моделі MRC
DOI:
https://doi.org/10.15587/1729-4061.2018.147671Ключові слова:
зображення відсканованих документів, модель змішаного растрового контенту, виділення тексту, шар зображенняАнотація
Модель змішаного растрового контенту – Mixed Raster Content – є поширеною формою представлення зображення відсканованого документа. Запропоновано подальший розвиток цієї моделі, який полягає в структурному представленні однорідних областей на кожному шарі MRC моделі зображення. Метою такого представлення зображення є подальше виділення областей зображення, які цікавлять, та їх ідентифікація для вирішення задачі сегментації зображень відсканованих документів.
Шар, що містить графічні та фотозображення, представлявся у вигляді об'єднання кількох областей за допомогою кусочно-постійної функції інтенсивності області зображення. Для цього графічне та фотозображення представлялися у вигляді розбиття на сегменти, що містять пікселі однорідної інтенсивності. Для визначення цих областей з метою відділення графіки від фотозображень розглядалися значення перепаду інтенсивності пікселів на границях множин, що містять дані області.
Шар, що містить текст, представлявся як зображення областей структурної текстури на однорідному фоні. Ці області містили фрагменти звичайного тексту та заголовка, що мають однакову інтенсивність пікселів і розрізняються формою та розміром символів, а також відстанню між ними. Таке уявлення шару дозволило врахувати просторові зв'язки між пікселями в зображенні символу і надалі виділити область тексту з фону.
Запропонована модель представлення зображення відсканованого документа дозволяє виділити шари зображення, що містять однорідні області, та звести процес сегментації всього зображення до сегментації окремих однорідних областей зображення. Це дозволяє підвищити швидкодію обробки при збереженні високої якості сегментації зображенняПосилання
- De Queiroz, R. L., Buckley, R. R., Xu, M. (1999). Mixed Raster Content (MRC) Model for Compound Image Compression. Visual Communications and Image Processing '99. San Jose, 3653. doi: https://doi.org/10.1117/12.334618
- Banupriya, D., Sundaresan, M. (2016). Enhanced hybrid compression method for compound images. International Journal of Computational Inteligence and Informatics, 6 (1), 18–24.
- Maheswari, D., Radha, V. (2010). Enhanced layer based compound image compression. Proceedings of the 1st Amrita ACM-W Celebration on Women in Computing in India – A2CWiC ’10. doi: https://doi.org/10.1145/1858378.1858418
- Huttenlocher, D., Felzenszwalb, P., Rucklidge, W. (1999). Digipaper: a versatile color document image representation. Proceedings 1999 International Conference on Image Processing (Cat. 99CH36348). doi: https://doi.org/10.1109/icip.1999.821601
- Melnakshi, P., Jabanesh, P. (2014). An Efficient Compound Image compression by exploiting spatial correlation. International Journal of Engineering Research&Technology, 3 (1), 2962–2967.
- Bross, B. et. al. (2013). High efficiency video coding (HEVC) text specification draft 10. Doc. JCTVC-L1003. Switzerland.
- Sullivan, G. J., Ohm, J.-R., Han, W.-J., Wiegand, T. (2012). Overview of the High Efficiency Video Coding (HEVC) Standard. IEEE Transactions on Circuits and Systems for Video Technology, 22 (12), 1649–1668. doi: https://doi.org/10.1109/tcsvt.2012.2221191
- Xu, J., Joshi, R., Cohen, R. A. (2016). Overview of the Emerging HEVC Screen Content Coding Extension. IEEE Transactions on Circuits and Systems for Video Technology, 26 (1), 50–62. doi: https://doi.org/10.1109/tcsvt.2015.2478706
- Juliet, S. E., Sadasivam, V., Florinabel, D. J. (2011). Effective layer-based segmentation of compound images using morphology. Journal of Real-Time Image Processing, 9 (2), 299–314. doi: https://doi.org/10.1007/s11554-011-0223-8
- Haneda, E., Bouman, C. A. (2011). Text Segmentation for MRC Document Compression. IEEE Transactions on Image Processing, 20 (6), 1611–1626. doi: https://doi.org/10.1109/tip.2010.2101611
- Minaee, S., Wang, Y. (2015). Screen content image segmentation using least absolute deviation fitting. 2015 IEEE International Conference on Image Processing (ICIP). doi: https://doi.org/10.1109/icip.2015.7351413
- Sherstobitov, A. I., Fedosov, V. P., Prihodchenko, V. A., Timofeev, D. V. (2013). Raspoznavanie lic na gruppovyh fotografiyah s ispol'zovaniem algoritmov segmentacii. Izvestiya Yuzhnogo federal'nogo universiteta. Tekhnicheskie nauki, 66–73.
- Haralik, R. (1979). Statisticheskiy i strukturnyy pohody k opisaniyu tekstur. TIIER, 67 (5), 98–120.
- Dunn, D., Higgins, W. E., Wakeley, J. (1994). Texture segmentation using 2-D Gabor elementary functions. IEEE Transactions on Pattern Analysis and Machine Intelligence, 16 (2), 130–149. doi: https://doi.org/10.1109/34.273736
- Polyakova, M. V., Krylov, V. N., Ishchenko, A. V. (2014). Elaboration of the transform with generalized comb scaling and wavelet functions for the image segmentation. Eastern-European Journal of Enterprise Technologies, 5 (2 (71)), 33–37. doi: https://doi.org/10.15587/1729-4061.2014.27791
- Polyakova, M. V., Krylov, V. N. (2007). Opredelenie granic segmenta uporyadochennoy tekstury na izobrazhenii s odnorodnym fonom v prostranstve preobrazovaniya Gil'berta. Elektronika i svyaz', 5, 54–61.
- Gonsales, R. S., Vuds, R. E., Eddins, S. L. (2006). Cifrovaya obrabotka izobrazheniy v srede MATLAB. Moscow: Tekhnosfera, 616.
- Polyakova, M., Ishchenko, O., Volkova, N., Pavlov, O. (2018). Combined method for scanned documents images segmentation using sequential extraction of regions. Eastern-European Journal of Enterprise Technologies, 5 (2 (95)), 6–15. doi: https://doi.org/10.15587/1729-4061.2018.142735
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2018 Alesya Ishchenko, Marina Polyakova, Varvara Kuvaieva, Alexandr Nesteryuk
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Закріплення та умови передачі авторських прав (ідентифікація авторства) здійснюється у Ліцензійному договорі. Зокрема, автори залишають за собою право на авторство свого рукопису та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons CC BY. При цьому вони мають право укладати самостійно додаткові угоди, що стосуються неексклюзивного поширення роботи у тому вигляді, в якому вона була опублікована цим журналом, але за умови збереження посилання на першу публікацію статті в цьому журналі.
Ліцензійний договір – це документ, в якому автор гарантує, що володіє усіма авторськими правами на твір (рукопис, статтю, тощо).
Автори, підписуючи Ліцензійний договір з ПП «ТЕХНОЛОГІЧНИЙ ЦЕНТР», мають усі права на подальше використання свого твору за умови посилання на наше видання, в якому твір опублікований. Відповідно до умов Ліцензійного договору, Видавець ПП «ТЕХНОЛОГІЧНИЙ ЦЕНТР» не забирає ваші авторські права та отримує від авторів дозвіл на використання та розповсюдження публікації через світові наукові ресурси (власні електронні ресурси, наукометричні бази даних, репозитарії, бібліотеки тощо).
За відсутності підписаного Ліцензійного договору або за відсутністю вказаних в цьому договорі ідентифікаторів, що дають змогу ідентифікувати особу автора, редакція не має права працювати з рукописом.
Важливо пам’ятати, що існує і інший тип угоди між авторами та видавцями – коли авторські права передаються від авторів до видавця. В такому разі автори втрачають права власності на свій твір та не можуть його використовувати в будь-який спосіб.