Комбінований метод сегментації зображень відсканованих документів з послідовним виділенням областей
DOI:
https://doi.org/10.15587/1729-4061.2018.142735Ключові слова:
сегментація зображень, відсканований документ, блочний метод, графічне зображення, фотозображеня, текстовий фрагмент, зв'язкова компонента, метод БлумбергаАнотація
Запропоновано комбінований метод сегментації зображень відсканованих документів, в якому, на відміну від відомих, проводиться попереднє відокремлення області графічних і фотозображень від текстових областей і фону. При цьому проводиться аналіз зв'язкових компонент, які є різними для графічних зображень, фотозображень та текстових областей. Для класифікації виділених областей, на області фото і графіки використовується блоковий метод. Встановлено, що такий спосіб розбиття областей на блоки менше впливає на якість сегментування в порівнянні з застосуванням блочного методу безпосередньо до вихідного зображення. Для відділення більш складних за формою текстових областей від фону застосовано обробка околиці кожного пікселя.
Для виділення на зображеннях відсканованих документів границь ілюстрацій використовувався метод Блумберга. Для поділу на фото і графіку запропоновано розбиття ілюстрації на блоки пікселів. Кожному блоку пікселів відповідає вектор з двох ознак: середнього значення величини локального градієнта і середнього значення функції, що локалізує на зображеннях відсканованих документів лінійні об'єкти (графіка і символи тексту). Отримані вектора ознак класифікувалися машиною опорних векторів.
При виділенні текстових фрагментів використовувалися низькочастотна фільтрація і порогове перетворення.
Практичне відпрацювання комбінованого методу проведено для сегментації тестових зображень відсканованих статей газет з бази даних документів MediaTeam університету Оулу (Фінляндія). Встановлено, що комбінований метод характеризується підвищеною швидкодією сегментації зображень при високій якості обробкиПосилання
- Haneda, E., Bouman, C. A. (2011). Text Segmentation for MRC Document Compression. IEEE Transactions on Image Processing, 20 (6), 1611–1626. doi: https://doi.org/10.1109/tip.2010.2101611
- Polyakova, M., Ishchenko, A., Huliaieva, N. (2018). Document image segmentation using averaging filtering and mathematical morphology. 2018 14th International Conference on Advanced Trends in Radioelecrtronics, Telecommunications and Computer Engineering (TCSET). doi: https://doi.org/10.1109/tcset.2018.8336354
- El-Omari, N. K. T., Omari, A., Al-Badarneh, O., Abdel-Jaber, H. (2012). Scanned Document Image Segmentation Using Back-Propagation Artificial Neural Network Based Technique. International Journal of Computers and Communications, 6 (4), 183–190. Available at: https://www.naun.org/main/UPress/cc/16-060.pdf
- Sasirekha, D., Chandra, E. (2012). Enhanced techniques for PDF image segmentation and text extraction. International Journal of Electronics and Computer Science Engineering. 2012. Vol. 10, Issue 9. P. 1833–1838.
- Korennoy, A. V., Yudakov, D. S., Dedov, S. V., Strazhnik, V. P. (2015). Obnaruzhenie i lokalizaciya tekstovyh oblastey na polutonovyh cifrovyh izobrazheniyah. Vestnik VGU. Sistemnyy analiz i informacionnye tekhnologii, 4, 65–72.
- Kundu, M. K., Dhar, S., Banerjee, M. (2012). A new approach for segmentation of image and text in natural and commercial color documents. 2012 International Conference on Communications, Devices and Intelligent Systems (CODIS). doi: https://doi.org/10.1109/codis.2012.6422142
- Abdullah, H. S., Jassim, A. H. (2016). Improved fuzzy c-means for document image segmentation. British Journal of Science, 14 (2), 1–15.
- Abdullah, H. S., Jasim, A. H. (2016). Improved Ant Colony Optimization for Document Image Segmentation. International Journal of Computer Science and Information Security (IJCSIS), 14 (11), 775–785.
- Erkilinc, M. S., Jaber, M., Saber, E., Bauer, P., Depalov, D. (2012). Text, photo, and line extraction in scanned documents. Journal of Electronic Imaging, 21 (3), 033006. doi: https://doi.org/10.1117/1.jei.21.3.033006
- Bukhari, S. S., Shafait, F., Breuel, T. M. (2011). Improved document image segmentation algorithm using multiresolution morphology. Document Recognition and Retrieval XVIII. doi: https://doi.org/10.1117/12.873461
- Zirari, F., Ennaji, A., Nicolas, S., Mammass, D. (2013). A Document Image Segmentation System Using Analysis of Connected Components. 2013 12th International Conference on Document Analysis and Recognition. doi: https://doi.org/10.1109/icdar.2013.154
- Bukhari, S. S., Al Azawi, M. I. A., Shafait, F., Breuel, T. M. (2010). Document image segmentation using discriminative learning over connected components. Proceedings of the 8th IAPR International Workshop on Document Analysis Systems – DAS ’10. doi: https://doi.org/10.1145/1815330.1815354
- Gonsales, R., Vuds, R. (2005). Cifrovaya obrabotka izobrazheniy. Moscow: Tekhnosfera, 1072.
- Frangi, A. F., Niessen, W. J., Vincken, K. L., Viergever, M. A. (1998). Multiscale vessel enhancement filtering. Lecture Notes in Computer Science, 130–137. doi: https://doi.org/10.1007/bfb0056195
- Mandel', I. D. (1988). Klasterniy analiz. Moscow: Finansy i statistika, 176.
- Chu, W., Keerthi, S. S., Ong, C. J. (2002). A general formulation for support vector machines. Proceedings of the 9th International Conference on Neural Information Processing, 2002. ICONIP '02. doi: https://doi.org/10.1109/iconip.2002.1201949
- Otsu, N. (1979). A Threshold Selection Method from Gray-Level Histograms. IEEE Transactions on Systems, Man, and Cybernetics, 9 (1), 62–66. doi: https://doi.org/10.1109/tsmc.1979.4310076
- Sauvola, J., Kauniskangas, H. (1999). MediaTeam Document Database II: a collection of document images. University of Oulu. Finland.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2018 Marina Polyakova, Alesya Ishchenko, Natalya Volkova, Oleg Pavlov
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Закріплення та умови передачі авторських прав (ідентифікація авторства) здійснюється у Ліцензійному договорі. Зокрема, автори залишають за собою право на авторство свого рукопису та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons CC BY. При цьому вони мають право укладати самостійно додаткові угоди, що стосуються неексклюзивного поширення роботи у тому вигляді, в якому вона була опублікована цим журналом, але за умови збереження посилання на першу публікацію статті в цьому журналі.
Ліцензійний договір – це документ, в якому автор гарантує, що володіє усіма авторськими правами на твір (рукопис, статтю, тощо).
Автори, підписуючи Ліцензійний договір з ПП «ТЕХНОЛОГІЧНИЙ ЦЕНТР», мають усі права на подальше використання свого твору за умови посилання на наше видання, в якому твір опублікований. Відповідно до умов Ліцензійного договору, Видавець ПП «ТЕХНОЛОГІЧНИЙ ЦЕНТР» не забирає ваші авторські права та отримує від авторів дозвіл на використання та розповсюдження публікації через світові наукові ресурси (власні електронні ресурси, наукометричні бази даних, репозитарії, бібліотеки тощо).
За відсутності підписаного Ліцензійного договору або за відсутністю вказаних в цьому договорі ідентифікаторів, що дають змогу ідентифікувати особу автора, редакція не має права працювати з рукописом.
Важливо пам’ятати, що існує і інший тип угоди між авторами та видавцями – коли авторські права передаються від авторів до видавця. В такому разі автори втрачають права власності на свій твір та не можуть його використовувати в будь-який спосіб.