РОЗРОБКА МОДУЛЯ ІНТЕЛЕКТУАЛЬНОЇ СИСТЕМИ ОБРОБКИ ВІДСКАНОВАНИХ ДОКУМЕНТІВ НА БАЗІ КОМБІНОВАНОГО МЕТОДУ СЕГМЕНТАЦІЇ ЗОБРАЖЕНЬ
DOI:
https://doi.org/10.30837/2522-9818.2019.8.044Ключові слова:
сегментація зображень, відскановані документи, обробка документів, інтелектуальна системаАнотація
Предметом дослідження в статті є модуль сегментації, створений на базі комбінованого методу сегментації зображень, і впроваджений в інтелектуальну систему обробки відсканованих документів, яка використовується в Одеській поліграфічній компанії "Студія "Друк". Метою роботи є розробка модуля сегментації зображень для підвищення оперативності інтелектуальної системи обробки відсканованих документів поліграфічної компанії "Студія "Друк". Для цього використовується комбінований метод сегментації зображень відсканованих документів, який дозволяє скоротити час обробки зображення. У статті вирішуються наступні завдання: аналіз існуючих методів сегментації зображень, які використовуються в інтелектуальних системах обробки відсканованих документів; розробка процедур для модуля сегментації на основі комбінованого методу сегментації зображень для інтелектуальної системи обробки відсканованих документів. В роботі використовуються методи: методи цифрової обробки зображень, методи фільтрації і морфо-логічного аналізу зображень, методи математичного аналізу, нейронні мережі. Отримані наступні результати: Результати обробки зображень за допомогою інтелектуальної системи обробки відсканованих документів на базі запропонованого модуля сегментації підтверджують працездатність процедур модуля сегментації зображень. Середній час обробки зображень відсканованих документів становив 5,3 с в порівнянні з раніше отриманим - 42 с, що дозволяє зробити висновок про збільшення оперативності інтелектуальної системи обробки відсканованих документів, яка досліджується. Висновки: Впровадження розробленого модуля сегментації зображень в інтелектуальну систему обробки відсканованих документів поліграфічної компанії "Студія "Друк" дозволило скоротити час обробки зображень відсканованих документів в 8 разів при збереженні достатньої якості сегментації, завдяки чому збільшилася оперативність даної інтелектуальної системи.
Посилання
Usylyn, S. A., Nykolaev, D. P., Postnykov, V. V. (2009), "Cognitive PDF / A - the technology of digitizing text documents for publication in the Internet and long-term archiving" ["Cognitive PDF/A – texnologyya ocyfrovky tekstovih dokumentov dlya publykacyy v Ynternet y dolgovremennogo arhyvnogo hranenyya"], Trudi Ynstytuta systemnogo analyza RAN. Texnologyy programmyrovanyya yhranenyya dannih / pod red. Arlazarov V.L., Emelyanov N.E, Moscow : LENAND, Vol. 45. P. 159–173.
Rajeswari, N., Rathnapriya, S., Nijandan, S. (2014), "Test Segmentation of MRC Document Compression and Decompression by Using MATLAB", International Conference on Engineering Technology and Science-(ICETS’14), Tamilnadu, India, Vol. 3, Special Issue 1, P. 914–919.
Antonacopoulos, A., Pletschacher, S., Bridson, D. and Papadopoulos, C. (2009), "ICDAR2009 Page Segmentation Competition", 10th International Conference on Document Analysis and Recognition, Barcelona, Spain, P. 1371–1374. DOI: https://doi.org/10.1109/ICDAR.2009.27
Thai, V. H., Tabbone, S. (2010), "Text Extraction from Graphical Document Images Using Sparse Representation", ACM International Conference Proceeding Series: International Workshop on Document Analysis Systems - DAS’2010, Jun 2010, Boston, United States, ACM, P. 143–150.
Erkilinc, S., Saber, E., Jaber, M. (2012), "Text, photo, and line extraction in scanned documents", Journal of Electronic Imaging, Vol. 21 (3), P. 033006-1–033006-18.
Bukhari, S. S., Azawi, M. A, Shafait, F, Breuel, T. (2010), "Document image segmentation using discriminative learning over connected components", The 9th IAPR International Workshop DAS 2010 (Document Analysis Systems). Boston, Massachusetts. USA, P. 183–190.
Polyakova, М., Ishchenko, A., Volkova, N., Pavlov, O. (2018), "The combining segmentation method of the scanned documents images with sequential division of the photo, graphics, and the text areas", Eastern-European Journal of Enterprise Technologies, No. 5/2 (95), P. 6–16. DOI: https://doi.org/10.15587/1729-4061.2018.142735
Ishchenko, А., Polyakova, M., Kuvaieva, V., Nesteryuk, A. (2018), "Elaboration of structural representation of regions of scanned document images for MRC model", Eastern-European Journal of Enterprise Technologies, No. 6/2 (96), P. 32–38. DOI: https://doi.org/10.15587/1729-4061.2018.147671
Polyakova, M., Ishchenko, A., Huliaieva, N. (2018), "Document image segmentation using averaging filtering and mathematical morphology", 14th International Conference on Advanced Trends in Radioelecrtronics, Telecommunications and Computer Engineering (TCSET). Lviv-Slavske, Ukraine, P. 966–969. DOI: https://doi.org/10.1109/TCSET.2018.8336354
Bloomberg, D. S. (1992), "Multiresolution Morphological Approach to Document Image", Visual Communications and Image Processing, Boston, MA, United States, SPIE, Vol. 1818, P. 648–663.
Boltenkov, V., Kuvaieva, V., Galchonkov, O., Ishchenko, A. (2018), "Application of the assignment problem in the calcucation of median consensus rankings", Eastern-European Journal of Enterprise Technologies, No. 4 (94), P. 27–35.
Chu, W., Keerthi, S. (2002), "A general formulation for support vector machines",C. J. Ong.In Proc. of the 9th Int. Conf. on Neural Information Processing (ICONIP '02), Singapore.
Gonsales, R. S., Vuds, R. E., Eddins, S. L. (2006), Digital image processing in MATLAB [Cyfrovaya obrabotka yzobrazhenyj v srede MATLAB], Moscow : Tehnosfera, 616 p.
Haralyk R. (1979), "Statistical and structural approaches to the description of textures" ["Statisticheskiy i strukturnyy podkhody k opisaniyu tekstur"], TYYER, Vol. 67, No. 5, P. 98–120.
Guyon, I., Weston, J., Barnhill, S., Vapnik, V. (2002), "Gene Selection for Cancer Classification using Support Vector Machines", Machine Learning, Vol. 46, No. 1-3, P. 389–422.
Wang, H., Khoshgoftaar, T., Napolitano, A. (2011), "An Empirical Study of Software Metrics Selection Using Support Vector Machine", Proceedings of the 23rd International Conference on Software Engineering & Knowledge Engineering (SEKE’2011), Eden Roc Renaissance, Miami Beach, USA, P. 83–88.
Sojfer, V. A. (2003), Computer image processing methods [Metodi kompyuternoj obrabotky yzobrazhenyj] : pod red. V. A. Sojfera, Moscow : Fyzmatlyt, 784 p.
Bolohova, N., Ruban, I. (2019), "Image processing models and methods research and ways of improving marker recognition technologies in added reality systems", Innovative Technologies and Scientific Solutions for Industries, No. 1 (7), P. 25–33. DOI: https://doi.org/10.30837/2522-9818.2019.7.025
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2019 Alesya Ishchenko

Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Наше видання використовує положення про авторські права Creative Commons для журналів відкритого доступу.
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:
Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License (CC BY-NC-SA 4.0), котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
Автори мають право укладати самостійні додаткові угоди щодо не комерційного та не ексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису опублікованої роботи, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи.












