ОНТОЛОГО-КЕРОВАНІ ЗАСОБИ ОБРОБЛЕННЯ ТА ПОДАННЯ ВЕЛИКИХ МАСИВІВ НЕСТРУКТУРОВАНИХ ТЕКСТІВ

Автор(и)

  • Світлана Гайко Інститут телекомунікацій та глобального інформаційного простору НАН України, Україна https://orcid.org/0000-0002-3564-475X

DOI:

https://doi.org/10.30837/ITSSI.2023.24.027

Ключові слова:

неструктуровані тексти; онтологія; рекурсивна редукція; таксономія; оброблення текстів; подання інформації

Анотація

Предметом дослідження статті є методи онтолого-керованого оброблення та подання неструктурованих текстів у глобальному середовищі. Мета роботи – підвищення ефективності автоматичного пошуку, класифікації та вибору необхідної інформації, що міститься в електронних виданнях у неструктурованій формі шляхом розроблення моделі, методу й засобів автоматизованого оброблення та трансдисциплінарного подання текстових документів, створених українською, російською та англійською мовами. Відповідно до мети визначено такі завдання: розглянути моделі оброблення та подання неструктурованих текстів; виявити переваги інформаційних систем з онтолого-керованою архітектурою; розробити концептуальну модель і засоби автоматизованого оброблення та трансдисциплінарного подання текстових документів; удосконалити метод рекурсивної редукції; за допомогою розроблених методів і засобів обробити великий масив неструктурованих текстів (зокрема інформаційну базу знань наукової продукції (ІБЗ НП), навчальні програми, а також навчально-дослідницькі проєкти НЦ "Мала академія наук України"); подати їх у вигляді, що дасть змогу виявляти якість і повноту наявної в базах системи знань і, отже, експериментально підтвердити ефективність розроблених засобів. Проведені дослідження ґрунтуються на таких методах: системологічної класифікації, алгебро-логічний та аксіоматичний методи, метод рекурсивної редукції. Здобуто такі результати: описано наявні моделі оброблення та подання неструктурованих текстів; удосконалено технологічні аспекти онтолого-керованого підходу до оброблення та подання великих масивів мережних документів; розроблено технологію формування онтологій документів на основі репрезентації їх таксономій, зв’язків між їх контекстами та множинного подання, що забезпечує ефективний пошук інформації в неструктурованих текстах. Висновки: обґрунтовано переваги онтолого-керованих засобів оброблення та подання неструктурованих текстів; подальшого розвитку набув метод рекурсивної редукції шляхом побудови перетворення, яке приводить до предикативної форми онтологічно задані описи інформації; викладено ідеї ефективного пошуку, оброблення, класифікації та вибору необхідної інформації.

Біографія автора

Світлана Гайко, Інститут телекомунікацій та глобального інформаційного простору НАН України

Молодший науковий співробітник Інституту телекомунікацій та глобального інформаційного простору НАН України

Посилання

Список літератури

Павленко П. М., Філоненко С. Ф., Бабіч К. С. та ін. Інформаційні системи і технології. Київ : НАУ, 2013. 324 с.

Jones K. S. Natural language processing: a historical review. 1994. URL: https://aclanthology.org/www.mt-archive.info/Zampolli-1994-Sparck-Jones.pdf (дата звернення: 10.05.2021)

Liddy E. D. Natural Language Processing. Encyclopedia of Library and Information Science. NY : Marcel Decker, Inc. 2001.

Jurafsky D., Martin G. H. Speech and Language Processing. Prentice Hall. 2000. URL: https://web.stanford.edu/~jurafsky/slp3 (дата звернення: 10.05.2021)

Barkovska O., Khomych V., Nastenko O. Дослідження методів обробки та аналізу тексту при організації електронних сховищ інформаційних об’єктів. Сучасний стан наукових досліджень та технологій в промисловості. 2022. № 1 (19). С. 5–12. DOI: https://doi.org/https://doi.org/10.30837/ITSSI.2022.19.005

Praveena S., Justus S. A Study on Knowledge Representation Models. European Journal of Molecular and Clinical Medicine. 2020. вип. 7. № 4. С. 2446–2452.

Субботін С. О. Подання й обробка знань у системах штучного інтелекту та підтримки прийняття рішень. Запоріжжя: ЗНТУ, 2008. 341 с.

Yang L., Cormican K., Yu M. Ontology-based systems engineering: A state-of-the-art review. Computers in Industry. 2019. вип. 111. С. 148–171. DOI: https://doi.org/https://doi.org/10.1016/j.compind.2019.05.003

Басюк Т. М., Досин Д. Г., Литвин В. В. Онтологічний інжиніринг. Львів : Вид-во Львівської політехніки. 2017. 224 с.

Інструкція користувача КІТ "Поліедр". 2020. URL: https://storage.ulif.org.ua/storage/instructions/polyhedron_instruction.pdf (дата звернення: 10.05.2021)

Lawrence M., Williams S., Nanz P., Renn O. Characteristics, potentials, and challenges of transdisciplinary research. One Earth. 2022. вип. 5. № 1. С. 44–61. DOI: https://doi.org/https://doi.org/10.1016/j.oneear.2021.12.010

Renn O. Transdisciplinarity: Synthesis towards a modular approach. Futures. 2021. вип. 130. С. 1–18. DOI: https://doi.org/https://doi.org/10.1016/j.futures.2021.102744

Гончар А. В., Стрижак О. Є., Беркман Л. Н. Трансдисциплінарна консолідація інформаційних середовищ. Зв’язок. 2021. № 1(149). С. 3–10. DOI: https://doi.org/10.31673/2412-9070.2021.010310

Гайко С. І., Приходнюк В. В. Підхід до автоматизованої структуризації освітніх ресурсів на основі методу рекурсивної редукції. Наукові записки Малої академії наук України. 2021. № 1 (20). С. 28–38. DOI: https://doi.org/http://doi.org/10.51707/2618-0529-2021-20-03

Приходнюк В. В. Технологічні засоби трансдисциплінарного представлення геопросторової інформації: дис. канд. техн. наук. Інститут телекомунікацій і глобального інформаційного простору. 2017. 267 с.

Стрижак О. Є., Приходнюк В. В., Гайко С. І., Шаповалов В. Б. Відображення мережевої інформації у вигляді інтерактивних документів. Трансдисциплінарний підхід. Математичне моделювання в економіці. 2018. № 3. С. 87–100.

Гайко С., Приходнюк В. Средства трансдисциплинарного представления информационных ресурсов разных стилей. Information Models and Analysis. Sofia : ITHEA, 2020. вип. 9. № 1. С. 78–99.

Величко В. Ю. Алгоритм побудови зростаючих пірамідальних мереж у паралельному обчиcлювальному середовищі. Комп’ютерні засоби мережі та системи. 2011. № 10. С. 50–57.

Dovgyi S., Stryzhak O. Transdisciplinary Fundamentals of Information-Analytical Activity. Advances in Information and Communication Technology and Systems. MCT 2019. Lecture Notes in Networks and Systems. 2019. вип. 152. DOI: https://doi.org/https://doi.org/10.1007/978-3-030-58359-0_7

References

Pavlenko, P. M., Filonenko, S. F., Babich, K. S. and others. (2013), Information systems and technologies, Kyiv, NAU, 324 p.

Jones, K. S. (1994), "Natural language processing: a historical review", available at: https://aclanthology.org/www.mt-archive.info/Zampolli-1994-Sparck-Jones.pdf (last accessed: 10.05.2021)

Liddy, E. D. (2001), "Natural Language Processing", Library and Information Science, New York, P. 15–25. DOI: https://doi.org/10.1145/234173.234180

Jurafsky, D., Martin, G. H. (2000), "Speech and Language Processing", Prentice Hall, available at: https://web.stanford.edu/~jurafsky/slp3/ (last accessed: 11.01.2023).

Barkovska, O., Khomych, V., Nastenko, O. (2022), "Study of text processing and analysis methods in the organization of electronic storage of information objects", Innovative technologies and scientific solutions for industries, No 1 (19), P. 5–12. DOI: https://doi.org/https://doi.org/10.30837/ITSSI.2022.19.005

Praveena, S., Justus, S. (2020), "A Study on Knowledge Representation Models", European Journal of Molecular and Clinical Medicine, Vol 7, No. 4, P. 2446–2452.

Subbotin, S. O. (2008), Presentation and processing of knowledge in artificial intelligence and decision support systems, Zaporizhzhia, 108 p.

Yang, L., Cormican, K., Yu, M. (2019), "Ontology-based systems engineering: A state-of-the-art review", Computers in Industry, No. 111, P. 148–171. DOI: https://doi.org/https://doi.org/10.1016/j.compind.2019.05.003

Basyuk, T. M., Dosyn, D. G., Lytvyn, V. V. (2017), Ontological engineering, Lviv, 224 p.

"KIT "Polyhedron" user manual", (2020), available at: https://storage.ulif.org.ua/storage/instructions/polyhedron_instruction.pdf (last accessed: 12.08.2021)

Lawrence, M., Williams, S., Nanz, P., Renn, O. (2022), "Characteristics, potentials, and challenges of transdisciplinary research", One Earth, Vol. 5, No. 1, P. 44–61. DOI: https://doi.org/https://doi.org/10.1016/j.oneear.2021.12.010

Renn, O. (2021), "Transdisciplinarity: Synthesis towards a modular approach", Futures, Vol. 130, P. 1–18. DOI: https://doi.org/https://doi.org/10.1016/j.futures.2021.102744

Gonchar, A. V., Stryzhak, O. E., Berkman, L. N. (2021), "Transdisciplinary consolidation of information environments" ["Transdy`scy`plinarna konsolidaciya informacijny`x seredovy`shh"], Connection [Zv`yazok], No. 1(149), P. 3–10. DOI: https://doi.org/10.31673/2412-9070.2021.010310

Haiko, S. I., Prykhodnyuk, V. V. (2021), "Approach to the automated structuring of educational resources based on the method of recursive reduction", Scientific notes of the Junior Academy of Sciences of Ukraine, No. 1 (20), P. 28–38. DOI: https://doi.org/http://doi.org/10.51707/2618-0529-2021-20-03

Prikhodniuk, V. V. (2017), Technological means of transdisciplinary presentation of geospatial information [Texnologichni zasoby` transdy`scy`plinarnogo predstavlennya geoprostorovoyi informaciyi], Ph.D. thesis, Institute of Telecommunications and Global Information Space, 267 p.

Stryzhak, O. E., Prykhodnyuk, V. V., Haiko, S. I., Shapovalov, V. B. (2018), "Display of network information in the form of interactive documents. Transdisciplinary approach" ["Vidobrazhennya merezhevoyi informaciyi u vy`glyadi interakty`vny`x dokumentiv. Transdy`scy`plinarny`j pidxid"], Mathematical modeling in economics, No. 3, P. 87–100.

Gaiko, S., Prikhodnyuk, V. (2020), "Means of transdisciplinary presentation of information resources of different styles" ["Sredstva transdistsiplinarnogo predstavleniya informatsionnykh resursov raznykh stiley"], Information Models and Analysis, Sofia, ITHEA, Vol. 9, No. 1, P. 78–99.

Velichko, V. Yu. (2011), "Algorithm for building growing pyramidal networks in a parallel computing environment" ["Algory`tm pobudovy` zrostayuchy`x piramidal`ny`x merezh u paralel`nomu obchy`clyuval`nomu seredovy`shhi"], Network and system computer tools, No. 10. P. 50–57.

Dovgyi, S., Stryzhak, O. (2019), "Transdisciplinary Fundamentals of Information-Analytical Activity", Lecture Notes in Networks and Systems, Vol. 152. DOI: https://doi.org/https://doi.org/10.1007/978-3-030-58359-0_7

##submission.downloads##

Опубліковано

2023-11-13

Як цитувати

Гайко, С. (2023). ОНТОЛОГО-КЕРОВАНІ ЗАСОБИ ОБРОБЛЕННЯ ТА ПОДАННЯ ВЕЛИКИХ МАСИВІВ НЕСТРУКТУРОВАНИХ ТЕКСТІВ . СУЧАСНИЙ СТАН НАУКОВИХ ДОСЛІДЖЕНЬ ТА ТЕХНОЛОГІЙ В ПРОМИСЛОВОСТІ, (2 (24), 27–38. https://doi.org/10.30837/ITSSI.2023.24.027