Оцінювання пертинентності лінгвістичних дескрипторів в системах інформаційного пошуку

Автор(и)

  • Лариса Эрнестовна Чалая Харківський національний університет радіоелектроніки пр. Леніна 14, м. Харків, Україна, 61166, Ukraine
  • Юлия Юрьевна Харитонова Харківський національний університет радіоелектроніки пр. Леніна 14, м. Харків, Україна, 61166, Ukraine https://orcid.org/0000-0001-8089-577X

DOI:

https://doi.org/10.15587/1729-4061.2015.37450

Ключові слова:

дескриптор, акронім, інтелектуальний аналіз, електронний текст, класифікація, семантична інформація

Анотація

У статті розглядається можливість використання акронімів в якості лінгвістичних дескрипторів для класифікації аналізованих електронних текстів. Запропонований підхід реалізується за допомогою двоетапної процедури. На першому етапі акроніми вилучаються з декількох текстових документів розглянутої області з подальшим складанням спеціалізованих акроніміческіх словників. На другому етапі застосовується модифікована метрика DeMT, яка дозволяє визначати пертинентні визначення акроніма.

Біографії авторів

Лариса Эрнестовна Чалая, Харківський національний університет радіоелектроніки пр. Леніна 14, м. Харків, Україна, 61166

Кандидат технічних наук, доцент

Кафедра штучного інтелекту

Юлия Юрьевна Харитонова, Харківський національний університет радіоелектроніки пр. Леніна 14, м. Харків, Україна, 61166

Аспірант

Кафедра штучного інтелекту

Посилання

Navarro, G. (2001). A guided tour to approximate string matching. ACM Computing Surveys, 33 (1), 31–88.. doi: 10.1145/375360.375365

Duchateau, F., Bellahsene, Z., Roche, M. (2007). A context-based measure for discovering approximate semantic matching between schema elements. In Proceedings of IEEE Research Challenges in Information Science (RCIS), 9–20.

Rahm, E., Bernstein, P. A. (2001). A survey of approaches to automatic schema matching. VLDB Journal: Very Large Data Bases, 10 (4), 334–350. doi: 10.1007/s007780100057

Duchateau, F., Bellahsene, Z., Roche, M. (2008). Improving quality and performance of schema matching in large scale. Ingénierie des Systèmes d’Information (ISI), 13 (5), 59–82. doi: 10.3166/isi.13.5.59-82

Aussenac-Gilles, N., Bourigault, D. (2003). Construction d’ontologies à partir de textes. In Actes de Traitement Automatique des Langues Naturelles (TALN), 2, 27–47.

Turney, P. (2001). Mining the Web for synonyms: PMI–IR versus LSA on TOEFL. Proceedings of the 12th European Conference on Machine Learning (ECML), LNCS, 2167, 491–502. doi: 10.1007/3-540-44795-4_42

Qamar, A., Gaussier, E. (2009). Online and batch learning of generalized cosine similarities. In Proceedings of International Conference on Data Mining (ICDM), 926–931. doi: 10.1109/icdm.2009.114

Nyberg, K., Raiko, T., Hyvönen, E., Tiinanen, T. (2010). Document classification utilising ontologies and relations between documents. In Proceedings of the Eighth Workshop on Mining and Learning with Graphs (MLG), 86–93. doi: 10.1145/1830252.1830264

Bellahsene, Z., Benbernou, S., Jaudoin, H., Pinet, F., Pivert, O., Toumani, F., Bernard, S., Colomb, P., Coletta, R., Coquery, E., De Marchi, F., Duchateau, F., Hacid, M.-S., HadjAli, A., Roche, M. (2010). Forum: a flexible data integration system based on data semantics. SIGMOD Record, 39 (2), 11–18.

Roche, M., Prince, V. (2007). AcroDef: A quality measure for discriminating expansions of ambiguous acronyms. In Proceedings of CONTEXT, LNCS, Springer-Verlag, 411–424. doi: 10.1007/978-3-540-74255-5_31

Roche, M. (2004). Intégration de la construction de la terminologie de domaines spécialisés dans un processus global de fouille de textes. Paris, 11.

Smadja, F., McKeown, K. R., Hatzivassiloglou, V. (1996). Translating collocations for bilingual lexicons: A statistical approach. Computational Linguistics, 22 (1), 1–38.

Blandin, G. (2005). Dictionnaire de sigles et acronyms. Asankyeya. Available at: http://www.sigles.net

Pike, R. (2004). Medline. USA. Available at: http://www.ncbi.nlm.nih.gov/PubMed

##submission.downloads##

Опубліковано

2015-02-25

Як цитувати

Чалая, Л. Э., & Харитонова, Ю. Ю. (2015). Оцінювання пертинентності лінгвістичних дескрипторів в системах інформаційного пошуку. Eastern-European Journal of Enterprise Technologies, 1(9(73), 46–53. https://doi.org/10.15587/1729-4061.2015.37450

Номер

Розділ

Інформаційно-керуючі системи