Оцінювання пертинентності лінгвістичних дескрипторів в системах інформаційного пошуку

Автор(и)

  • Лариса Эрнестовна Чалая Харківський національний університет радіоелектроніки пр. Леніна 14, м. Харків, Україна, 61166, Україна
  • Юлия Юрьевна Харитонова Харківський національний університет радіоелектроніки пр. Леніна 14, м. Харків, Україна, 61166, Україна https://orcid.org/0000-0001-8089-577X

DOI:

https://doi.org/10.15587/1729-4061.2015.37450

Ключові слова:

дескриптор, акронім, інтелектуальний аналіз, електронний текст, класифікація, семантична інформація

Анотація

У статті розглядається можливість використання акронімів в якості лінгвістичних дескрипторів для класифікації аналізованих електронних текстів. Запропонований підхід реалізується за допомогою двоетапної процедури. На першому етапі акроніми вилучаються з декількох текстових документів розглянутої області з подальшим складанням спеціалізованих акроніміческіх словників. На другому етапі застосовується модифікована метрика DeMT, яка дозволяє визначати пертинентні визначення акроніма.

Біографії авторів

Лариса Эрнестовна Чалая, Харківський національний університет радіоелектроніки пр. Леніна 14, м. Харків, Україна, 61166

Кандидат технічних наук, доцент

Кафедра штучного інтелекту

Юлия Юрьевна Харитонова, Харківський національний університет радіоелектроніки пр. Леніна 14, м. Харків, Україна, 61166

Аспірант

Кафедра штучного інтелекту

Посилання

  1. Navarro, G. (2001). A guided tour to approximate string matching. ACM Computing Surveys, 33 (1), 31–88.. doi: 10.1145/375360.375365
  2. Duchateau, F., Bellahsene, Z., Roche, M. (2007). A context-based measure for discovering approximate semantic matching between schema elements. In Proceedings of IEEE Research Challenges in Information Science (RCIS), 9–20.
  3. Rahm, E., Bernstein, P. A. (2001). A survey of approaches to automatic schema matching. VLDB Journal: Very Large Data Bases, 10 (4), 334–350. doi: 10.1007/s007780100057
  4. Duchateau, F., Bellahsene, Z., Roche, M. (2008). Improving quality and performance of schema matching in large scale. Ingénierie des Systèmes d’Information (ISI), 13 (5), 59–82. doi: 10.3166/isi.13.5.59-82
  5. Aussenac-Gilles, N., Bourigault, D. (2003). Construction d’ontologies à partir de textes. In Actes de Traitement Automatique des Langues Naturelles (TALN), 2, 27–47.
  6. Turney, P. (2001). Mining the Web for synonyms: PMI–IR versus LSA on TOEFL. Proceedings of the 12th European Conference on Machine Learning (ECML), LNCS, 2167, 491–502. doi: 10.1007/3-540-44795-4_42
  7. Qamar, A., Gaussier, E. (2009). Online and batch learning of generalized cosine similarities. In Proceedings of International Conference on Data Mining (ICDM), 926–931. doi: 10.1109/icdm.2009.114
  8. Nyberg, K., Raiko, T., Hyvönen, E., Tiinanen, T. (2010). Document classification utilising ontologies and relations between documents. In Proceedings of the Eighth Workshop on Mining and Learning with Graphs (MLG), 86–93. doi: 10.1145/1830252.1830264
  9. Bellahsene, Z., Benbernou, S., Jaudoin, H., Pinet, F., Pivert, O., Toumani, F., Bernard, S., Colomb, P., Coletta, R., Coquery, E., De Marchi, F., Duchateau, F., Hacid, M.-S., HadjAli, A., Roche, M. (2010). Forum: a flexible data integration system based on data semantics. SIGMOD Record, 39 (2), 11–18.
  10. Roche, M., Prince, V. (2007). AcroDef: A quality measure for discriminating expansions of ambiguous acronyms. In Proceedings of CONTEXT, LNCS, Springer-Verlag, 411–424. doi: 10.1007/978-3-540-74255-5_31
  11. Roche, M. (2004). Intégration de la construction de la terminologie de domaines spécialisés dans un processus global de fouille de textes. Paris, 11.
  12. Smadja, F., McKeown, K. R., Hatzivassiloglou, V. (1996). Translating collocations for bilingual lexicons: A statistical approach. Computational Linguistics, 22 (1), 1–38.
  13. Blandin, G. (2005). Dictionnaire de sigles et acronyms. Asankyeya. Available at: http://www.sigles.net
  14. Pike, R. (2004). Medline. USA. Available at: http://www.ncbi.nlm.nih.gov/PubMed

##submission.downloads##

Опубліковано

2015-02-25

Як цитувати

Чалая, Л. Э., & Харитонова, Ю. Ю. (2015). Оцінювання пертинентності лінгвістичних дескрипторів в системах інформаційного пошуку. Eastern-European Journal of Enterprise Technologies, 1(9(73), 46–53. https://doi.org/10.15587/1729-4061.2015.37450

Номер

Розділ

Інформаційно-керуючі системи