Метод визначення ключових слів англомовного тексту на основі DKPro Core
DOI:
https://doi.org/10.15587/2312-8372.2015.37274Ключові слова:
метод, ключові слова, англійська мова, лінгвістичний пакет, DKPro Core, синтаксичний аналізАнотація
Розглянуто підходи до пошуку ключових слів тексту, що грають важливу роль в задачах комп’ютерної лінгвістики. Запропоновано новий метод визначення ключових слів, який базується на знаходженні зв’язків між словоформами англомовного тексту за допомогою інструментальних можливостей пакету DKPro Core. Проілюстрований аналізом прикладів застосування, метод спрямовано на розв’язання задач ефективної обробки текстових документів.Посилання
- Ershov, Yu. S. (2014). Vydelenie kliuchevyh slov v russkoiazychnyh tekstah. Molodezhnyi nauchno-tehnicheskii vestnik. M.: FGBOU VPO "MGTU im. N. E. Baumana". Available: http://sntbul.bmstu.ru/file/out/730754. Last accessed 21.01.2015.
- Andreev, A. M., Berezkin, D. V., Siuzev, V. V., Shabanov, V. I. (2003). Modeli i metody avtomaticheskoi klassifikatsii tekstovyh dokumentov. Vestnik MGTU im. N. E. Baumana. Ser. Priborostroenie, № 4. Available: http://vestnikprib.bmstu.ru/articles/397/html/files/assets/basic-html/page1.html. Last accessed 21.01.2015.
- Joachims, T. (1998). Text categorization with Support Vector Machines: Learning with many relevant features. Machine Learning: ECML-98 Lecture Notes in Computer Science, Vol. 1398, 137–142. doi:10.1007/bfb0026683
- Jensen, R. (2000). A Rough Set-Aided System for Sorting WWW Bookmarks. The University of Edinburgh. Available: http://users.aber.ac.uk/rkj/research/mscthesis.pdf. Last accessed 21.01.2015.
- Larkey, L. S., Croft, W. B. (1996). Combining classifiers in text categorization. Proceedings of the 19th annual international ACM SIGIR conference on Research and development in information retrieval - SIGIR ’96. ACM Press, 289-297. doi:10.1145/243199.243276
- Scott, S., Matwin, S. (1998). Text Classification Using WordNet Hypernyms. University of Ottawa. Available: http://www.aclweb.org/anthology/W98-0706. Last accessed 21.01.2015.
- Darkulova, K. N., Ergeshova, G. (2014). Neobhodimost' vydeleniia kliuchevyh slov dlia sviortyvaniia teksta. VI Mezhdunarodnaia studencheskaia elektronnaia nauchnaia konferentsiia «Studencheskii nauchnyi forum» 15 fevralia – 31 marta 2014 goda. Lingvisticheskii analiz nauchnogo teksta. Yuzhno-Kazahstanskii gosudarstvennyi universitet im. Muhtara Auezova Shymkent. Available: http://www.scienceforum.ru/2014/476/70. Last accessed 21.01.2015.
- Bisikalo, O. V. (2013). Kontseptualna model systemy obraznoho analizu i syntezu pryrodno-movnykh konstruktsii. Matematychni mashyny i systemy, № 2, 184–187. ISSN 1028-9763.
- Bisikalo, O. V. (2013). Formalni metody obraznoho analizu ta syntezu pryrodno-movnykh konstruktsii. Vinnytsia: VNTU, 316. ISBN 978-966-641-528-1.
- Natural Language Processing: Integration of Automatic and Manual Analysis. (2014). Technischen Universität Darmstadt. Available: http://tuprints.ulb.tu-darmstadt.de/4151/1/rec-thesis-final.pdf. Last accessed 21.01.2015.
- Gurevych, I., Muhlhauser, M., Muller, Ch., Steimle, J., Weimer, M., Zesch, T. (2007, February 9). Darmstadt Knowledge Processing Repository Based on UIMA. Available: https://www.ukp.tu-darmstadt.de/fileadmin/user_upload/Group_UKP/publikationen/2007/gldv-uima-ukp.pdf. . Last accessed 21.01.2015.
- Burgareli, L. A. (2009, Jul.-Dec.). Variability management in software product lines using adaptive object and reflection. Journal of Aerospace Technology and Management, V. 1, № 2. Available: http://www.jatm.com.br/papers/vol1_n2/JATMv1n2_thesis_abstracts.pdf. Last accessed 21.01.2015.
- Address by President of the Russian Federation. Available: http://eng.kremlin.ru/transcripts/6402. Last accessed 21.01.2015.
- Address by President of the Russian Federation. Available: http://eng.kremlin.ru/news/6889. Last accessed 21.01.2015.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2016 Технологічний аудит та резерви виробництва
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Закріплення та умови передачі авторських прав (ідентифікація авторства) здійснюється у Ліцензійному договорі. Зокрема, автори залишають за собою право на авторство свого рукопису та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons CC BY. При цьому вони мають право укладати самостійно додаткові угоди, що стосуються неексклюзивного поширення роботи у тому вигляді, в якому вона була опублікована цим журналом, але за умови збереження посилання на першу публікацію статті в цьому журналі.