Розробка системи машинного перекладу на основі аналітико-синтетичного опрацювання тексту
DOI:
https://doi.org/10.15587/1729-4061.2017.92021Ключові слова:
система машиного перекладу, автоматичний аналіз тексту, аналітико-синтетична обробка текстуАнотація
Розроблено методи автоматичного аналізу тексту на основі декларативного представлення правил синтаксичної сполучуваності та програмного розподілення аналітико-синтетичної обробки природно-мовного тексту в системах машинного перекладу. Програмна реалізація експерементально доводить, що застосування розроблених методів зменшує кількість помилок семантичного характеру в середньому на 14–16 % у порівнянні з відомими системами машинного перекладу
Посилання
- Toldova, S., Lyashevskaya, O., Bonch-Osmolovskaya, A., Ionov, M. (2015). Evaluation for morphologically rich language: Russian NLP. International Conference on Artificial Intelligence (ICAI). USA: ACM, 300–306.
- Freitag, M., Huck, M., Ney, H. (2014). Jane: Open Source Machine Translation System Combination. Proceedings of the Demonstrations at the 14th Conference of the European Chapter of the Association for Computational Linguistics. doi: 10.3115/v1/e14-2008
- Clark, E. M., Williams, J. R., Jones, C. A., Galbraith, R. A., Danforth, C. M., Dodds, P. S. (2016). Sifting robotic from organic text: A natural language approach for detecting automation on Twitter. Journal of Computational Science, 16, 1–7. doi: 10.1016/j.jocs.2015.11.002
- Evans, J. A., Aceves, P. (2016). Machine Translation: Mining Text for Social Theory. Annual Review of Sociology, 42 (1), 21–50. doi: 10.1146/annurev-soc-081715-074206
- Dunham, J., Cook, G., Horner, J. (2014). LingSync and the Online Linguistic Database: New Models for the Collection and Management of Data for Language Communities, Linguists and Language Learners. Proceedings of the 2014 Workshop on the Use of Computational Methods in the Study of Endangered Languages. doi: 10.3115/v1/w14-2204
- Wahl, H., Galler, R., Winiwarter, W. (2015). A Generic Software Framework for Intelligent Integrated Computer-Assisted Language Learning (iiCALL) Environment. Lecture Notes in Computer Science, 264–270. doi: 10.1007/978-3-319-25515-6_26
- Ghosh, S., Ghosh, S., Das, D. (2016). Part-of-speech Tagging of Code-Mixed Social Media Text. Proceedings of the Second Workshop on Computational Approaches to Code Switching. doi: 10.18653/v1/w16-5811
- Mel’cuk, I. A. (1988). Dependency Syntax: Theory and Practic. NY: SUNY, 428.
- Apresian, J., Boguslavsky, I., Iomdin, L. et. al. (2003). ETAP-3 Linguistic Processor: a Full-Fledged NLP Implementation of the MTT. Conference on Meaning-Text Theory. Paris: Ecole Normale Superieure, 279–288.
- Zamarujeva, I. V. (1999). Komp’juterna model' rozuminnja pryrodno-movnoi' tekstovoi' informacii'. Problemy programmirovanija, 2, 96–102.
- Zamarujeva, I. V., Ros', A. O., Gubajdulin, O. Ju. et. al. (2000). Znannja-orijentovanyj pidhid do avtomatyzacii' informacijno-analitychnoi' dijal'nosti. Problemy programuvannja, 1-2, 601–614.
- Moroz, A. V. (2012). Automatic creating test as one of the processing tasks of natural language texts. Eastern-European Journal of Enterprise Technologies, 2 (2 (56)), 14–17. Available at: http://journals.uran.ua/eejet/article/view/3658/3430
- Turian, J., Ratinov, L., Bengio, Y. (2010). Word representations: A simple and general method for semi-supervised learning. The 6 Association for Computational Linguistics. Sweden: ACM, 384–394.
- Klementiev, A., Titov, I., Bhattarai, B. (2012). Inducing Crosslingual Distributed Representations of Words. Conference on Computational Linguistics (COLING): 24th international conference. Bombai: ACL, 1–15.
- Zou, W. Y., Socher, R., Cer, D., Manning, C. D. (2013). Bilingual Word Embeddings for Phrase-Based Machine Translation. Conference on Empirical Methods in Natural Language Processing: 12th international conference. USA: ACL, 1–6.
- Lytvynenko, L., Lytvynenko, L. (2013). Module of syntactical module for analysis of natural language texts. The Advanced Science, 1, 57–60.
- Feldman, R., Sanger, J. (2006). The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data. Cambridge: Cambridge University Press, 423. doi: 10.1017/cbo9780511546914
- Danchenkova, S. I., Polyakov, V. N. (2010). Automatic text classification in the system of concepts lexical ontology. Uchenye Zapiski Kazanskogo Universiteta. Seriya Fiziko-Matematicheskie Nauki, 152, 255–267.
- Wahl, H., Winiwarter, W., Quirchmayr, G. (2010). Natural language processing technologies for developing a language learning environment. Proceedings of the 12th International Conference on Information Integration and Web-Based Applications & Services – iiWAS’10. doi: 10.1145/1967486.1967546
- Cohn, T., Lapata, M. (2007). Machine translation by triangulation: Making effective use of multi-parallel corpora. Meeting of the Association for Computational Linguistics: 45th annual conference. USA: ACL, 728–735.
- Bazrafshan, M., Gildea, D. (2013). Semantic Roles for String to Tree Machine Translation. Meeting of the Association for Computational Linguistics. USA: ACL, 419–423.
- Furstenau, H., Lapata, M. (2012). Semi-Supervised Semantic Role Labeling via Structural Alignment. Computational Linguistics, 38 (1), 135–171. doi: 10.1162/coli_a_00087
- Xiong, D., Zhang, M., Li, H. (2012). Modeling the Translation of Predicate-Argument Structure for SMT. Meeting of the Association for Computational Linguistics: 50th annual conference. USA: ACL, 902–911.
- Nikolaievskyi, O. (2013). Components of Lingware for Automatic Morphological Analysis in Kwnoeledge-Oriented Machine Translation System. The Advanced Science, 5, 32–36.
- Nikolaievskyi, O., Nikolaievskyi, O. (2013). Procedure of Forming Dictionary of Quasi-Inflections Basing on Wordform Dictionary. The Advanced Science, 8, 61–65.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2017 Leonid Lytvynenko, Oleksandr Nikolaievskyi, Valeriy Lakhno, Elena Skliarenko
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Закріплення та умови передачі авторських прав (ідентифікація авторства) здійснюється у Ліцензійному договорі. Зокрема, автори залишають за собою право на авторство свого рукопису та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons CC BY. При цьому вони мають право укладати самостійно додаткові угоди, що стосуються неексклюзивного поширення роботи у тому вигляді, в якому вона була опублікована цим журналом, але за умови збереження посилання на першу публікацію статті в цьому журналі.
Ліцензійний договір – це документ, в якому автор гарантує, що володіє усіма авторськими правами на твір (рукопис, статтю, тощо).
Автори, підписуючи Ліцензійний договір з ПП «ТЕХНОЛОГІЧНИЙ ЦЕНТР», мають усі права на подальше використання свого твору за умови посилання на наше видання, в якому твір опублікований. Відповідно до умов Ліцензійного договору, Видавець ПП «ТЕХНОЛОГІЧНИЙ ЦЕНТР» не забирає ваші авторські права та отримує від авторів дозвіл на використання та розповсюдження публікації через світові наукові ресурси (власні електронні ресурси, наукометричні бази даних, репозитарії, бібліотеки тощо).
За відсутності підписаного Ліцензійного договору або за відсутністю вказаних в цьому договорі ідентифікаторів, що дають змогу ідентифікувати особу автора, редакція не має права працювати з рукописом.
Важливо пам’ятати, що існує і інший тип угоди між авторами та видавцями – коли авторські права передаються від авторів до видавця. В такому разі автори втрачають права власності на свій твір та не можуть його використовувати в будь-який спосіб.