Search methods of duplicate of the compose scientific stylistics texts
DOI:
https://doi.org/10.15587/2312-8372.2013.14893Keywords:
Hash function, shingle, plagiarism, configured document, duplicate blockAbstract
This paper focuses on such a subject as plagiarism. Unfortunately, the relevance of this topic is growing with each passing day, as the number of free Internet - resources increases, thereby decreasing the number of truly original works. This is especially true for students, many of them use the diplomas of other students to write their own. It is difficult for teachers to find out whether the work is original or not. There are methods known for automatic duplicate search algorithm using shingles, but they have their disadvantages. This paper describes a modification of the algorithm for configured documents. Thanks to this the advantage is planned to reach by reducing the number of comparisons of pairs shingles by dividing tests arranged into sections. One of the main advantages of the new algorithm is the ability to check for plagiarism individual sections of the documentReferences
- Авторское право [Электронный ресурс] - Режим доступа: http://ru.wikipedia.org/wiki/Авторское_право - 21.02.2013 г. - Загл. с экрана.
- Plagiarism.org [Электронный ресурс] - Режим доступа: http://plagiarism.org/resources/facts-and-stats - 24.06.2011г. - Перевод контекста.
- Шингл [Электронный ресурс] - Режим доступа: http://www.webeffector.ru/wiki/Шингл - 24.06.2011 г.- Загл. с экрана.
- Алгоритм Шинглов [Электронный ресурс] - Режим доступа: http://ru.wikipedia.org/wiki/Алгоритм_шинглов - 13.03.2013 г.- Загл. с экрана.
- Шевченко, О.Ю. Сравнительный анализ современных систем управления онтологическими базами знаний [Текст]/ О.Ю. Шевченко, О.Л. Шевченко // Вісник СевНТУ. Збірник наукових праць. Серія Інформатика, електроніка, зв'язок. - 2012. - №131.- С. 82-86.
- Дубликат [Электронный ресурс] - Режим доступа:http://ru.wikipedia.org/wiki/Дубликат - 16.03.2013 г.- Загл. с экрана.
- Часть 1. Алгоритм шинглов для веб-документов [Электронный ресурс] - Режим доступа: http://www.codeisart.ru/part-1-shingles-algorithm-for-web-documents/- 16.03.2013 г.- Загл. с экрана.
- Шингл [Электронный ресурс] - Режим доступа: http://wiki.rookee.ru/SHingl/ - 2013 г. - Загл. с экрана.
- SEOPULT [Электронный ресурс] - Режим доступа: http://seopult.ru/library/Лемматизация - 2013 г. - Загл. с экрана.
- Стемминг [Электронный ресурс] - Режим доступа:http://wiki.rookee.ru/Stemming / - 2013 г. - Загл. с экрана.
- Контрольная сумма [Электронный ресурс] - Режим доступа: http://ru.wikipedia.org/wiki/Контрольная_сумма - 12.03.2013 г. - Загл. с экрана.
- Зеленков, Ю.Г. Сравнительный анализ методов определения нечетких дубликатов для WEB-документов [Текст] / Ю.Г. Зеленков, И.В. Сегалович // Труды 9-ой Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» RCDL 2007: Сб. работ участников конкурса. – Переславль-Залесский, Россия- 2007.
- Как устроены MD5 и SHA1 [Электронный ресурс] - Режим доступа: http://habrahabr.ru/post/112780/ - 29.01.2011 г. - Загл. с экрана.
- Copyright (2013). Retrieved February 21, 2013, from http://ru.wikipedia.org/wiki/Авторское_право.
- Plagiarism (2011). Retrieved June 6, 2011 from http://plagiarism.org/resources/facts-and-stats.
- Shingle (2011). Retrieved June 26, 2011 from http://www.webeffector.ru/wiki/Шингл.
- Shingle (2013). Retrieved March 13, 2013 from http://ru.wikipedia.org/wiki/Алгоритм_шинглов.
- Shevchenko, O. Yu. & Shevchenko O.L. (2012) Sravnitelniy analiz sovremennih system upravleniia ontologicheskimi bazami znaniy, Visnyk SevNTU. Zbirnyk naukovyh prats. Seriia Informatyka, elektronika, zviazok, 131, 82-86.
- Duplicate (2011). Retrieved March 16, 2011 from http://ru.wikipedia.org/wiki/Дубликат.
- Part 1. The algorithm shingles for web documents (2013). Retrieved March 16, 2013 from http://www.codeisart.ru/part-1-shingles-algorithm-for-web-documents/.
- Shingle (2013) from http://wiki.rookee.ru/SHingl/.
- SEOPULT (2013) from http://seopult.ru/library/Лемматизация.
- Stemming (2013) from http://wiki.rookee.ru/Stemming /.
- The checksum (2013). Retrieved March 12, 2013 from http://ru.wikipedia.org/wiki/Контрольная_сумма.
- Zelenkov J.G (2007), Comparative analysis of methods for duplicate detection WEB-documents / Proceedings of the 9th Scientific Conference "Digital Libraries: Advanced Methods and Technologies, Digital Collections» RCDL 2007: Coll. Works participants / Pereslavl, Russia.
- How are MD5 and SHA1(2011). Retrieved January 29, 2011 from http://habrahabr.ru/post/112780.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2016 Юлия Андреевна Квашина
This work is licensed under a Creative Commons Attribution 4.0 International License.
The consolidation and conditions for the transfer of copyright (identification of authorship) is carried out in the License Agreement. In particular, the authors reserve the right to the authorship of their manuscript and transfer the first publication of this work to the journal under the terms of the Creative Commons CC BY license. At the same time, they have the right to conclude on their own additional agreements concerning the non-exclusive distribution of the work in the form in which it was published by this journal, but provided that the link to the first publication of the article in this journal is preserved.