Search methods of duplicate of the compose scientific stylistics texts

Authors

  • Юлия Андреевна Квашина Kharkiv National University of Radio Electronics, Ukraine

DOI:

https://doi.org/10.15587/2312-8372.2013.14893

Keywords:

Hash function, shingle, plagiarism, configured document, duplicate block

Abstract

This paper focuses on such a subject as plagiarism. Unfortunately, the relevance of this topic is growing with each passing day, as the number of free Internet - resources increases, thereby decreasing the number of truly original works. This is especially true for students, many of them use the diplomas of other students to write their own. It is difficult for teachers to find out whether the work is original or not. There are methods known for automatic duplicate search algorithm using shingles, but they have their disadvantages. This paper describes a modification of the algorithm for configured documents. Thanks to this the advantage is planned to reach by reducing the number of comparisons of pairs shingles by dividing tests arranged into sections. One of the main advantages of the new algorithm is the ability to check for plagiarism individual sections of the document

Author Biography

Юлия Андреевна Квашина, Kharkiv National University of Radio Electronics

Department of Software Engineering

References

  1. Авторское право [Электронный ресурс] - Режим доступа: http://ru.wikipedia.org/wiki/Авторское_право - 21.02.2013 г. - Загл. с экрана.
  2. Plagiarism.org [Электронный ресурс] - Режим доступа: http://plagiarism.org/resources/facts-and-stats - 24.06.2011г. - Перевод контекста.
  3. Шингл [Электронный ресурс] - Режим доступа: http://www.webeffector.ru/wiki/Шингл - 24.06.2011 г.- Загл. с экрана.
  4. Алгоритм Шинглов [Электронный ресурс] - Режим доступа: http://ru.wikipedia.org/wiki/Алгоритм_шинглов - 13.03.2013 г.- Загл. с экрана.
  5. Шевченко, О.Ю. Сравнительный анализ современных систем управления онтологическими базами знаний [Текст]/ О.Ю. Шевченко, О.Л. Шевченко // Вісник СевНТУ. Збірник наукових праць. Серія Інформатика, електроніка, зв'язок. - 2012. - №131.- С. 82-86.
  6. Дубликат [Электронный ресурс] - Режим доступа:http://ru.wikipedia.org/wiki/Дубликат - 16.03.2013 г.- Загл. с экрана.
  7. Часть 1. Алгоритм шинглов для веб-документов [Электронный ресурс] - Режим доступа: http://www.codeisart.ru/part-1-shingles-algorithm-for-web-documents/- 16.03.2013 г.- Загл. с экрана.
  8. Шингл [Электронный ресурс] - Режим доступа: http://wiki.rookee.ru/SHingl/ - 2013 г. - Загл. с экрана.
  9. SEOPULT [Электронный ресурс] - Режим доступа: http://seopult.ru/library/Лемматизация - 2013 г. - Загл. с экрана.
  10. Стемминг [Электронный ресурс] - Режим доступа:http://wiki.rookee.ru/Stemming / - 2013 г. - Загл. с экрана.
  11. Контрольная сумма [Электронный ресурс] - Режим доступа: http://ru.wikipedia.org/wiki/Контрольная_сумма - 12.03.2013 г. - Загл. с экрана.
  12. Зеленков, Ю.Г. Сравнительный анализ методов определения нечетких дубликатов для WEB-документов [Текст] / Ю.Г. Зеленков, И.В. Сегалович // Труды 9-ой Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» RCDL 2007: Сб. работ участников конкурса. – Переславль-Залесский, Россия- 2007.
  13. Как устроены MD5 и SHA1 [Электронный ресурс] - Режим доступа: http://habrahabr.ru/post/112780/ - 29.01.2011 г. - Загл. с экрана.
  14. Copyright (2013). Retrieved February 21, 2013, from http://ru.wikipedia.org/wiki/Авторское_право.
  15. Plagiarism (2011). Retrieved June 6, 2011 from http://plagiarism.org/resources/facts-and-stats.
  16. Shingle (2011). Retrieved June 26, 2011 from http://www.webeffector.ru/wiki/Шингл.
  17. Shingle (2013). Retrieved March 13, 2013 from http://ru.wikipedia.org/wiki/Алгоритм_шинглов.
  18. Shevchenko, O. Yu. & Shevchenko O.L. (2012) Sravnitelniy analiz sovremennih system upravleniia ontologicheskimi bazami znaniy, Visnyk SevNTU. Zbirnyk naukovyh prats. Seriia Informatyka, elektronika, zviazok, 131, 82-86.
  19. Duplicate (2011). Retrieved March 16, 2011 from http://ru.wikipedia.org/wiki/Дубликат.
  20. Part 1. The algorithm shingles for web documents (2013). Retrieved March 16, 2013 from http://www.codeisart.ru/part-1-shingles-algorithm-for-web-documents/.
  21. Shingle (2013) from http://wiki.rookee.ru/SHingl/.
  22. SEOPULT (2013) from http://seopult.ru/library/Лемматизация.
  23. Stemming (2013) from http://wiki.rookee.ru/Stemming /.
  24. The checksum (2013). Retrieved March 12, 2013 from http://ru.wikipedia.org/wiki/Контрольная_сумма.
  25. Zelenkov J.G (2007), Comparative analysis of methods for duplicate detection WEB-documents / Proceedings of the 9th Scientific Conference "Digital Libraries: Advanced Methods and Technologies, Digital Collections» RCDL 2007: Coll. Works participants / Pereslavl, Russia.
  26. How are MD5 and SHA1(2011). Retrieved January 29, 2011 from http://habrahabr.ru/post/112780.

Published

2013-06-20

How to Cite

Квашина, Ю. А. (2013). Search methods of duplicate of the compose scientific stylistics texts. Technology Audit and Production Reserves, 3(1(11), 16–20. https://doi.org/10.15587/2312-8372.2013.14893