Методи пошуку дублікатів скомпанованих текстів наукової стилістики

Автор(и)

  • Юлия Андреевна Квашина Харківський національний університет радіоелектроніки, Україна

DOI:

https://doi.org/10.15587/2312-8372.2013.14893

Ключові слова:

Хеш-функція, шингл, плагіат, скомпонований документ, дублікат, блок

Анотація

Дана стаття присвячена такій темі як пошук плагіату. У статті представлена модифікація алгоритму шинглів для пошуку нечітких дублікатів для скомпонованих документів. Виграш у продуктивності планується досягти за рахунок зменшення кількості порівнянь пар шинглів за рахунок розбиття скомпонованих тестів на розділи

Біографія автора

Юлия Андреевна Квашина, Харківський національний університет радіоелектроніки

Кафедра Програмної Інженерії

Посилання

  1. Авторское право [Электронный ресурс] - Режим доступа: http://ru.wikipedia.org/wiki/Авторское_право - 21.02.2013 г. - Загл. с экрана.
  2. Plagiarism.org [Электронный ресурс] - Режим доступа: http://plagiarism.org/resources/facts-and-stats - 24.06.2011г. - Перевод контекста.
  3. Шингл [Электронный ресурс] - Режим доступа: http://www.webeffector.ru/wiki/Шингл - 24.06.2011 г.- Загл. с экрана.
  4. Алгоритм Шинглов [Электронный ресурс] - Режим доступа: http://ru.wikipedia.org/wiki/Алгоритм_шинглов - 13.03.2013 г.- Загл. с экрана.
  5. Шевченко, О.Ю. Сравнительный анализ современных систем управления онтологическими базами знаний [Текст]/ О.Ю. Шевченко, О.Л. Шевченко // Вісник СевНТУ. Збірник наукових праць. Серія Інформатика, електроніка, зв'язок. - 2012. - №131.- С. 82-86.
  6. Дубликат [Электронный ресурс] - Режим доступа:http://ru.wikipedia.org/wiki/Дубликат - 16.03.2013 г.- Загл. с экрана.
  7. Часть 1. Алгоритм шинглов для веб-документов [Электронный ресурс] - Режим доступа: http://www.codeisart.ru/part-1-shingles-algorithm-for-web-documents/- 16.03.2013 г.- Загл. с экрана.
  8. Шингл [Электронный ресурс] - Режим доступа: http://wiki.rookee.ru/SHingl/ - 2013 г. - Загл. с экрана.
  9. SEOPULT [Электронный ресурс] - Режим доступа: http://seopult.ru/library/Лемматизация - 2013 г. - Загл. с экрана.
  10. Стемминг [Электронный ресурс] - Режим доступа:http://wiki.rookee.ru/Stemming / - 2013 г. - Загл. с экрана.
  11. Контрольная сумма [Электронный ресурс] - Режим доступа: http://ru.wikipedia.org/wiki/Контрольная_сумма - 12.03.2013 г. - Загл. с экрана.
  12. Зеленков, Ю.Г. Сравнительный анализ методов определения нечетких дубликатов для WEB-документов [Текст] / Ю.Г. Зеленков, И.В. Сегалович // Труды 9-ой Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» RCDL 2007: Сб. работ участников конкурса. – Переславль-Залесский, Россия- 2007.
  13. Как устроены MD5 и SHA1 [Электронный ресурс] - Режим доступа: http://habrahabr.ru/post/112780/ - 29.01.2011 г. - Загл. с экрана.
  14. Copyright (2013). Retrieved February 21, 2013, from http://ru.wikipedia.org/wiki/Авторское_право.
  15. Plagiarism (2011). Retrieved June 6, 2011 from http://plagiarism.org/resources/facts-and-stats.
  16. Shingle (2011). Retrieved June 26, 2011 from http://www.webeffector.ru/wiki/Шингл.
  17. Shingle (2013). Retrieved March 13, 2013 from http://ru.wikipedia.org/wiki/Алгоритм_шинглов.
  18. Shevchenko, O. Yu. & Shevchenko O.L. (2012) Sravnitelniy analiz sovremennih system upravleniia ontologicheskimi bazami znaniy, Visnyk SevNTU. Zbirnyk naukovyh prats. Seriia Informatyka, elektronika, zviazok, 131, 82-86.
  19. Duplicate (2011). Retrieved March 16, 2011 from http://ru.wikipedia.org/wiki/Дубликат.
  20. Part 1. The algorithm shingles for web documents (2013). Retrieved March 16, 2013 from http://www.codeisart.ru/part-1-shingles-algorithm-for-web-documents/.
  21. Shingle (2013) from http://wiki.rookee.ru/SHingl/.
  22. SEOPULT (2013) from http://seopult.ru/library/Лемматизация.
  23. Stemming (2013) from http://wiki.rookee.ru/Stemming /.
  24. The checksum (2013). Retrieved March 12, 2013 from http://ru.wikipedia.org/wiki/Контрольная_сумма.
  25. Zelenkov J.G (2007), Comparative analysis of methods for duplicate detection WEB-documents / Proceedings of the 9th Scientific Conference "Digital Libraries: Advanced Methods and Technologies, Digital Collections» RCDL 2007: Coll. Works participants / Pereslavl, Russia.
  26. How are MD5 and SHA1(2011). Retrieved January 29, 2011 from http://habrahabr.ru/post/112780.

##submission.downloads##

Опубліковано

2013-06-20

Як цитувати

Квашина, Ю. А. (2013). Методи пошуку дублікатів скомпанованих текстів наукової стилістики. Technology Audit and Production Reserves, 3(1(11), 16–20. https://doi.org/10.15587/2312-8372.2013.14893