Методи пошуку дублікатів скомпанованих текстів наукової стилістики
DOI:
https://doi.org/10.15587/2312-8372.2013.14893Ключові слова:
Хеш-функція, шингл, плагіат, скомпонований документ, дублікат, блокАнотація
Дана стаття присвячена такій темі як пошук плагіату. У статті представлена модифікація алгоритму шинглів для пошуку нечітких дублікатів для скомпонованих документів. Виграш у продуктивності планується досягти за рахунок зменшення кількості порівнянь пар шинглів за рахунок розбиття скомпонованих тестів на розділи
Посилання
- Авторское право [Электронный ресурс] - Режим доступа: http://ru.wikipedia.org/wiki/Авторское_право - 21.02.2013 г. - Загл. с экрана.
- Plagiarism.org [Электронный ресурс] - Режим доступа: http://plagiarism.org/resources/facts-and-stats - 24.06.2011г. - Перевод контекста.
- Шингл [Электронный ресурс] - Режим доступа: http://www.webeffector.ru/wiki/Шингл - 24.06.2011 г.- Загл. с экрана.
- Алгоритм Шинглов [Электронный ресурс] - Режим доступа: http://ru.wikipedia.org/wiki/Алгоритм_шинглов - 13.03.2013 г.- Загл. с экрана.
- Шевченко, О.Ю. Сравнительный анализ современных систем управления онтологическими базами знаний [Текст]/ О.Ю. Шевченко, О.Л. Шевченко // Вісник СевНТУ. Збірник наукових праць. Серія Інформатика, електроніка, зв'язок. - 2012. - №131.- С. 82-86.
- Дубликат [Электронный ресурс] - Режим доступа:http://ru.wikipedia.org/wiki/Дубликат - 16.03.2013 г.- Загл. с экрана.
- Часть 1. Алгоритм шинглов для веб-документов [Электронный ресурс] - Режим доступа: http://www.codeisart.ru/part-1-shingles-algorithm-for-web-documents/- 16.03.2013 г.- Загл. с экрана.
- Шингл [Электронный ресурс] - Режим доступа: http://wiki.rookee.ru/SHingl/ - 2013 г. - Загл. с экрана.
- SEOPULT [Электронный ресурс] - Режим доступа: http://seopult.ru/library/Лемматизация - 2013 г. - Загл. с экрана.
- Стемминг [Электронный ресурс] - Режим доступа:http://wiki.rookee.ru/Stemming / - 2013 г. - Загл. с экрана.
- Контрольная сумма [Электронный ресурс] - Режим доступа: http://ru.wikipedia.org/wiki/Контрольная_сумма - 12.03.2013 г. - Загл. с экрана.
- Зеленков, Ю.Г. Сравнительный анализ методов определения нечетких дубликатов для WEB-документов [Текст] / Ю.Г. Зеленков, И.В. Сегалович // Труды 9-ой Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» RCDL 2007: Сб. работ участников конкурса. – Переславль-Залесский, Россия- 2007.
- Как устроены MD5 и SHA1 [Электронный ресурс] - Режим доступа: http://habrahabr.ru/post/112780/ - 29.01.2011 г. - Загл. с экрана.
- Copyright (2013). Retrieved February 21, 2013, from http://ru.wikipedia.org/wiki/Авторское_право.
- Plagiarism (2011). Retrieved June 6, 2011 from http://plagiarism.org/resources/facts-and-stats.
- Shingle (2011). Retrieved June 26, 2011 from http://www.webeffector.ru/wiki/Шингл.
- Shingle (2013). Retrieved March 13, 2013 from http://ru.wikipedia.org/wiki/Алгоритм_шинглов.
- Shevchenko, O. Yu. & Shevchenko O.L. (2012) Sravnitelniy analiz sovremennih system upravleniia ontologicheskimi bazami znaniy, Visnyk SevNTU. Zbirnyk naukovyh prats. Seriia Informatyka, elektronika, zviazok, 131, 82-86.
- Duplicate (2011). Retrieved March 16, 2011 from http://ru.wikipedia.org/wiki/Дубликат.
- Part 1. The algorithm shingles for web documents (2013). Retrieved March 16, 2013 from http://www.codeisart.ru/part-1-shingles-algorithm-for-web-documents/.
- Shingle (2013) from http://wiki.rookee.ru/SHingl/.
- SEOPULT (2013) from http://seopult.ru/library/Лемматизация.
- Stemming (2013) from http://wiki.rookee.ru/Stemming /.
- The checksum (2013). Retrieved March 12, 2013 from http://ru.wikipedia.org/wiki/Контрольная_сумма.
- Zelenkov J.G (2007), Comparative analysis of methods for duplicate detection WEB-documents / Proceedings of the 9th Scientific Conference "Digital Libraries: Advanced Methods and Technologies, Digital Collections» RCDL 2007: Coll. Works participants / Pereslavl, Russia.
- How are MD5 and SHA1(2011). Retrieved January 29, 2011 from http://habrahabr.ru/post/112780.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2016 Технологічний аудит та резерви виробництва
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Закріплення та умови передачі авторських прав (ідентифікація авторства) здійснюється у Ліцензійному договорі. Зокрема, автори залишають за собою право на авторство свого рукопису та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons CC BY. При цьому вони мають право укладати самостійно додаткові угоди, що стосуються неексклюзивного поширення роботи у тому вигляді, в якому вона була опублікована цим журналом, але за умови збереження посилання на першу публікацію статті в цьому журналі.