Метод видалення викидів із даних на основі зважених навчаючих вибірок w-об'єктів
DOI:
https://doi.org/10.15587/1729-4061.2014.24331Ключові слова:
навчаюча вибірка, фільтрація даних, викид, w-об’єкт, вирішуюче правило, утворююча множинаАнотація
Запропоновано новий метод видалення викидів з навчальних вибірок систем розпізнавання, заснований на побудові скорочених зважених вибірок w-об'єктів. Запропоновано алгоритми видалення викидів при порогах фільтрації, що визначаються автоматично та встановлюються користувачем. Наведено результати експериментальних досліджень, що підтверджують ефективність запропонованого методу.
Посилання
- Larose, D. T. Discovering knowledge in data: an introduction to data mining [Text] / D. T. Larose. – New Jersey: John Wiley & Sons Inc., 2005. – 240 p.
- Giudici, P. Applied data mining: statistical methods for business and industry [Text] / P. Giudici. – Chichester: John Wiley & Sons Inc., 2003. – 380 p.
- Last, M. Knowledge discovery in time series databases [Text] / M. Last, Y. Klein, A. Kandel. – IEEE Transactions on Systems, man and cybernetics, 2000. – P. 60–69.
- Pal, S. K. Pattern Recognition Algorithms for Data Mining: Scalability, Knowledge Discovery and Soft Granular Computing [Text] / S. K. Pal, P. Mitra. – Chapman and Hall/CRC, 2004. – 280 p.
- Дюличева, Ю. Ю. О задачах фильтрации обучающих данных [Текст] / Ю. Ю. Дюличева // Искусственный интеллект. – 2006. – № 2. – 65–71.
- John, G. H. Robust Decision Trees: Removing Outliers from Databases [Text] / G. H. John // Knowledge Discovery and Data Mining. – 1995. – P. 174–179.
- Zagoruiko, N. G. Methods of Recognition Based on the Function of Rival Similarity [Text] / N. G. Zagoruiko , I. A. Borisova, V. V. Dyubanov, O. A. Kutnenko // Pattern Recognition and Image Analysis. – 2008. – Vol. 18, №.1. – P. 1–6.
- Розробка теоретичних засад і методів реалізації відкритих систем автоматичного розпізнавання, що навчаються: способи оптимізації навчаючих вибірок і методи побудови зважених вирішуючих правил класифікації [Текст] / звіт з НДР (заключний) : Тема GP/F32/130, Грант Президента України для підтримки наукових досліджень молодих учених на 2011 рік; керівник О.В. Волченко. – 0111U007107 – Донецьк, ДВНЗ «ДонНТУ», 2011. – 67 с.
- Волченко, Е. В. Сеточный подход к построению взвешенных обучающих выборок w-объектов в адаптивных системах распознавания [Текст] / Е. В. Волченко // Вісник Національного технічного університету "Харківський політехнічний інститут". Збірник наукових праць. Тематичний випуск: Інформатика i моделювання. – 2011. – № 36. – С. 12–22.
- Волченко, Е. В. О способе определения близости объектов взвешенных обучающих выборок [Текст] / Е. В. Волченко // Вісник Національного технічного університету "Харківський політехнічний інститут". Збірник наукових праць. Тематичний випуск: Інформатика i моделювання. – 2012. – № 38. – С. 38–45.
- Larose, D. T. (2005). Discovering knowledge in data: an introduction to data mining. New Jersey: John Wiley & Sons Inc., 240.
- Giudici, P. (2003). Applied data mining: statistical methods for business and industry. Chichester: John Wiley & Sons Inc., 380.
- Last, M., Klein, Y., Kandel, A. (2000). Knowledge discovery in time series databases. IEEE Transactions on Systems, man and cybernetics, 60–69.
- Pal, S. K., Mitra, P. (2004). Pattern Recognition Algorithms for Data Mining: Scalability, Knowledge Discovery and Soft Granular Computing. Chapman and Hall/CRC, 280.
- Dyulicheva, Yu. Yu. (2006). About Filtering Problems of Training Sample. Artificial Intelligence, 2, 65–71.
- John, G. H. (1995). Robust Decision Trees: Removing Outliers from Databases. Knowledge Discovery and Data Mining, 174–179.
- Zagoruiko, N. G., Borisova, I. A., Dyubanov, V. V., Kutnenko, O. A. (2008). Methods of Recognition Based on the Function of Rival Similarity. Pattern Recognition and Image Analysis, 18 (1), 1–6.
- Volchenko, E. V. (2011). Development of theoretical principles and methods of realization the open trained system of automatic recognition: methods of optimization the training samples and methods of construction the weighted decision rules of classification. Technical Report 0111U007107, 67.
- Volchenko, E. V. (2011). Grid approach to the construction of weighted training samples of w-objects in adaptive recognition systems. Herald of the National Technical University "KhPI". Subject issue: Information Science and Modelling, 36, 12–22.
- Volchenko, E. V. (2012). Method for determining the proximity of objects of weighted training samples. Herald of the National Technical University "KhPI". Subject issue: Information Science and Modelling, 38, 38–45.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2014 Елена Владимировна Волченко
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Закріплення та умови передачі авторських прав (ідентифікація авторства) здійснюється у Ліцензійному договорі. Зокрема, автори залишають за собою право на авторство свого рукопису та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons CC BY. При цьому вони мають право укладати самостійно додаткові угоди, що стосуються неексклюзивного поширення роботи у тому вигляді, в якому вона була опублікована цим журналом, але за умови збереження посилання на першу публікацію статті в цьому журналі.
Ліцензійний договір – це документ, в якому автор гарантує, що володіє усіма авторськими правами на твір (рукопис, статтю, тощо).
Автори, підписуючи Ліцензійний договір з ПП «ТЕХНОЛОГІЧНИЙ ЦЕНТР», мають усі права на подальше використання свого твору за умови посилання на наше видання, в якому твір опублікований. Відповідно до умов Ліцензійного договору, Видавець ПП «ТЕХНОЛОГІЧНИЙ ЦЕНТР» не забирає ваші авторські права та отримує від авторів дозвіл на використання та розповсюдження публікації через світові наукові ресурси (власні електронні ресурси, наукометричні бази даних, репозитарії, бібліотеки тощо).
За відсутності підписаного Ліцензійного договору або за відсутністю вказаних в цьому договорі ідентифікаторів, що дають змогу ідентифікувати особу автора, редакція не має права працювати з рукописом.
Важливо пам’ятати, що існує і інший тип угоди між авторами та видавцями – коли авторські права передаються від авторів до видавця. В такому разі автори втрачають права власності на свій твір та не можуть його використовувати в будь-який спосіб.