Вдосконалення методу кластеризації публікацій на основі n-грам аналізу та нечіткий метод вибору наукових партнерів
https://doi.org/10.15587/1729-4061.2019.175139Ключові слова:
кластеризація, n-грам аналіз, напрям наукових досліджень, граф цитування, проектна групаАнотація
Для задачі формування проектних груп, зокрема науково-дослідницьких проектних груп, пропонується комплексний метод, який складається з двохетапного методу кластеризації графу цитування публікацій науковців та методу нечіткого логічного виводу для узгодження думок експертів щодо вибору потенційних партнерів і включення їх до проектної групи.
Суть двохетапного методу кластеризації публікацій науковців полягає у кластеризації графу цитування та об'єднання кластерів на основі близькості анотацій публікацій. Відстань між публікаціями розраховується на основі визначеної метрики та підходів n-грам аналізу. Описаний метод дозволяє ідентифікувати напрями досліджень науковців, що є необхідною складовою раціонального вибору партнера для побудови проектної групи і є вхідною інформацією для експертів, які цю групу формують. Наступним етапом є застосування методу нечіткого логічного виводу, який будується для узгодження думок експертів щодо створення проектних груп. Даний метод складається із трьох етапів. На першому етапі фазифікація здійснюється через введення функції належності науковця до напрямку наукових досліджень. Другий етап нечіткого логічного виводу полягає формуванні експертами вимог до кандидатів на місце в проектній групі. На заключному етапі відбувається дефазифікація за допомогою методу центра ваги. Для верифікації нечіткого методу ідентифікації дослідницьких проектних груп було визначено організації-виконавці для фундаментального наукового дослідження.
Описані методи можуть бути використані для задачі формування науково-дослідницьких груп та виявлення подібностей між фрагментами текстової інформації на основі n-грам аналізу, що має застосування у задачі ідентифікації неповних дублікатів між фрагментами текстової інформації
