Розпізнавання фішингових сайтів з використанням методів машинного навчання
dc.contributor.advisor | Стьопочкіна, Ірина Валеріївна | |
dc.contributor.author | Тернопольська, Світлана Олександрівна | |
dc.date.accessioned | 2020-02-07T09:24:35Z | |
dc.date.available | 2020-02-07T09:24:35Z | |
dc.date.issued | 2019-06 | |
dc.description.abstracten | This work contains 67 pages, 22 illustrations, 21 tables, 24 sources in the list of links. Phishing is a serious security problem on the Internet, which is considered as fake legitimate websites to deceive users on the Internet and steal their private information. Detection phishing websites can be considered as a typical classification problem in data mining, when the classifier is built on a specific set of website features. There are strict requirements for determining the best set of features, which, if chosen correctly, increase the accuracy of prediction of classifiers. This paper explores feature selection in order to determine the most effective subset from the point of view of classification accuracy, as well as research on the accuracy of phishing recognition with a new classifier scheme built on several standard ones. Three known feature selection methods are compared to determine the smallest and the most accurate phishing detection feature set using data mining. Here is also discussed 6 data classification algorithms: Naive Bayes, Decision Tree, Neural Network, Logistic Regression, k-nearest neighbors, Support Vector Machine. Experimental tests with feature selection were performed using the Wrapper subset evaluation, Consistency subset evaluation and Correlation-based feature subset evaluation methods. The six machine learning algorithms listed above were trained with a different set of features to show the advantages and disadvantages of the feature selection process. It was possible to find several groups of features with equally good classification accuracy and select 3 algorithms, from the six proposed, to build a new classification scheme. | uk |
dc.description.abstractuk | Дана робота містить 67 сторінок, 22 ілюстрації, 21 таблицю, 24 джерела за переліком посилань. Фішинг - це серйозна проблема безпеки в мережі, яка полягає в підробці справжніх веб-сайтів, щоб обдурити користувачів в Інтернеті і вкрасти їх конфіденційну інформацію. Задачу розпізнавання фішингових сайтів можна розглядати як типову проблему класифікації в інтелектуальному аналізі даних, коли класифікатор будується на певному наборі характеристик сайту. Існують суворі вимоги до визначення найкращого набору характеристик, які при правильному виборі підвищують точність прогнозування класифікаторів. У даній роботі досліджується вибір характеристик з метою визначення ефективного піднабору з точки зору точності класифікації, а так само дослідження точності розпізнавання фішингу новою схемою класифікатора побудованого на кількох стандартних. Порівнюються 3 відомі функції відбору ознак, щоб визначити найменший і точний набір функцій виявлення фішингу з використанням інтелектуального аналізу даних. Також розглядаються 6 алгоритмів класифікації даних: Naive Bayes, Decision Tree, Neural Network, Logistic Regression, k-nearest neighbours, Support Vector Machine. Експериментальні тести c відбором ознак були виконані з використанням методів Wrapper subset evaluation, Consistency subset evaluation і Correlation-based feature subset evaluation. Шість вищеперерахованих алгоритмів машинного навчання були треновані з різним набором характеристик, щоб показати переваги та недоліки процесу відбору функцій. Вдалося виявити кілька груп ознак з однаково хорошою точністю класифікації й відібрати 3 алгоритми із запропонованих шести для побудови нової схеми класифікації. | uk |
dc.format.page | 67 с. | uk |
dc.identifier.citation | Тернопольська, С. О. Розпізнавання фішингових сайтів з використанням методів машинного навчання : дипломна робота … бакалавра : 6.170101 Безпека інформаційних і комунікаційних систем / Тернопольська Світлана Олександрівна. – Київ, 2019. – 67 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/31430 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | соціальна інженерія | uk |
dc.subject | фішинг | uk |
dc.subject | фішинговий сайт | uk |
dc.subject | розпізнавання фішингових сайтів | uk |
dc.subject | відбір характеристик | uk |
dc.subject | класифікація | uk |
dc.subject | машинне навчання | uk |
dc.subject | social engineering | uk |
dc.subject | phishing | uk |
dc.subject | phishing site | uk |
dc.subject | phishing website detection | uk |
dc.subject | feature selection | uk |
dc.subject | classification | uk |
dc.subject | machine learning | uk |
dc.title | Розпізнавання фішингових сайтів з використанням методів машинного навчання | uk |
dc.type | Bachelor Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Ternopolska_bakalavr.pdf
- Розмір:
- 971.12 KB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.06 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: