Застосування алгоритмів машинного навчання на відкритих даних
No Thumbnail Available
Date
2020
Authors
Advisor
Journal Title
Journal ISSN
Volume Title
Publisher
КПІ ім. Ігоря Сікорського
Abstract
Структура та обсяг роботи. Пояснювальна записка дипломного проекту складається з шести розділів, включає 31 рисунок, 35 таблиць та 1 додатку.
Дипломний проект застосовує тему "Алгоритми машинного навчання на відкритих даних", яка спрямована на виявлення переваг відкритих даних.
Розділ загальних положень пояснив діяльність моделі, випадки використання, розглянув та проаналізував загальний підхід до роботи з даними Prozzoro та точно поставив завдання із визначеними цілями та завданнями.
У розділі інформаційної підтримки визначаються вхідні та вихідні дані та відображається схема бази даних.
Найкращий результат продемонстрував показ двох моделей системи в розділі про математичне програмне забезпечення.
Розділ програмного забезпечення описує основні інструменти для розробки набору завдань, вибору та обґрунтування вимог до обладнання, архітектури програмного забезпечення.
У технологічному розділі описуються інструкції користувача до тесту та відображаються разом із результатами.
У стартап-проєкт розділі описуються імплементація стартапу на основі даної робти.
Мета дослідження. Метою дослідження є розробка способу пошуку аномалій в фінансових транзакціях за допомогою сучасних інструментів обробки даних у реальному часі
Об’єкт дослідження — алгоритми розпізнавання шахрайства в системах електронних закупівель.
Предмет дослідження — розробка системи для боротьби з шахрайством для систем електронних закупівель з використанням алгоритмів машинного навчання.
Методи дослідження. Для досягнення поставлених в магістерській роботі задач використано алгоритми кластеризації к-серерднє та T-розподілене вкладення стохастичної близькості .
Наукова новизна одержаних результатів роботи полягає у наступному:
проведено аналіз існуючих методів шахрайства, досліджено чи застосовано алгоритми кластеризації;
запропоновано вирішення проблеми шахрайства під час виконання закупівель шляхом з використанням алгоритмів кластеризації;
розроблено програмний продукт для виявлення підозрілих дій під час виконання закупівель.
Особистий внесок здобувача. Магістерська робота є самостійно виконаною роботою студента, в якій відображено особистий унікальний підхід та особисто здобуті теоретичні та прикладні результати, що стосуються до вирішення задачі боротьби з шахрайством під час виконання закупівель в системі державних закупівель. Формулювання мети та завдань дослідження проводилося спільно з науковим керівником.
Практична цінність. Проведене дослідження надає можливість використання розробленої системи для розпізнавання шахрайства з можливістю гнучких налаштувань під час роботи системи. Отримані результати можуть використовуватися у майбутніх дослідженнях.
Description
Keywords
машинне навчання, навчання без вчителя, система кластеризації, відкриті дані, prozorro, machine learning, unsupervized learning, clustering system, open data
Citation
Ящук, М. О. Застосування алгоритмів машинного навчання на відкритих даних : магістерська дис. : 122 Комп’ютерні науки / Ящук Микола Олександрович. – Київ, 2020. – 87 с.