Застосування алгоритмів машинного навчання на відкритих даних

dc.contributor.advisorКирюша, Богдан Анатолійович
dc.contributor.authorЯщук, Микола Олександрович
dc.date.accessioned2023-05-10T13:31:49Z
dc.date.available2023-05-10T13:31:49Z
dc.date.issued2020
dc.description.abstractСтруктура та обсяг роботи. Пояснювальна записка дипломного проекту складається з шести розділів, включає 31 рисунок, 35 таблиць та 1 додатку. Дипломний проект застосовує тему "Алгоритми машинного навчання на відкритих даних", яка спрямована на виявлення переваг відкритих даних. Розділ загальних положень пояснив діяльність моделі, випадки використання, розглянув та проаналізував загальний підхід до роботи з даними Prozzoro та точно поставив завдання із визначеними цілями та завданнями. У розділі інформаційної підтримки визначаються вхідні та вихідні дані та відображається схема бази даних. Найкращий результат продемонстрував показ двох моделей системи в розділі про математичне програмне забезпечення. Розділ програмного забезпечення описує основні інструменти для розробки набору завдань, вибору та обґрунтування вимог до обладнання, архітектури програмного забезпечення. У технологічному розділі описуються інструкції користувача до тесту та відображаються разом із результатами. У стартап-проєкт розділі описуються імплементація стартапу на основі даної робти. Мета дослідження. Метою дослідження є розробка способу пошуку аномалій в фінансових транзакціях за допомогою сучасних інструментів обробки даних у реальному часі Об’єкт дослідження — алгоритми розпізнавання шахрайства в системах електронних закупівель. Предмет дослідження — розробка системи для боротьби з шахрайством для систем електронних закупівель з використанням алгоритмів машинного навчання. Методи дослідження. Для досягнення поставлених в магістерській роботі задач використано алгоритми кластеризації к-серерднє та T-розподілене вкладення стохастичної близькості . Наукова новизна одержаних результатів роботи полягає у наступному: проведено аналіз існуючих методів шахрайства, досліджено чи застосовано алгоритми кластеризації; запропоновано вирішення проблеми шахрайства під час виконання закупівель шляхом з використанням алгоритмів кластеризації; розроблено програмний продукт для виявлення підозрілих дій під час виконання закупівель. Особистий внесок здобувача. Магістерська робота є самостійно виконаною роботою студента, в якій відображено особистий унікальний підхід та особисто здобуті теоретичні та прикладні результати, що стосуються до вирішення задачі боротьби з шахрайством під час виконання закупівель в системі державних закупівель. Формулювання мети та завдань дослідження проводилося спільно з науковим керівником. Практична цінність. Проведене дослідження надає можливість використання розробленої системи для розпізнавання шахрайства з можливістю гнучких налаштувань під час роботи системи. Отримані результати можуть використовуватися у майбутніх дослідженнях.uk
dc.description.abstractotherStructure and scope of work. The explanatory note of the diploma project consists of six sections, includes 31 figures, 35 tables and 1 appendix. The thesis project uses the topic "Algorithms of machine learning on open data", which aims to identify the benefits of open data. The General section explained the model's activities, use cases, reviewed and analyzed the general approach to working with Prozzoro data, and set clear objectives with defined goals and objectives. The information support section defines the input and output data and displays the database schema. The best result was shown by showing two models of the system in the section on mathematical software. The software section describes the main tools for developing a set of tasks, selecting and justifying hardware requirements, software architecture. The technology section describes the user instructions for the test and is displayed along with the results. The startup project section describes the implementation of a startup based on this work. The purpose of research. The purpose of research is to develop a way to find anomalies in financial transactions using modern tools for real-time data processing. The object of research is algorithms for fraud detection in e-procurement systems. The subject of research is the development of a system to detect frauds for e-procurement systems using machine learning algorithms. Research methods. To achieve the tasks set in the master's thesis, clustering algorithms k-middle and T-distributed embedding of stochastic proximity are used. The scientific novelty of the obtained results of work is the following: - the analysis of existing methods of fraud are investigated, clustering algorithms are investigated or applied; - proposed solution to the problem of fraud in the implementation of procurement by using clustering algorithms; - A software product has been developed to detect suspicious actions during procurement. Personal contribution of the applicant. The master's thesis is a self-performed work of a student, which reflects a personal unique approach and personally obtained theoretical and applied results related to solving the problem of combating fraud during procurement in the public procurement system. The formulation of the goals and objectives of the study was carried out jointly with the supervisor. Practical value. The study provides an opportunity to use the developed system to detect fraud with the possibility of flexible settings during system operation. The results obtained can be used in future studies.uk
dc.format.extent87 с.uk
dc.identifier.citationЯщук, М. О. Застосування алгоритмів машинного навчання на відкритих даних : магістерська дис. : 122 Комп’ютерні науки / Ящук Микола Олександрович. – Київ, 2020. – 87 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/55546
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectмашинне навчанняuk
dc.subjectнавчання без вчителяuk
dc.subjectсистема кластеризаціїuk
dc.subjectвідкриті даніuk
dc.subjectprozorrouk
dc.subjectmachine learninguk
dc.subjectunsupervized learninguk
dc.subjectclustering systemuk
dc.subjectopen datauk
dc.titleЗастосування алгоритмів машинного навчання на відкритих данихuk
dc.title.alternativeMachine learning algorithms on the open datauk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
Yashchuk_magistr.doc
Розмір:
1.48 MB
Формат:
Microsoft Word
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.1 KB
Формат:
Item-specific license agreed upon to submission
Опис: