Інтелектуальна система дослідження методів машинного навчання
dc.contributor.advisor | Фіногенов, Олексій Дмитрович | |
dc.contributor.author | Коваленко, Антон Сергійович | |
dc.date.accessioned | 2019-01-24T11:22:46Z | |
dc.date.available | 2019-01-24T11:22:46Z | |
dc.date.issued | 2018 | |
dc.description.abstracten | Relevance The choice, development or comparison of machine learning methods in the field of data mining can be a complex task based on the objective and purpose of a particular study. Numerous publicly available real and simulated databases originated from a variety of sources, but their organization and acceptance as standards were inconsistent. The most commonly used methods for solving the problem of image classification are: the naive Byes classifier, the method of k-nearest neighbours, the search tree and the network neuron. Absolutely all data methods are demanding test data and clear selection of training parameters and even a slight abnormality can lead to loss of learning efficiency. To avoid this, special methods of optimization have been developed for optimizing data prior to using the algorithm and at the time of using the algorithm. But even with the use of all known methods known to science, it is always possible that the result was not as accurate as possible, and the learning algorithm, having found a local minimum, did not lose another who simply could not track. Connection with other scientific programs, plans and topics. Dissertation work was developed as part of scientistic research works of Computer-Aided Management And Data Processing Systems Department of Faculty of Informatics and Computer Science, Igor Sikorsky Kyiv Polytechnic Institute № 0117U000914 “Mathematical models and technologies in decision making systems”. The purpose and tasks of the study. The main goal of the work is to develop mathematical and algorithmic support for the study of machine learning methods, increase their accuracy and study the influence of parameters on the result of training. To achieve this goal, it is necessary to solve a set of the following interrelated tasks: - analysis of existing methods of machine learning for the classification of images; - development of the application for testing the chosen teaching methods; - development of an algorithm for studying the effectiveness of training; - research of efficiency of the developed algorithm. Research object. The process of machine learning for the task of image classification based on the MNIST database. Research subject. Methods and algorithms used for machine learning. Research methods. During the research and development in the dissertation work methods of machine learning, neural networks, methods of optimization were used. For the practical part - the methods of functional programming: the MNIST database, libraries keras, theano and tensotrflow. Scientific novelty is as follows: a) a library for displaying and analyzing the final and intermediate result of machine learning has been developed b) an algorithm for finding a local minimum has been developed Practical use. All proposed mathematical models and algorithms are brought to practical implementation within the framework of the software used for image classification. Publications. According to this research 2 scientific papers were published. | uk |
dc.description.abstractuk | Актуальність теми. Вибір, розробка або порівняння методів машинного навчання в області інтелектуального аналізу даних може бути складним завданням, заснованим на цільової задачі і цілі конкретного дослідження. Численні загальнодоступні реальні і змодельовані базові набори даних з'явилися з різних джерел, але їх організація і прийняття в якості стандартів були непослідовними. Найбільш часто використовуваними методами для вирішення завдання класифікації зображень є: наївний баєсовскький класифікатор, метод k-найближчих сусідів, дерева пошуку та нейроні мережі. Абсолютно всі дані методи вимогливі до тестових даних та чіткого підбора параметрів навчання і навіть незначне похилення, може призвести до втрати ефективності навчання. Для уникнення цього було розроблені спеціальні методи оптимізації як для оптимізації даних до використання алгоритму так і в момент використання алгоритму. Але навіть при використанні усіх відомих методів, відомих науці, завжди залишається можливість того, що результат був не максимально точним, та алгоритм навчання, знайшовши локальний мінімум, не втратив інший який просто не зумів відстежити. Зв'язок роботи з науковими програмами, планами, темами. Дисертаційна робота виконувалась в рамках науково-дослідних робіт кафедри автоматизованих систем обробки інформації та управління факультету обчислювальної техніки та інформатики КПІ імені Ігоря Сікорського № 0117U000914 «Математичні моделі та технології в системах підтримки прийняття рішень». Мета і задачі дослідження. Основна мета роботи полягає в розробці математичного та алгоритмічного забезпечення для дослідження методів машинного навчання, підвищення їх точності та дослідження впливу параметрів на результат навчання. Для досягнення поставленої мети необхідно розв‘язати комплекс наступних взаємопов‘язаних задач: - аналіз існуючих методів машинного навчання для класифікації зображень; - розробка застосунку для випробовування обраних методів навчання; - розробка алгоритму для дослідження ефективності навчання ; - дослідження ефективності розробленого алгоритму. Об’єкт дослідження. Процес машинного навчання для задачі класифікації зображення на основі бази даних MNIST. Предмет дослідження. Методи та алгоритми, що використовуються для машинного навчання. Методи дослідження. При проведенні досліджень і розробок у дисертаційній роботі використовувались методи машинного навчання, нейронні мережі, методи оптимізації. Для практичної частини – методи функціонального програмування: база даних MNIST, бібліотеки keras, theano та tensotrflow. Наукова новизна одержаних результатів полягає в наступному: а) розроблена бібліотека для відображення та аналізу кінцевого та проміжного результату машинного навчання б) розроблено алгоритм пошуку локального мінімуму Практичне значення одержаних результатів. Всі запропоновані математичні моделі і алгоритми доведені до практичної реалізації у рамках програмного забезпечення, котре використовується для класифікації зображень. Публікації. За результатами дослідження опубліковано 2 наукових праці. | uk |
dc.format.page | 68 с. | uk |
dc.identifier.citation | Коваленко, А. О. Інтелектуальна система дослідження методів машинного навчання : магістерська дис. : 121 Інженерія програмного забезпечення / Коваленко Антон Сергійович. – Київ, 2018. – 68 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/26024 | |
dc.language.iso | uk | uk |
dc.publisher.place | Київ. | uk |
dc.subject | архітектура | uk |
dc.subject | методи машінного навчання | uk |
dc.subject | нейронна мережа | uk |
dc.subject | методи оптімізації | uk |
dc.subject | лінійна апроксимація | uk |
dc.subject | квадратична апроксимація | uk |
dc.subject | матриця Гесса | uk |
dc.subject | метод Монте-Карло | uk |
dc.subject | architecture | uk |
dc.subject | methods of mashing education | uk |
dc.subject | neural network | uk |
dc.subject | optimization methods | uk |
dc.subject | linear aproximation | uk |
dc.subject | quadratic aproximation | uk |
dc.subject | Hess mattress | uk |
dc.subject | Monte Carlo method | uk |
dc.subject.udc | 004.021, 004.85 | uk |
dc.title | Інтелектуальна система дослідження методів машинного навчання | uk |
dc.type | Master Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Ескіз недоступний
- Назва:
- Kovalenko_magistr.docx
- Розмір:
- 6.37 MB
- Формат:
- Microsoft Word XML
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 7.74 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: