Спосіб підвищення ефективності методів доповнення даних на основі нейронних мереж
dc.contributor.advisor | Стіренко, Сергій Григорович | |
dc.contributor.author | Цзяшу, Сюй | |
dc.date.accessioned | 2020-06-09T12:30:44Z | |
dc.date.available | 2020-06-09T12:30:44Z | |
dc.date.issued | 2020 | |
dc.description.abstracten | Master's Thesis: 82 pp., 41 Figs., 10 tables, 1 appendix, 32 references. Main problem: The three major factors of Machine learning are data, computing power, and algorithms, the data is the basis of all machine learning research. There are two main reasons for the rise of deep learning algorithms, the first large-scale data collection has become a reality, and the second is the development of high-performance computing, which can allow huge data models to be fitted well. As the most promising branch of artificial intelligence, deep learning also relies heavily on large amounts of data. The size of the data set directly affects the performance of deep learning algorithm models. However, for neural network research, it usually needs to collect a lot of real data to train a neural network. At the same time, these data need to be manually marked with some classification and identification information, so that it consumes a huge time cost and labor cost. Purpose of work: This paper aims at the problem of overfitting the network due to the data set is too small in the deep learning image classification and recognition research and uses the method of the generative adversarial network to generate images to expand the data set to achieve data augmentation. The main tasks of the research: 1. Analyze the advantages and disadvantages of current data augmentation methods, and further discuss the feasibility of using GAN for data augmentation. 2. A data augmentation method based on generative adversarial network is proposed, and the network structure of the data augmentation model is designed based on this method. 3. Compare and analyze the images generated by the designed data augmentation model, then expand the original data set, design classification and recognition experiments to verify the generated samples for the effect of data augmentation. The object of research: Generate adversarial network, and the feasibility of using generated samples to expand the original dataset. The subject of research: Based on the method of generating adversarial networks to generate reliable in-class samples, test the data augmentation effect of these generated samples through comparative experiments. Research methods: Experimental verification method. The practical significance of the results obtained: As the experimental results showed, using the method of this paper to augment data can obtain higher experimental accuracy, which is better than traditional methods. Moreover, in the test experiment in the field of meta-learning, the method of this paper also obtained good data augmentation effect. Publication: YaHu Yang, JiaShu Xu, Yuri Gordienko, Sergii Stirenko ‘Abnormal Interference Recognition Based on Rolling Prediction Average Algorithm’ // The Third International Conference on Computer Science, Engineering and Education Applications (ICCSEEA2020). Kyiv – 2020. | uk |
dc.description.abstractuk | Магістерська дисертація: 83 с., 41 рис., 10 табл., 1 додаток, 32 джерел. Основна проблема: Три основні елементи машинного навчання - це дані, обчислювальна потужність та алгоритми. Дані є основоювсіх досліджень машинного навчання. Існує дві основні причини виникнення алгоритмів глибокого навчання: перший масштабний збір даних став реальністю, а другий - це розробка високоефективних обчислень, використання яких дозволяє ефективно використовувати великі моделі даних. Будучи найбільш перспективною галуззю штучного інтелекту, глибоке навчання також значною мірою покладається на великі обсяги даних, а розмір набору даних безпосередньо впливає на ефективність моделей алгоритмів глибокого навчання. Однак, для досліджень нейронних мереж, зазвичай необхідно збирати велику кількість реальних даних для тренування нейронної мережі. У той же час ці дані потрібно маркувати вручну деякою класифікаційною та ідентифікаційною інформацією, що вимагає значні часові витрати та великої праці. Мета роботи: Ця дисертація спрямована на вирішення проблеми перенавчання(overfitting) мережі через те, що набір даних є занадто малим для задачі класифікації та розпізнавання зображень та використовує метод генеративної змагальної мережі для створення зображень для розширення набору даних для досягнення покращення даних. Основні задачі дослідження: 1. Проаналізувати переваги та недоліки сучасних методів збільшення набору даних та доцільність використання генеративних змагальних мереж для збільшення наборів даних. 2. Запропонувати метод доповнення набору даних, заснований на генеративній змагальній мережі, та структуру моделі нейронної мережі для збільшення набору даних, розробленої на основі цього методу. 3. Порівняти та проаналізувати зображення, згенеровані розробленою моделлю збільшення набору даних, спроектувати експерименти для класифікації на основі оригінальних та згенерованих вибірок та проаналізувати ефективність використання доповнення даних. Об’єктом дослідження. GAN та доцільність використання згенерованих зразків для розширення вихідного набору даних. Предметом дослідження. Спираючись на метод генерації змагальних мереж для створення надійних зразків у одно класі, протестуйте ефект збільшення даних цих генерованих зразків шляхом порівняльних експериментів. Методи дослідження. Експериментальний метод верифікації. Практичне значення одержаних результатів. Експерименти підтвердили, що метод доповнення набору даних у цій роботі дозволяє отримати більш високу експерементальну точність, що краще, ніж традиційні методи збільшення наборів даних. Більше того, метод даної роботи також має гарний ефект розширення наборів даних у галузі мета-навчання. Публікації. YaHu Yang, JiaShu Xu, Yuri Gordienko, Sergii Stirenko ‘Abnormal Interference Recognition Based on Rolling Prediction Average Algorithm’ // The Third International Conference on Computer Science, Engineering and Education Applications (ICCSEEA2020). Kyiv – 2020. | uk |
dc.format.page | 86 с. | uk |
dc.identifier.citation | Цзяшу, Сюй Спосіб підвищення ефективності методів доповнення даних на основі нейронних мереж : магістерська дис. : 121 Інженерія програмного забезпечення / Сюй Цзяшу. – Київ, 2020. – 86 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/34061 | |
dc.language.iso | en | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | генеративні змагальні мережі | uk |
dc.subject | збільшення наборів даних | uk |
dc.subject | генерація зображень | uk |
dc.subject | глибинні нейронні мережі | uk |
dc.subject | U-Net | uk |
dc.subject | ResNet | uk |
dc.subject | generative adversarial networks | uk |
dc.subject | data augmentation | uk |
dc.subject | image generation | uk |
dc.subject | deep neural networks | uk |
dc.subject | U-Net | uk |
dc.subject | ResNet | uk |
dc.subject.udc | 004.02 | uk |
dc.title | Спосіб підвищення ефективності методів доповнення даних на основі нейронних мереж | uk |
dc.type | Master Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Ескіз недоступний
- Назва:
- Tszyashu_magistr.docx
- Розмір:
- 10.58 MB
- Формат:
- Microsoft Word XML
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.06 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: