Розора, Ірина ВасилівнаОласюк, Світлана Олексіївна2024-06-242024-06-242024Оласюк, С. О. Методи заповнення пропущених значень в масивах даних : магістерська дис. : 111 «Математика» / Оласюк Світлана Олексіївна. – Київ, 2024. – 37 с.https://ela.kpi.ua/handle/123456789/67388Магістерська дисертація містить 37 сторінок, 15 першоджерел та 22 слайди презентації. Структурно робота складається зі списку термінів, вступу, теоретичної частини, основної частини, висновків та переліку використаної літератури. Відсутні значення є поширеною проблемою статистичних досліджень, дуже багато методів імпутації та їхніх модифікацій було розроблено для використання в медичній статистиці (як метод імпутації за допомогою алгоритму випадкового лісу) чи соціологічних опитуваннях (як метод швидкої заміни). Просте пропущені значення зустрічаються в найбільш різноманітних сферах, часто для адекватної оцінки ризиків збитків від природніх чи техногенних катастроф бракує інформації про суми, в яку оцінюється завдана шкода і кількість постраждалий, в нашому випадку для дослідження було обрано дані щодо техногенних і природних катастроф за останні 124 роки, статистику взято з сайту Центру досліджень епідеміології катастроф (CRED). Метою роботи є дослідження методів заповнення пропусків в масивах даних та аналіз отриманих результатів для визначення переваг та недоліків кожного з методів та доцільність використання для обраного типу даних.37 с.ukімпутаціязаміна пропущених данихметод заміни середнімметод заміни медіаноюметод швидкої заміниметод k найближчих сусідівметод випадкового лісуметод максимального градієнтного підсиленняhot deckkNNRandom ForestMissForestXGBoostMCARMARMNARimputationmissing datamean imputationmedian imputationhot deck imputationk nearest neighbors imputationrandom foresteXtreme gradient boosting imputationМетоди заповнення пропущених значень в масивах данихMaster Thesis519.2