Самоналагоджувальна індексна структура бази для діапазонного пошуку за допомогою підходів машинного навчання
Вантажиться...
Дата
2018
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
Анотація
Загальний обсяг роботи: 103 сторінки, 30 ілюстрацій, 31 таблиця, 1 перелік
посилань із 30 найменувань.
Актуальність теми.
У зв’язку зі стрімким зростанням кількості даних у мережі Інтернет
традиційні підходи до пошуку інформації стають дедалі більш неефективними.
Основною їх проблемою лишається те, що вони не враховують реальний розподіл
даних та діють з точки зору найгіршого ймовірно розподілу, а їх ефективність
вимірюється асимптотичною оцінкою.
Темою дослідження є застосування підходів машинного навчання для побудови
нового класу індексних структур для діапазонного пошуку, що будуть враховувати
специфіку конкретних даних, на яких будується індекс. Такий підхід дозволяє
зменшити використання пам’яті, а також звести час пошуку інформації до
константного в незалежності від кількості даних.
Мета та задачі дослідження
Метою даної роботи є пошук шляхів побудови більш ефективних індексних
структур за допомогою підходів машинного навчання. Задачею дослідження є
реалізація самоналагоджувальної індексної структури для діапазонного пошуку, що
враховує розподіл даних та працює за константний час в незалежності від кількості
даних та їх природи зростання.
Вирішення поставлених завдань та досягнуті результати
Було перевірено підхід побудови самоналагоджувальних індексних структур за
допомогою методів машинного навчання з використанням повновз’язних нейронних
мереж та методу опорних векторів з використаням техніки гурту експертів.
Роботу зазначених навчених індексних структур було апробовано на двох типах
наборів даних – числових та строкових. Експерименти показали, що цей підхід має
право на життя, і структури доволі успішно вивчили розподіл даних будь-якого типу,
однак зі строковими даними результати були кращими.
Об’єкт дослідження.
Індексні структури в базах даних.
Предмет дослідження.
Методи машинного навчання для побудови самоналагоджувальних індексних
структур для діапазонного пошуку
Методи дослідження.
Досліджується використання нейронних мереж та методу опорних векторів
для вирішення задачі вивчення розподілу чисельних та строкових даних. Розроблене
рішення використовує сучасні підходи машинного навчання, методи покращення
точності у вигляді гурту експертів, а також бібліотеки для тренування і
застосування моделей.
Наукова новизна.
На відміну від попередніх робіт, які фактично стосувались статичного вибору
архітектури, у даному дослідженні було зміщено акцент на побудову спрощених
ієрархічних та плоских моделей - використання неглибоких нейронних мереж та
методу опорних векторів, а також на використання методів Баєсівської оптимізації
для підбору оптимальної по пам’яті та швидкості роботи архітектури моделі в
залежності від розподілу реальних даних, що може бути корисним застосуванням
для моделей у реальних базах даних.
Практичне значення одержаних результатів.
Розроблені індексні структури показують більш ефективне використання
пам’яті та приведення часу виконання пошуку до константного, тому, за умови
подальшого вдосконалення, вони можуть бути інтегровані у сучасні бази даних.
Крім цього, отримані результати підтверджують загальну ідею доцільності
використання машинного навчання для заміни класичних індексних структур.
Опис
Ключові слова
індексні структури, B-tree, Байєсівська оптимізація гіперпараметрів, гурт експертів, метод опорних векторів, нейронні мережі, функція розподілу, машинне навчання, Index structures, Bayesian optimization of hyperparameters, mixture of experts, support vector machine, neural networks, distribution function, machine learning
Бібліографічний опис
Круш, І. В. Самоналагоджувальна індексна структура бази для діапазонного пошуку за допомогою підходів машинного навчання : магістерська дис. : 122 Комп’ютерні науки та інформаційні технології (Системне проектування сервісів) / Круш Ігор Володимирович. – Київ, 2018. – 103 с.