Секцiя 7. Математичне моделювання та аналiз даних
Постійне посилання зібрання
Переглянути
Перегляд Секцiя 7. Математичне моделювання та аналiз даних за Автор "Петренко, А. І."
Зараз показуємо 1 - 1 з 1
Результатів на сторінці
Налаштування сортування
Документ Відкритий доступ Метод ефективного нечiткого пошуку документiв в наборi текстових даних(КПІ ім. Ігоря Сікорського, 2024) Клещ, К. О.; Петренко, А. І.У статті розглянуто метод нечіткого пошуку, який складається з дев’яти послідовних кроків та потрібен для швидкого пошуку текстових співпадінь у великому наборі даних. На основі цього методу пропонується створення системи нечіткого пошуку, яка дозволила розв’язати задачу пошуку найбільш релевантних документів з набору таких документів. Розроблений метод нечіткого пошуку комбінує переваги алгоритмів на основі детермінованих скінченних автоматів та алгоритмів на основі динамічного програмування для підрахунку відстані Дамерау-Левенштейна. Така комбінація дозволила впровадити таблицю подібності символів оптимальним чином. В рамках роботи запропоновано підхід створення такої таблиці та створено приклад таблиці подібності символів з англійського алфавіту, що дозволяє з константною асимптотикою знаходити міру подібності поміж двома символами та перетворювати поточний символ в його базовий аналог. Алгоритм Дамерау-Левенштейна дозволяє знаходити відстань редагування між двома словами, враховуючи помилки наступних типів: додавання, заміна, видалення та транспозиція символів. В рамках роботи цей алгоритм був модифікований за допомогою впровадження таблиці подібності для більш точної оцінки відстані редагування між двома словами. Розроблений метод дозволив створити систему нечіткого пошуку, яка допоможе знаходити шукані результати швидше та підвищить релевантність отриманих результатів, за рахунок їхнього сортування відповідно до значень метрики подібності тестових даних.