Веб-додаток класифікації текстових новин з інтернет-ресурсів на основі методів машинного навчання

Вантажиться...
Ескіз

Дата

2023

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Сікорського

Анотація

Дипломна робота за темою «Веб-додаток класифікації текстових новин з інтернет-ресурсів на основі методів машинного навчання» виконана студенткою кафедри інженерії програмного забезпечення в енергетиці НН ІАТЕ Стрельченко Ганною-Марією Григорівною зі спеціальності 121 «Інженерія програмного забезпечення» за освітньо-професійною програмою «Інженерія програмного забезпечення інтелектуальних кібер-фізичних систем в енергетиці» і складається зі: вступу; 6 розділів («Мета, постановка задачі та основні завдання веб-додатку», «Аналіз подібних існуючих методів та алгоритмів класифікації текстів», «Засоби розробки програмного забезпечення», «Опис програмної реалізації», «Опис інтерфейсу користувача», «Дослідження і порівняння отриманих результатів роботи алгоритмів»), висновків до кожного з цих розділів; загальних висновків; списку використаних джерел, який налічує 18 джерел; 16 ілюстрацій; 1 додаток. Загальний обсяг роботи 72 сторінки. Актуальність теми. Можливість швидкої класифікації текстової інформації, розміщеної на різноманітних сайтах у наш час дуже актуальна і потрібна для організації свого часу, а також є одним із основних завдань відповідних інтернет-сервісів щодо організації текстових даних, а також їх подальшого зберігання у відповідних базах даних. Мета роботи і завдання дослідження. Метою даної дипломної роботи є створення веб-додатку класифікації текстових новин з інтернет ресурсів методами штучного інтелекту. Цей процес включає в себе розробку моделей класифікації, підготовку набору даних для тренування, створення інтерфейсу користувача, оптимізацію і тестування створеної веб-системи. Практичне значення одержаних результатів. Результатом роботи є веб-додаток, який виконує класифікацію за допомогою двох різних алгоритмів.

Опис

Дане дослідження показує як можна виконувати зчитування, попередню обробку і класифікацію текстових новин. Під час дослідження написано веб-додаток, що отримує текст з HTML-коду сторінки за посиланням, перетворює його у форму, прийнятну для моделі, виконує класифікацію за 2 алгоритмами і виводить результати на екран.

Ключові слова

машинне навчання, класифікація, обробка природної мови, текст, новина, модель, попередня обробка тексту

Бібліографічний опис

Стрельченко, Г.-М. Г. Веб-додаток класифікації текстових новин з інтернет-ресурсів на основі методів машинного навчання : дипломна робота ... бакалавра : 121 Інженерія програмного забезпечення / Стрельченко Ганна-Марія Григорівна. - Київ, 2023. - 72 с.

DOI