Виявлення нових тем фейкових новин та їх джерел використовуючи методи глибокого навчання
Ескіз недоступний
Дата
2024
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Актуальність. Дедалі більшу популярність набуває використання різних новинних веб ресурсів у мережі Інтернет та соціальних мережах для поширення інформації. Набираючи деяку аудиторію читачів та користуючись їх довірою, такі джерела починають розповсюджувати фейкові новини чи маніпуляції. Тому ідея захисту населення від дезінформації та поширення маніпулятивного впливу в умовах війни є вкрай гострою й необхідною в сьогоденні.
Використання сучасних технологій є необхідним фактором у боротьбі із поширенням фейкових даних. При чому, основна задача полягає в швидкому автоматичному аналізі інформації, а також розповсюдженні спростувань та правдивих фактів. Тому розробка нових алгоритмів пошуку та аналізу потоку новин являється вкрай актуальною задачею.
Метою дослідження є полегшення виявлення елементів дезінформації за рахунок створення методу та алгоритму для перевірки потоку текстових даних на наявність елементів дезінформації у вигляді лінгвістичних конструкцій та оборотів, які вказують на неправдивість представленої інформації.
Для досягнення мети поставлено і виконано такі завдання:
1. Дослідження структури новин, фейкових новин
2. Дослідження методів детекції фейкових новин
3. Збір актуальних даних та датасету, структуризація і обробка даних
4. Розробка алгоритму для виявлення фейків та їх джерел
5. Реалізація програмного забезпечення у вигляді веб додатка з сервісною архітектурою з використанням глибоких моделей машинного навчання як сервіси.
Об’єкт дослідження – фейкові новини у контексті загальної системи засобів масової інформації та їх детекція.
Предмет дослідження є способи виявлення елементів дезінформації в текстових потоках даних.
Методами дослідження є методи комп’ютерної лінгвістики та машинного навчання для виявлення елементів дезінформації.
Наукова новизна одержаних результатів роботи полягає у наступному:
1. Запропоновано спосіб детекції фейкових новин і їх джерел з джерел новин
2. Використано застосування великих мовних моделей як класифікаторів логічної зв'язності
3. Запропоновано побудову графу близьких новин з логічними зв'язками з допомогою поєднання методів векторного пошуку та класифікації natural language inference
4. Створено інтерактивний чат-асистент для пояснення результатів та отримання додаткової інформації у зовнішніх джерелах
Особистий внесок здобувача. Магістерське дослідження є самостійно виконаною роботою, в якій відображено особистий авторський підхід та особисто отримані теоретичні та прикладні результати, що відносяться до вирішення задачі аналізу текстів з допомогою великих мовних моделей та графових алгоритмів як Natural Language Processing: inference, understanding і generation. Формулювання мети та завдань дослідження проводилось спільно з науковим керівником.
Публікації:
Методи аналізу новин /Орловський А. В., Кислий Р. В. // Системні науки та інформатика: збірник доповідей II науково-практичної конференції «Системні науки та інформатика» з нагоди 125-річчя КПІ ім. Ігоря Сікорського, 04 – 08 грудня 2023 року, Київ. – К., НН ІПСА КПІ ім. Ігоря Сікорського, 2023. – с. 325-329.
Опис
Ключові слова
Технологія Natural Language Processing - NLP, Retrieval Augmented Generation - RAG, Natural Language Inference - NLI, prompt engineering, Large Language Model - LLM, transformer, approximate nearest neighbors, фейк, Natural Language Processing - NLP, Retrieval Augmented Generation -RAG, Natural Language Inference -NLI, fake
Бібліографічний опис
Орловський, А. В. Виявлення нових тем фейкових новин та їх джерел використовуючи методи глибокого навчання : магістерська дис. : 122 Комп’ютерні науки / Орловський Артем Володимирович. – Київ, 2024. – 124 с.