Метод виявлення текстової інформації, згенерованої штучним інтелектом

Ескіз недоступний

Дата

2024

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Актуальність теми. У сучасному науковому та інформаційному просторі, швидке зростання використання технологій ШІ значно впливає на процеси створення текстового контенту. ШІ може генерувати статті, звіти, аналітичні матеріали, що в зовнішніх ознаках мало чим відрізняються від текстів, написаних людиною. Однак, хоча такі текстові генерації можуть виявитися корисними для зменшення рутинної роботи, вони також породжують нові виклики у контексті автентичності і довіри до наукових та інформаційних джерел. Розвиток технологій, які можуть автоматично ідентифікувати та класифікувати текст, створений за допомогою ШІ, є важливим для забезпечення цілісності наукової комунікації та захисту інтелектуальної власності. Об’єктом дослідження є наукові статті та інші види наукової літератури, згенеровані штучним інтелектом. Предметом дослідження є методи та алгоритми нейронних мереж, які дозволяють класифікувати текст за допомогою розпізнавання та класифікації його походження. Мета роботи: покращення розпізнавання текстової інформації, згенерованої штучним інтелектом, серед наукових текстів, за допомогою нейронної мережі. Основні завдання включають: 1. Збір та аналіз даних, що містять як текст, створений людиною, так і ШІ. 2. Розробка і валідація моделі нейронної мережі для класифікації текстів.Навчання та тестування моделі на підготованому наборі даних. 3. Оцінка точності розпізнавання та ефективності моделі. Наукова новизна полягає у створенні новітнього методу для обробки та аналізу наукових текстів, що дозволяє вдосконалити класифікацію та підвищити точність визначення походження тексту. Практична цінність роботи виражається у можливості застосування розробленого методу в академічних та видавничих сферах для верифікації наукового контенту. Апробація роботи основні положення та результати роботи були представлення та обговорювались IV Міжнародна науково-практична конференція “PERSPECTIVES OF CONTEMPORARY SCIENCE: THEORY AND PRACTICE”, 26-28.05.2024, Львів, Україна. Структура та обсяг роботи. Дисертація містить вступ, чотири розділи, висновки і додатки. Описано історію розвитку та теоретичні аспекти використання штучного інтелекту для текстового аналізу, детальний аналіз підходів до навчання мереж, експериментальні методики та оцінку результатів. У вступі надано загальний огляд проблематики дослідження, зосереджено увагу на актуальності розпізнавання тексту, згенерованого штучним інтелектом, в сучасному науковому і практичному контексті. Визначено ключові виклики та висвітлено практичне значення дослідження. У першому розділі проведено детальний аналіз теоретичних аспектів розпізнавання тексту. Розглянуто основні поняття та історію розвитку штучного інтелекту в контексті генерації тексту. Описано сучасні методи та підходи, що використовуються для розпізнавання текстів, зокрема, в області обробки природної мови. Також обговорено переваги та недоліки цих методів. У другому розділі зосереджено увагу на визначенні критеріїв та метрик, які використовуються для оцінювання текстів, згенерованих штучним інтелектом. Детально проаналізовано різні метрики точності та проведено аналіз типових помилок, які часто зустрічаються під час автоматизованої генерації тексту. Також розглянуто ефективність різних технік на підставі практичних даних, що дозволяє оцінити їхню застосовність у реальних умовах. У третьому розділі проведено аналіз сучасних алгоритмів та методів, які використовуються для розпізнавання тексту, згенерованого ШІ. Обговорено як традиційні методи, так і інноваційні підходи в машинному навчанні та глибокому навчанні. Описано основні алгоритми та їхню адаптацію для конкретних завдань розпізнавання тексту. У четвертому розділі містяться результати реалізації та тестування нейронної мережі, розробленої для розпізнавання ШІ-генерованого тексту. Презентовано методику валідації, обговорено результати тестувань та порівняно ефективність запропонованого рішення з існуючими методами. У висновках підсумовано основні результати дослідження, підкреслено значення роботи у контексті розвитку технологій розпізнавання тексту та надано рекомендації щодо подальших напрямків розвитку в даній області. Робота складається з 93 аркушів, включає посилання на літературу.

Опис

Ключові слова

текстовий аналіз, штучний інтелект, класифікація текстів, нейронні мережі, аутентичність наукових текстів, text analysis, artificial intelligence, text classification, neural networks, authenticity of scientific texts

Бібліографічний опис

Савицький, Я. В. Метод виявлення текстової інформації, згенерованої штучним інтелектом : магістерська дис. : 123 Комп'ютерна інженерія / Савицький Ярослав Вікторович. – Київ, 2024. – 93 с.

DOI