Розробка методів отримання тексту із зображень у сфері віддаленого зондування
Вантажиться...
Дата
2024
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Магістерська дисертація: 97 с., 13 рис., 33 табл., 1 додаток, 22 джерела.
Об’єкт дослідження – процес отримання текстового опису із
зображення супутникових знімків у сфері дистанційного зондування.
Предмет дослідження – алгоритми машинного навчання та
комп'ютерного зору, здатні ефективно обробляти візуальні дані та
перетворювати їх на текст, мультимодальні моделі.
Мета роботи – розробити методи для перетворення візуальної
інформації на змістовний текст за допомогою мультимодальних моделей, які
інтегрують візуальну інформацію та природну мову для створення змістовних
текстових описів зображень.
У роботі розглянуто сучасні методи та моделі для задач у сфері
дистанційного зондування поверхні землі. Також проаналізовано основні
проблеми з описом зображень та проведено попередню обробку для них.
Основні наукові результати та їх новизна. Досліджено роботу моделі
BLIP, поєднання роботи моделей BERT та ResNet50 для визначеної задачі.
Запропоновано модифіковану BLIP модель з новим шаром уваги, що
покращує якість опису дрібних деталей.
Опис
Ключові слова
комп’ютерний зір, віддалене зондування, мультимодальні моделі, зоровий трансформер, computer vision, remote sensing, multimodal models, vision transformer
Бібліографічний опис
Шевченко, В. В. Розробка методів отримання тексту із зображень у сфері віддаленого зондування : магістерська дис. : 124 Системний аналіз / Шевченко Владислав Вадимович. - Київ, 2024. - 97 с.