Розробка методів отримання тексту із зображень у сфері віддаленого зондування

Вантажиться...
Ескіз

Дата

2024

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Магістерська дисертація: 97 с., 13 рис., 33 табл., 1 додаток, 22 джерела. Об’єкт дослідження – процес отримання текстового опису із зображення супутникових знімків у сфері дистанційного зондування. Предмет дослідження – алгоритми машинного навчання та комп'ютерного зору, здатні ефективно обробляти візуальні дані та перетворювати їх на текст, мультимодальні моделі. Мета роботи – розробити методи для перетворення візуальної інформації на змістовний текст за допомогою мультимодальних моделей, які інтегрують візуальну інформацію та природну мову для створення змістовних текстових описів зображень. У роботі розглянуто сучасні методи та моделі для задач у сфері дистанційного зондування поверхні землі. Також проаналізовано основні проблеми з описом зображень та проведено попередню обробку для них. Основні наукові результати та їх новизна. Досліджено роботу моделі BLIP, поєднання роботи моделей BERT та ResNet50 для визначеної задачі. Запропоновано модифіковану BLIP модель з новим шаром уваги, що покращує якість опису дрібних деталей.

Опис

Ключові слова

комп’ютерний зір, віддалене зондування, мультимодальні моделі, зоровий трансформер, computer vision, remote sensing, multimodal models, vision transformer

Бібліографічний опис

Шевченко, В. В. Розробка методів отримання тексту із зображень у сфері віддаленого зондування : магістерська дис. : 124 Системний аналіз / Шевченко Владислав Вадимович. - Київ, 2024. - 97 с.

DOI