Розробка методів отримання тексту із зображень у сфері віддаленого зондування
dc.contributor.advisor | Шаповал, Наталія Віталіївна | |
dc.contributor.author | Шевченко, Владислав Вадимович | |
dc.date.accessioned | 2025-02-13T13:23:07Z | |
dc.date.available | 2025-02-13T13:23:07Z | |
dc.date.issued | 2024 | |
dc.description.abstract | Магістерська дисертація: 97 с., 13 рис., 33 табл., 1 додаток, 22 джерела. Об’єкт дослідження – процес отримання текстового опису із зображення супутникових знімків у сфері дистанційного зондування. Предмет дослідження – алгоритми машинного навчання та комп'ютерного зору, здатні ефективно обробляти візуальні дані та перетворювати їх на текст, мультимодальні моделі. Мета роботи – розробити методи для перетворення візуальної інформації на змістовний текст за допомогою мультимодальних моделей, які інтегрують візуальну інформацію та природну мову для створення змістовних текстових описів зображень. У роботі розглянуто сучасні методи та моделі для задач у сфері дистанційного зондування поверхні землі. Також проаналізовано основні проблеми з описом зображень та проведено попередню обробку для них. Основні наукові результати та їх новизна. Досліджено роботу моделі BLIP, поєднання роботи моделей BERT та ResNet50 для визначеної задачі. Запропоновано модифіковану BLIP модель з новим шаром уваги, що покращує якість опису дрібних деталей. | |
dc.description.abstractother | Master's Thesis: 97 pages, 13 figures, 33 tables, 1 appendix, 22 references. The object of the research is the task of obtaining textual descriptions from images of satellite imagery in the field of remote sensing. The subject of study is machine learning and computer vision algorithms capable of effectively processing visual data and converting it into text, multimodal models. Purpose of the work – to develop methods for converting visual information into meaningful text through multimodal models that integrate visual information and natural language to generate coherent textual descriptions of images. The study reviews modern methods and models for tasks in the field of Earth remote sensing. It also analyzes the main issues related to image description and conducts preliminary processing for them. Scientific results and their novelty. The work examines the BLIP model, the combination of BERT and ResNet50 models for the specified task. A modified BLIP model with a new attention layer is proposed to improve the quality of describing fine details. | |
dc.format.extent | 97 с. | |
dc.identifier.citation | Шевченко, В. В. Розробка методів отримання тексту із зображень у сфері віддаленого зондування : магістерська дис. : 124 Системний аналіз / Шевченко Владислав Вадимович. - Київ, 2024. - 97 с. | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/72499 | |
dc.language.iso | uk | |
dc.publisher | КПІ ім. Ігоря Сікорського | |
dc.publisher.place | Київ | |
dc.subject | комп’ютерний зір | |
dc.subject | віддалене зондування | |
dc.subject | мультимодальні моделі | |
dc.subject | зоровий трансформер | |
dc.subject | computer vision | |
dc.subject | remote sensing | |
dc.subject | multimodal models | |
dc.subject | vision transformer | |
dc.subject.udc | 303.732.4 | |
dc.title | Розробка методів отримання тексту із зображень у сфері віддаленого зондування | |
dc.type | Master Thesis |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Shevchenko_magistr.pdf
- Розмір:
- 3.84 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: