Інтелектуальна система географічної локалізації на основі мультимодального аналізу зображень з Google Street View із застосуванням великих мовних моделей

Вантажиться...
Ескіз

Дата

2025

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Дипломна робота: 137 с., 49 рис., 15 табл., 63 посилання, 1 додаток. Об’єктом дослідження є задача географічної локалізації на основі аналізу візуальних даних. Предметом дослідження є методи та алгоритми локалізації географічного місцезнаходження шляхом мультимодального аналізу зображень із використанням великих мовних моделей. Метою роботи є розробка інтелектуальної системи для прогнозування географічних координат на основі аналізу зображень Google Street View із врахуванням набору візуальних індикаторів географічного положення. У роботі проведено аналіз предметної області та існуючих рішень для визначення географічного розташування на основі аналізу візуальних даних. Результатом роботи є розроблена інтелектуальна система, що використовує провідні великі мовні моделі для аналізу візуального та лінгвістичного контексту зображень з Google Street View та прогнозування географічних координат місця зйомки. Аналіз якості прогнозів проведено шляхом інтеграції розробленої системи з онлайн-ресурсом GeoGuessr. За результатами роботи сформовано базу знань, яка може бути використана для навчання вузькоспеціалізованої моделі методом дистиляції знань. Матеріали проведеного дослідження представлено на XXIII Всеукраїнській науково-практичній конференції студентів, аспірантів та молодих вчених «Теоретичні і прикладні проблеми фізики, математики та інформатики» (14 – 17 травня 2025 р., Київ, Україна) та опубліковано у збірнику матеріалів конференції.

Опис

Ключові слова

географічна локалізація, google street view, великі мовні моделі, geoguessr, мультимодальний аналіз, комп’ютерний зір, картографічна проекція, geographic localization, google street view, large language models, geoguessr, multimodal analysis, computer vision, map projection

Бібліографічний опис

Савчук, В. Ю. Інтелектуальна система географічної локалізації на основі мультимодального аналізу зображень з Google Street View із застосуванням великих мовних моделей : дипломна робота … бакалавра : 122 Комп'ютерні науки / Савчук Володимир Юрійович. – Київ, 2025. – 137 с.

ORCID

DOI