Інтелектуальна система географічної локалізації на основі мультимодального аналізу зображень з Google Street View із застосуванням великих мовних моделей
Вантажиться...
Дата
2025
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Дипломна робота: 137 с., 49 рис., 15 табл., 63 посилання, 1 додаток.
Об’єктом дослідження є задача географічної локалізації на основі аналізу візуальних даних. Предметом дослідження є методи та алгоритми локалізації географічного місцезнаходження шляхом мультимодального аналізу зображень із використанням великих мовних моделей. Метою роботи є розробка інтелектуальної системи для прогнозування географічних координат на основі аналізу зображень Google Street View із врахуванням набору візуальних індикаторів географічного положення. У роботі проведено аналіз предметної області та існуючих рішень для визначення географічного розташування на основі аналізу візуальних даних. Результатом роботи є розроблена інтелектуальна система, що використовує провідні великі мовні моделі для аналізу візуального та лінгвістичного контексту зображень з Google Street View та прогнозування географічних координат місця зйомки. Аналіз якості прогнозів проведено шляхом інтеграції розробленої системи з онлайн-ресурсом GeoGuessr. За результатами роботи сформовано базу знань, яка може бути використана для навчання вузькоспеціалізованої моделі методом дистиляції знань. Матеріали проведеного дослідження представлено на XXIII Всеукраїнській науково-практичній конференції студентів, аспірантів та молодих вчених «Теоретичні і прикладні проблеми фізики, математики та інформатики» (14 – 17 травня 2025 р., Київ, Україна) та опубліковано у збірнику матеріалів конференції.
Опис
Ключові слова
географічна локалізація, google street view, великі мовні моделі, geoguessr, мультимодальний аналіз, комп’ютерний зір, картографічна проекція, geographic localization, google street view, large language models, geoguessr, multimodal analysis, computer vision, map projection
Бібліографічний опис
Савчук, В. Ю. Інтелектуальна система географічної локалізації на основі мультимодального аналізу зображень з Google Street View із застосуванням великих мовних моделей : дипломна робота … бакалавра : 122 Комп'ютерні науки / Савчук Володимир Юрійович. – Київ, 2025. – 137 с.