Статті (ММАД)
Постійне посилання зібрання
У зібранні розміщено матеріали, що опубліковані або готуються до публікації в наукових журналах та збірниках.
Переглянути
Нові надходження
Документ Відкритий доступ A generalized model for mapping sunflower areas using Sentinel-1 SAR data(Elsevier, 2024) Qadir, Abdul; Skakun, Sergii; Kussul, Nataliia; Shelestov, Andrii; Becker-Reshef, InbalExisting crop mapping models, rely heavily on reference (calibration) data obtained from remote sensing observations. However, the transferability of such models in space and time, without the need for additional extensive datasets remains a significant challenge. There is still a large gap in developing generalized classification models capable of mapping specific or multiple crops with minimal calibration data. In this study, we present a generalized automatic approach for sunflower mapping at 20-m spatial resolution, using the C-band Sentinel-1 (S1) synthetic aperture radar (SAR) data driven by previously developed phenological metrics. These metrics characterize the directional behavior of the sunflower head, capturing distinct backscattering responses in SAR data acquired from ascending and descending orbits. Specifically, we utilize SAR-derived backscatter values in VH and VV polarization, as well as their ratio VH/VV, as input features to a random forest classifier that was calibrated for the year 2022 in Ukraine. This model is further directly applied to selected sites for multiple years in Ukraine (generalization in time) and other major sunflower producing countries (generalization in space): Ukraine for 2018–2020, and Hungary, France, Russia and USA for 2018. Our results reveal that the model based on features acquired from descending orbits outperforms its ascending orbit counterpart because of the directional behavior of sunflower: user's accuracy (UA) of 96%, producer's accuracy (PA) of 97% and F-score of 97% (descending) compared to UA of 90%, PA of 89% and F-score of 90% (ascending). When generalized to other years and countries, our model achieves an F-score exceeding 77% for all cases, with the highest F-scores (>91%) observed in Ukraine and Russia sites and the lowest (77%) for the US site. We further utilize the produced maps (pixel-based) for the selected regions and years to estimate sunflower planted areas using a statistical sampling-based approach. Our estimates yield the relative root mean square error (RMSE) as 19.7% of the mean area, when compared to the reference data from official statistics and reference maps. These findings demonstrate the robustness of our proposed approach across space and time in generating accurate sunflower maps, its ability to mitigate cloud cover issues through spaceborne SAR data acquisitions, and its potential for obtaining estimates of sunflower planted areas. This research emphasizes the importance of developing interpretable and domain-specific machine learning models that can be readily extended to multiple geographical regions with little to no labelled datasets.Документ Відкритий доступ Геопросторовий аналіз потенціалу територій України для розміщення сонячних електростанцій за супутниковими даними(Головна астрономічна обсерваторія Національної академії наук України, 2024) Куссуль, Н. М.; Дрозд, С. Ю.Зміни клімату зумовлюють актуальність використання відновлюваної енергетики в усьому світі. Зелена угода визначає політику розвитку енергетики в Європі до 2030 року. Особливо важливе значення цей виклик має в Україні у контексті повоєнного відновлення енергетичної інфраструктури. Тому актуальною проблемою є аналіз придатності території України для встановлення великих сонячних електростанцій (сонячних ферм) та оптимізація їхнього розміщення. Дане дослідження спрямоване на визначення придатності територій України для розміщення сонячних електростанцій за допомогою супутникових даних про особливості клімату та рельєфу. Серед факторів, які визначають придатність території для розміщення сонячних ферм, найбільший вплив мають кліматичні показники, включаючи дані про сумарне глобальне горизонтальне сонячне випромінювання (GHI), накопичену температуру вище 25 °С на висоті 2 м, середньорічну швидкість вітру та карту накопичених річних опадів з набору даних ERA5-Land. В даному дослідженні для визначення придатності територій також використовувалися карти рельєфу, що містять інформацію про висоти, схили та затіненість місцевості з проєкту Shuttle Radar Topography Mission (SRTM). Придатність територій визначається шляхом геопросторового аналізу методом зважених сум. За результатами досліджень побудовано карту придатності, яка відображає розподіл зон із різними коефіцієнтами придатності (від 0 до 1). Виявлено, що більша частина території України сприятлива для розміщення сонячних електростанцій. Майже половина країни (більш ніж 48 %) має середні показники придатності (0.3...0.4). Кращі умови для розміщення сонячних ферм спостерігаються у південних областях України. Отриману карту придатності територій використано для аналізу оптимальності розміщення вже побудованих найбільших сонячних електростанцій України. Для отримання локації цих енергетичних об’єктів ми використовували дані з Wikimapia. Загалом всі проаналізовані нами великі сонячні електростанції України розміщені в оптимальних територіях. Також дослідження показало, що деякі області, такі як Одеська, Полтавська, Харківська, Запорізька, Дніпропетровська, Донецька і Луганська, мають хороші показники придатності (0.3...0.4), проте використовуються не повністю. Ці області мають великий потенціал для майбутньої побудови потужних і продуктивних сонячних електростанцій.Документ Відкритий доступ Solar energy potential mapping in Ukraine through integration of GIS, remote sensing, and fuzzy logic(Associazione Italiana di Telerilevamento (AIT), 2024) Drozd, Sofiia; Kussul, NataliiaThe Green Deal strategic plan for the development of renewable energy until 2030 is ofparticular importance in the context of the restoration of Ukraine’s post-war energy infrastruc-ture. One of the key topics is the analysis of the possibilities of installing large solar powerplants in Ukraine. In this article, a multi-criteria analysis of the suitability of the territory ofUkraine is carried out on the basis of climatic, topographic and land use criteria. To assess landsuitability, criteria standardized using fuzzy logic with weights determined by experts throughthe method of pairwise comparisons were combined using a weighted sum model. Uponcompleting the study, a suitability map was generated, depicting zones with varying levels ofsuitability (ranging from 0 to 1) for solar power plant placement. It was found that more than35.68% of the country has average values of the suitability index (0.65–0.7), and approximately18.82% show high indicators (<0.7). Conditions are especially favorable in the south of Ukraine.Документ Відкритий доступ Improving spatial resolution of chlorophyll-a in the Mediterranean sea based on machine learning(ХАІ, 2024) Yailymov, Bohdan; Kussul, Nataliia; Henitsoi, Pavlo; Shelestov, AndriiThe objective of this study is to increase the spatial resolution of data on the level of chlorophyll-a in the Mediterranean Sea using satellite images and ground measurements. The goal of this study is to develop an information technology based on machine learning to create chlorophyll-a concentration maps with high spatial resolution for the pilot areas of the Mediterranean Sea. Traditional ground-based methods for measuring chlorophyll-a are time-consuming, expensive, and have limited spatial and temporal coverage. Therefore, satellite observations have become an effective tool for monitoring chlorophyll-a over large areas. Low spatial resolution satellite data such as GCOM-C/SGLI and Sentinel-3 OLCI allow measurements of chlorophyll-a concentration at the sea surface. However, these data have limited accuracy and spatial resolution, which creates challenges for monitoring local changes in coastal zones and small water areas. Tasks: to analyze available satellite data and ground-based measurements of chlorophyll-a for the Mediterranean Sea; to investigate the correlation between satellite data of different spatial resolutions and ground measurements; to select informative features from satellite data for building machine learning models; and to develop models for increasing the spatial resolution of chlorophyll-a based on regression and machine learning algorithms. Obtained results: information technology combining satellite data with ground measurements in the Google Earth Engine cloud platform is proposed; correlations between satellite measurements of chlorophyll-a and ground data are investigated; models based on Random Forest and Multilayer Perceptron with coefficients of determination up to 0.36 and correlation of 0.6 with test data are built; chlorophyll-a maps with a spatial resolution of 10 m are created for the pilot area near Cyprus. Conclusions. The developed information technology allows the effective combination of satellite data of different spatial resolutions and ground measurements to increase the accuracy and detail of chlorophyll-a maps in the Mediterranean Sea. Further research involves improving the preprocessing of satellite data, using more features, involving data from other regions, and applying more sophisticated machine learning models.Документ Відкритий доступ Automated detection and assessment of war-induced damage to agricultural fields using satellite imagery(Одеський національний технологічний університет, 2024) Kussul, N.; Drozd, S.; Yailymova, H.This paper introduces a methodology based on machine learning and remote sensing for detecting military-induced damages to agricultural lands in Ukraine using free Sentinel-2 satellite data. The most informative spectral bands (B2, B3) and vegetation indices (NDVI, GCI) were experimentallyselected for recognizing damaged fields through the Random Forest classification algorithm. Additionally, an anomaly detection method based on the estimation of deviations of pixel values from the mean within each field was applied to determine local damage in the identified affected fields. The proposed methodology demonstrated high classification accuracy with an f1-score of 0.87%, producer’s accuracy of 0.89%, user’s accuracy of 0.85, and sensitivity for detecting local damage. The developed anomaly detection method allows to recognize damage visible on the 10-meter pixel of the Sentinel-2 satellite, but does not identify small craters.Cloudiness of satellite images can significantly impair the accuracy of damage detection, and the method of local damage detection can respondto non-military anomaliesand requires careful selection of threshold coefficients for each field. The study conducted a comprehensive assessment of damages inflicted on Ukrainian agricultural fields during the period 2022-2023, revealing that a total of 1,544,952 hectares, equivalent to 5.72% of the total agricultural area, experienced damage. This included 509,107 ha of wheat, 114,302 ha of sunflower, 68,830 ha of maize, 4,029 ha of rapeseed, and 16,561 ha of other crops. The most affected regions were Donetsk, Zaporizhia, and Kherson oblasts. The comprehensive findings of this research provide valuable insights for monitoring the state of agriculture and formulating strategic plans for the recovery of agricultural resources amidst the ongoing military conflict.Документ Відкритий доступ Acceleration of computations in modelling of processes in complex objects and systems(Інститут загальної енергетики НАН України, 2024) Khaidurov, Vladyslav; Tatenko, Vadym; Lytovchenko,; Tsiupii, Tamara; Zhovnovach, TetianaThe development of methods of parallelization of computing processes, which involve the decomposition of the computational domain, is an urgent task in the modeling of complex objects and systems. Complex objects and systems can contain a large number of elements and interactions. Decomposition allows you to break down a system into simpler subsystems, which simplifies the analysis and management of complexity. By dividing the calculation area of the part, it is possible to perform parallel calculations, which increases the efficiency of calculations and reduces simulation time. Domain decomposition makes it easy to scale the model to work with larger or more detailed systems. With the right choice of decomposition methods, the accuracy of the simulation can be improved, since different parts of the system may have different levels of detail and require appropriate methods of additional analysis. Decomposition allows the simulation to be distributed between different participants or devices, which is relevant for distributed systems or collaborative work on a project. In this work, mathematical models are built, which consist in the construction of iterative procedures for "stitching" several areas into a single whole. The models provide for different complexity of calculation domains, which makes it possible to perform different decomposition approaches, in particular, both overlapping and non-overlapping domain decomposition. The obtained mathematical models of subject domain decomposition can be applied to objects and systems that have different geometric complexity. Domain decomposition models that do not use overlap contain different iterative methods of "stitching" on a common boundary depending on the types of boundary conditions (a condition of the first kind is a Dirichlet condition, or a condition of the second year is a Neumann condition), and domain decomposition models with an overlap of two or more areas consist of the minimization problem for constructing the iterative condition of "stitching" areas. It should be noted that the obtained models will work effectively on all applied tasks that describe the dynamic behavior of objects and their systems, but the high degree of efficiency of one model may be lower than the corresponding the degree of effectiveness of another model, since each task is individual.Документ Відкритий доступ Методи машинного навчання для моніторингу навколишнього середовища(2024) Мікава, Поліна Віталіївна; Яйлимов, Богдан ЯлкаповичУ роботі запропоновано комплексний підхід до виявлення звалищ, який має дві основні складові. Перша базується на класифікації часових рядів мультиспектральних супутникових даних з використанням ансамблю ней-ронних мереж. Друга використовує модифіковану архітектуру U-Net для семантичної сегментації космічних знімків з метою безпосереднього виді-лення звалищ. Новизна представленого рішення полягає у використанні комбінованої функції втрат при навчанні моделі U-Net, що поєднує бінарну крос-ентропію та коефіцієнт Dice. Бінарна крос-ентропія забезпечує надій-ну попіксельну класифікацію, тоді як коефіцієнт Dice оптимізує сегмента-цію шляхом максимізації перетину між прогнозованими та істинними мас-ками звалищ. Ця комбінація дозволяє досягти балансу між точністю кла-сифікації та чутливістю до малих об’єктів, що важливо для виявлення звалищ за супутниковими даними. Запропоновано інтегрувати результати двох підходів на рівні прийняття рішень за допомогою ймовірнісного злит-тя з використанням ймовірностей кожної моделі. Такий гібридний метод дозволяє компенсувати недоліки кожного методу та підвищити загальну точність ідентифікації звалищ. Експериментальна перевірка на тестових да-них продемонструвала ефективність розглянутого підходу. Загальна точність класифікації земного покриву склала 97,4%, а точність визначення зва-лищ—86,4%. Розроблений метод застосовано для картографування звалищ на території Донецької області. Результати верифіковано експерта-ми на місцевості. Отримані дані можуть бути використані місцевою вла-дою для оперативного реагування та прийняття управлінських рішень.Документ Відкритий доступ Comparative analysis of classification techniques for topic-based biomedical literature categorisation(Frontiers Media S.A., 2023) Stepanov, Ihor; Ivasiuk, Arsentii; Yavorskyi, Oleksandr; Frolova, AlinaIntroduction: Scientific articles serve as vital sources of biomedical information, but with the yearly growth in publication volume, processing such vast amounts of information has become increasingly challenging. This difficulty is particularly pronounced when it requires the expertise of highly qualified professionals. Our research focused on the domain-specific articles classification to determine whether they contain information about drug-induced liver injury (DILI). DILI is a clinically significant condition and one of the reasons for drug registration failures. The rapid and accurate identification of drugs that may cause such conditions can prevent side effects in millions of patients. Methods: Developing a text classification method can help regulators, such as the FDA, much faster at a massive scale identify facts of potential DILI of concrete drugs. In our study, we compared several text classification methodologies, including transformers, LSTMs, information theory, and statistics-based methods. We devised a simple and interpretable text classification method that is as fast as Naïve Bayes while delivering superior performance for topic-oriented text categorisation. Moreover, we revisited techniques and methodologies to handle the imbalance of the data. Results: Transformers achieve the best results in cases if the distribution of classes and semantics of test data matches the training set. But in cases of imbalanced data, simple statistical-information theory-based models can surpass complex transformers, bringing more interpretable results that are so important for the biomedical domain. As our results show, neural networks can achieve better results if they are pre-trained on domain-specific data, and the loss function was designed to reflect the class distribution. Discussion: Overall, transformers are powerful architecture, however, in certain cases, such as topic classification, its usage can be redundant and simple statistical approaches can achieve compatible results while being much faster and explainable. However, we see potential in combining results from both worlds. Development of new neural network architectures, loss functions and training procedures that bring stability to unbalanced data is a promising topic of development.Документ Відкритий доступ Метод виявлення пошкоджень земної поверхні внаслідок воєнних дій за допомогою супутникових даних(Інститут космічних досліджень НАНУ та НКАУ, 2023) Мікава, Поліна Віталіївна; Дрозд, Софія ЮріївнаМісцевість, яка стала ареною активних воєнних дій, зазнає значних пошкоджень у результаті бойових зіткнень та артилерійських обстрілів. Зокрема, ураження родючих земель робить їх непридатними для використання. Внаслідок цього виникає і стає все більш нагальним питання відновлення територій. Сьогодні розробляється багато проєктів по відновленню як інфраструктури, так і самої земної поверхні. Значна частина таких проєктів ініціюється іноземними партнерами та активно підтримується ними фінансово. Створення ефективного механізму відновлення потребує актуальної інформації щодо площі та ступеня пошкоджень території. Через постійну загрозу обстрілів загальна безпекова ситуація в країні нестабільна, а більша частина пошкоджених територій розташована безпосередньо поруч з лінією фронту. З огляду на це актуальною є розробка методів аналізу земної поверхні, що базуються на інформації, отриманій віддалено. Одним з джерел такої інформації можуть бути дані місії Sentinel-2. У роботі розглянуто метод виявлення та аналізу пошкоджень території на основі розрахунків та порівнянь індексу рослинності NDVI. Інформація оцінюється протягом певного часового відрізку, розділеного на двотижневі періоди. Найпоширенішими серед пошкоджень виявилися воронки, утворені внаслідок обстрілів та вибухів, вигорілі поля та сліди військової техніки.Документ Відкритий доступ Assessing damage to agricultural fields from military actions in Ukraine: An integrated approach using statistical indicators and machine learning(2023) Kussul, Nataliia; Drozd, Sofiia; Yailymova, Hanna; Shelestov, Andrii; Lemoine, Guido; Deininger, KlausThe ongoing full-scale Russian invasion of Ukraine has led to widespread damage of agricultural lands, jeopardizing global food security. Timely detection of impacted fields enables quantification of production losses, guiding recovery policies and monitoring military actions. This study presents a robust methodology to automatically identify agricultural areas damaged by wartime ground activities using free Sentinel-2 satellite data. The 10 m resolution spectral bands and vegetation indices are leveraged, alongside their statistical metrics over time, as inputs to a Random Forest classifier. The algorithm efficiently pinpoints damaged fields, with accuracy metrics around 0.85. Subsequent anomaly detection delineates damages within the fields by combining spectral bands and indices. Applying the methodology over 22 biweekly periods in 2022, approximately 500 thousand ha of cropland across 10 regions of Ukraine were classified as damaged, with the most significant impacts occurring from March to September. The algorithm provides updated damage information despite cloud cover and vegetation shifts. The approach demonstrates the efficacy of automated satellite monitoring to assess agricultural impacts of military actions, supporting recovery analysis and documentation of war crimes.Документ Відкритий доступ Дослідження представлення багаточасткових графів за допомогою топологічного аналізу даних(2023) Яворський, Олександр; Куссуль, НаталіяРозглянуто проблему представлення багаточасткових графів для задач машинного навчання (МН) на графах за допомогою методів топологічного МН, зокрема шляхом обчислення персистентних гомологій (ПГ) хмар точок. Розглянуто також векторні представлення графів, отриманих за допомогою білінійних моделей та моделей трансляції, серед яких є модель тензорної декомпозиції TuckeR і моделі зсуву MurE та PairRE. Взято до уваги як повністю експресивні моделі, так і моделі з недоведеним рівнем експресивності. Як приклад багаточасткового графу обрано граф, що має 271 тип вершин та два типи ребер. Обчислення ПГ проведено для кожної моделі. Отримані представлення розбито на два окремих класи. Перший складається лише з векторних представлень вершин, а другий має представлення як вершин, так і одного з типів ребер. Для обох класів обраховано ПГ з максимальним виміром 2, що покриває 1-, 2- та 3-вимірні дірки. Для представлення ПГ обрано персистентні діаграми. Після цього точки отриманих діаграм використано для статистичного аналізу за допомогою обчислення значень коефіцієнтів ексцесу, асиметрії, відхилення та середнього. Дані статистичні характеристики обраховано як для самих моделей, так і для модулів їхніх різниць. Основна мета роботи полягає в тому, аби показати, що різні моделі представлень мають різні характеристики з точки зору ПГ, що вказує на те, що самі моделі не є топологічно еквівалентними, а тому їх вибір принципово впливає на якість та точність вивчення представлень багаточасткових графів. Даний результат досягається шляхом порівняння вищезазначених статистичних параметрів, а також гістограм середніх значень отриманих векторів.Документ Відкритий доступ Модель оцінки якості повітря за супутниковими даними на основі методу групового урахування аргументів(2023) Хайдуров, Владислав; Яйлимов, Богдан; Шелестов, АндрійУ роботі представлено математичну модель на основі методу групового урахування аргументів (МГУА) для оцінки даних про якість повітря на рівні землі за допомогою супутникових спостережень. Забруднення повітря є серйозною екологічною проблемою, яка має значний вплив на екосистеми, здоров’я людини та зміну клімату. Наземні мережі моніторингу якості повітря забезпечують прямі вимірювання рівня забруднення, але у багатьох регіонах світу обмежені кількістю станцій. Супутникове дистанційне зондування пропонує нові можливості для послідовного та детального моніторингу якості повітря як доповнення до наземних спостережень. Однак існують певні обмеження, включно з низьким просторовим розрізненням супутникових даних, невизначеностями вимірювань і низькою частотою зйомки. У цьому дослідженні розроблено модифіковану модель МГУА для співставлення даних супутникових спостережень з наземними даними про якість повітря для дрібних твердих частинок (PM2,5) і твердих частинок розміром менше 10 мк (PM10) у місті Києві, Україна. Модель оптимально реконструює нелінійні функціональні залежності між часовими рядами супутникових і наземних змінних, одночасно оптимізуючи загальну складність моделі. Проведено кілька обчислювальних експериментів на реальних наборах даних. Результати показали сильну кореляцію між прогнозованими та емпірично спостережуваними значеннями на незалежному 25 %-му тестовому зразку (досягнуто 0,8889 для PM2,5). Для оптимізованої моделі МГУА вимагалось у 2–3 рази менше параметрів, ніж для порівнюваної архітектури нейронної мережі, щоб досягти того самого рівня точності. Це демонструє здатність запропонованого підходу точно оцінювати концентрації забруднення на рівні землі з високою роздільною здатністю на основі супутникових даних, використовуючи МГУА-моделювання. Розроблена модель надає більш повну просторово-часову картину розподілу забруднення для значного покращення можливостей моніторингу навколишнього середовища, інформування громадськості та підтримки науково обґрунтованих політичних рішень щодо стратегій пом’якшення впливу забруднення на довкілля. У дослідженні підкреслюється, що злиття супутникових і наземних даних за допомогою моделювання МГУА дозволяє значно удосконалити можливості оцінки якості повітря, щоб краще зрозуміти дрібномасштабну динаміку забруднення, захистити населення та розробити ефективні рішення для захисту навколишнього середовища.Документ Відкритий доступ Quantifying War-Induced Crop Losses in Ukraine in Near Real Time to Strengthen Local and Global Food Security(Elsevier Ltd, 2023) Deininger, Klaus; Ali, Daniel Ayalew; Kussul, Nataliia; Shelestov, Andrii; Lemoine, GuidoWe use a 4-year panel (2019–2022) of 10,125 village councils in Ukraine to estimate effects of the war started by Russia on area and expected yield of winter crops aggregated up from the field level. Satellite imagery is used to provide information on direct damage to agricultural fields; classify crop cover using machine learning; and compute the Normalized Difference Vegetation Index (NDVI) for winter cereal fields as a proxy for yield. Without conflict, winter crop area would have been 9.35 rather than 8.38 million ha, a 0.97 million ha reduction, only 14% of which can be attributed to direct conflict effects. The estimated drop associated with the conflict in NDVI for winter wheat, which is particularly pronounced for small farms, translates into an additional reduction of output by about 1.9 million tons for a total of 4.84 million tons. Taking area and yield reduction together suggests a war-induced loss of winter wheat output of up to 17% assuming the 2022 winter wheat crop was fully harvested.Документ Відкритий доступ Fire Danger Assessment Using Moderate-Spatial Resolution Satellite Data(MDPI, 2023) Kussul, Nataliia; Fedorov, Oleh; Yailymov, Bohdan; Pidgorodetska, Liudmyla; Kolos, Liudmyla; Yailymova, Hanna; Shelestov, AndriiFire is one of the most common disturbances in natural ecosystems. The analysis of various sources of information (official and unofficial) about the fires in Ukraine (2019–2020) showed a lack of timely and reliable information. Satellite observation is of crucial importance to provide accurate, reliable, and timely information. This paper aims to modify the index of fire danger of a forest’s FWI by increasing its precision, based on the use of higher spatial resolution satellite data. A modification of the FWI method involves the utilization of the soil moisture deficit, in addition to the six subindices of the FWI system. In order to calculate the subindices values, weather data from the Copernicus Atmosphere Monitoring Service were used. Soil moisture deficit is calculated using Sentinel-1 radar satellite data on the water saturation degree of the soil surface layer and geospatial parameters from the 3D Soil Hydraulic Database of Europe. The application of the proposed methodology using the specified satellite, weather, and geospatial data makes it possible to assess fire danger on a continental scale with a spatial resolution of 250 m, 1 km, and a daily temporal resolution. Validation of the proposed method for modifying the FWI system demonstrates an improvement in the precision and relevance of fire danger prediction.Документ Відкритий доступ Метод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанні(Інститут кібернетики ім. В.М. Глушкова НАН України, 2023) Охріменко, Антон Олександрович; Куссуль, Наталія МиколаївнаРозглядається проблема неоднозначності в задачах класифікації в області ма-шинного навчання. Задача класифікації полягає у навчанні моделі відрізняти екземпляри даних, що належать різнимклас ам. Однак можливі ситуації, коли правильна класифікація певної множини екземплярів даних складнаабо навіть неможлива, незалежно від складності моделі машинного навчання.Запропоно-вано метод та алгоритм виявлення таких неоднозначних екземплярів даних, щобазу ються на використанні методу найближчого сусіда та аналізу класів екзе-мплярів даних, розташованих поряд у просторі ознак, та дозволяютьвиділити підмножину неоднозначних екземплярів даних, що можуть негативно впливатина процес навчання моделі класифікації.З метою демонстрації практичного за-стосування алгоритму проведено експеримент на чотириканальному супутни-ковому композиті, що використовується для попіксельної класифікації сільсь-когосподарських культур. Визначено відсоток ненадійних даних загалом та окремо для кожної культури. Одним з основних результатів дослідження є мо-жливість використання запропонованого алгоритму під час конструювання да-тасету(набору даних, dataset) для навчання моделі класифікації.Віндопомагає виявити потенційно проблемні екземпляри даних та забезпечити якість вхідно-го набору даних. Крім того, розглянуто можливості застосування алгоритму після процесу навчання моделі привикористаннів операційному режимі. Ви-явлення неоднозначних екземплярів може допомогти знайти потенційні поми-лки класифікації та покращити результати роботи моделі.Представлений ал-горитм може стати важливим інструментом для дослідника впродовж повного циклу розробки моделі машинного навчання, починаючи від підготовки даних для навчання і закінчуючи її практичним впровадженням. Його застосування скороч уватиме часна отримання якісних навчальних даних, покращуватимеметрикикласифікації та забезпечуватимебільш надійнірезультатиу задачах машинного навчання.Документ Відкритий доступ Google Earth Engine Framework for Satellite Data-Driven Wildfire Monitoring in Ukraine(MDPI, 2023-10) Yailymov, Bohdan; Shelestov, Andrii; Yailymova, Hanna; Shumilo, LeonidWildfires cause extensive damage, but their rapid detection and cause assessment remains challenging. Existing methods utilize satellite data to map burned areas and meteorological data to model fire risk, but there are no information technologies to determine fire causes. It is crucially important in Ukraine to assess the losses caused by the military actions. This study proposes an integrated methodology and a novel framework integrating burned area mapping from Sentinel-2 data and fire risk modeling using the Fire Potential Index (FPI) in Google Earth Engine. The methodology enables efficient national-scale burned area detection and automated identification of anthropogenic fires in regions with low fire risk. Implemented over Ukraine, 104.229 ha were mapped as burned during July 2022, with fires inconsistently corresponding to high FPI risk, indicating predominantly anthropogenic causes.Документ Відкритий доступ Аналіз часових рядів супутникових даних для моніторингу стану лісів(Інститут кібернетики ім. В. М. Глушкова НАН України, 2023) Гордійко, Наталія; Яйлимова, ГаннаСистеми на основі сучасних інтелектуальних технологій сенсорного тасупутникового моніторингу здатні відстежувати та контролювати віддалені території навколишнього середовища в реальному часі та сприяють шви д-кому реагуванню на його зміни, перш ніж це стане проблемою. Вони дозволяютьефективніше використовувати наявні ресурси, оскільки дані можна відстежувати та контролювати віддалено, без необхідності фізичного доступу. Сучасні супутниковідатчики дозволяють отримати зображення об’єктів земної поверхні з високою роздільною здатністю, що дозволяє створювати детальні карти навколишнього середовища Землі та робить космічний моніторинг потужним та ефективним інструментом як аналізу клі матичнихзмін, екологічних катастроф та глобального впливу людської діяльності на стан екосистем, так і їхнього попередження. В даній роботі досліджуються та визнач аютьсянайбільш інформативніспектральніканал исупутника Sentinel-2 з метою їхнього подальшого аналізу в процесі су- путникового моніторингу пошкоджених лісів. Сформ ован одослідницькийнаб ірданих безхмарних супутникових знімків (тестового датасету (набору даних) по території Франції) у вигляді часового ряду супутникових знімків для дистанційного моніторингу лісових ділянок (до та після пошкоджен-ня). Отриманий набір безхмарних супутникових знімків складається з 5573зо-бражень. На прикладі вегетаційного індексу NDVIперевірена гіпотеза щодо зменшення його середнього значення та зростання йогостандарт-ного відхилення при появі на певній ділянці хвойного лісу пошкодження (захворювання чи засихання). Отримані результати можуть використо-вуватисяпри машинному навчанні алгоритмів класифікації пошкодже-них лісів.Дослідження проводилось відповідно донаукових цілей єв-ропейського проєкту «Satellites for Wilderness Inspection and Forest ThreatTracking» (SWIFTT)Документ Відкритий доступ Generative adversarial network augmentation for solving the training data imbalance problem in crop classification(2023) Shumilo, Leonid; Okhrimenko, Anton; Kussul, Nataliia; Drozd, Sofiia; Shkalikov, OlehDeep learning models offer great potential for advancing land monitoring using satellite data. However, they face challenges due to imbalanced real-world data distributions of land cover and crop types, hindering scalability and transferability. This letter presents a novel data augmentation method employing Generative Adversarial Neural Networks (GANs) with pixel-to-pixel transformation (pix2pix). This approach generates realistic synthetic satellite images with artificial ground truth masks, even for rare crop class distributions. It enables the creation of additional minority class samples, enhancing control over training data balance and outperforming traditional augmentation methods. Implementing this method improved the overall map accuracy (OA) and intersection over union (IoU) by 1.5% and 2.1%, while average crop type classes’ user accuracy (UA) and producer accuracies (PA), as well as IoU, were improved by 11.2%, 6.4% and 10.2%.Документ Відкритий доступ Оцінка цілей сталого розвитку в межах Європейської дослідницької мережі (ERA-PLANET)(Інститут кібернетики ім. В. М. Глушкова НАН України, 2023) Куссуль, Наталія; Шелестов, Андрій; Яйлимов, Богдан; Федоров, Олег; Яйлимова, Ганна; Скакун, Сергій; Шуміло, Леонід; Колос, Людмила; Дякун, ОлексійЦілі сталого розвитку (ЦСР), також відомі як глобальні цілі, прийняті Організацією Об’єднаних Націй у 2015 р. як універсальний заклик до дій щодо подолання бідності, захисту планети, забезпечення миру та покращення якості життя всіх людей до 2030 р. Цілі розвитку спрямовані на те, щоб до 2030 р. покінчити з усіма формами голоду, щоб усі люди отримували достатню кількість поживної їжі протягом усього року. Це сприятиме сталому сільському господарству, підтримці дрібних фермерів і рівному доступу до землі, технологій і ринків. Окрім цього, важливо вжити термінові заходи, щоб зменшити втрату природних середовищ існування та біорізноманіття, які є частиною нашої спільної спадщини та підтримують глобальну продовольчу та водну безпеку, пом’якшують наслідки зміни клімату та адаптацію до них, а також забезпечують мир і безпеку. Задля розвитку цього напрямку в Україні, в межах Європейського проєкту ERA-PLANET програми Horizon 2020 «Європейська мережа для дослідження нашої планети», використовуються дані спостереження Землі та супутникові дані для моніторингу ефективності використання природних ресурсів, а також для оцінки прогресу в досягненні ЦСР. У даному дослідженні розроблені технології обрахунку трьох конкретних індикаторів, а саме: 2.4.1. «Частка сільськогосподарських площ з продуктивним і сталим сільським господарством»; 15.1.1 «Площа лісів як частка загальної площі земного покриву»; 15.3.1 «Частка землі, яка деградувала відносно загальної площі земного покриву». Основна проблема, яку вирішують автори для території України, пов’язана з відсутністю якісних наборів даних, їх низьким просторовим розрізненням і меншою точністю порівняно з регіональними продуктами. Запропоновано нову вдосконалену методологію для обчислення карти продуктивності землі на основі супутникових даних високого просторового розрізнення.Документ Відкритий доступ Інтелектуальні методи та моделі обробки супутникових даних у задачі моніторингу звалищ(Проблем и керування та інформатики, 2022) Yailymova, Hanna; Yailymov, Bohdan; Shelestov, Andrii; Krasilnikova, Tetiana