2023
Постійне посилання на фонд
Переглянути
Перегляд 2023 за Ключові слова "004.8"
Зараз показуємо 1 - 5 з 5
Результатів на сторінці
Налаштування сортування
Документ Відкритий доступ Learning rate in the reinforcement learning method for unknown location targets searching system(КПІ ім. Ігоря Сікорського, 2023) Albrekht, Y.; Pysarenko, A.The article explores the dependence of the system learning rate on the number of mutually independent modules in the reinforcement learning method. The study defines an environment with two types of objects that bring points to the final score and uses Deep Q Learning algorithms with 36 input data and 5 possible outcomes to conduct the experiment. The goal is to determine the optimal number of objects for which the use of reinforcement learning will give the best result for the same number of iterations. The research is part of a solution to the problem of creating a drone flock control system to find the position of objects in an unknown area.Документ Відкритий доступ Preprocessing of audio data for voice transcription systems(КПІ ім. Ігоря Сікорського, 2023) Drahan, M.; Pysarenko, A.Voice messages are currently a powerful data collection tool. The aim of the study is to speed up the transcription of audio files. To achieve the goal, it is suggested to use a bandpass filter with a lower passband frequency in the range of 150-200 Hz and an upper passband frequency in the range of 3500-7000 Hz. The success of the system is based on the selection of the filter that optimally speeds up the transcription of audio files.Документ Відкритий доступ Unknown location targets searching system in known environment using reinforcement learning(КПІ ім. Ігоря Сікорського, 2023) Albrekht, Y.; Pysarenko, A.This article investigates two different approaches to searching for objects of a certain type in a known environment: with a centrally controlled system using individual modules that transmit information and by dividing the entire search area into smaller ones and using individual objects. The article conducts experiments using reinforcement learning algorithms to compare the learning speed and capabilities of a system with search modules and centralized control and a separate object to search for static objects with random locations in a known environment and to search for objects moving at a constant speed in a known environment. The article provides detailed information about the experimental design, including the definition of the parameters for reinforcement learning and the size of the input and output data for the neural network. The results of the experiments are presented graphically, demonstrating the effectiveness of reinforcement learning and the difference in the learning speed and capabilities of the two systems under study.Документ Відкритий доступ Вплив зменшення розмірів нейронної мережі на її здатність до узагальнення(КПІ ім. Ігоря Сікорського, 2023) Паладієв, О.; Лісовиченко, O.Предметом дослідження у даній роботі є вплив зменшення розмірів нейромережі на її узагальнюючі можливості. Об'єктом дослідження є різні конфігурації нейронмережевих моделей та їх параметри, такі як кількість нейронів у прихованому шарі та кількість незалежних ознак. Метою цієї роботи є дослідження впливу різних конфігурацій нейромережевих моделей, зокрема зменшення їх розмірів, на їхню здатність до узагальнення. Робота спрямована на визначення того, коли зменшення розмірів нейромережі призводить до покращення її здатності до узагальнення, і коли обмеження розмірів може заважати досягненню бажаної помилки на навчальних даних. Дослідження також має на меті встановлення оптимальних конфігурацій нейромережевих моделей для різних задач класифікації на основі впливу розміру мережі та кількості ознак на їхню здатність до узагальнення.Документ Відкритий доступ Застосування адаптованого алгоритму utility ai для групової взаємодії інтелектуальних агентів без обміну інформацією(КПІ ім. Ігоря Сікорського, 2023) Романенко, Л.Предметом дослідження є командна взаємодія інтелектуальних агентів на прикладі футболу. У статті описано результати застосування модифікованого алгоритму Utility AI для забезпечення командної взаємодії в умовах відсутності комунікації. Зроблено огляд та порівняння найбільш близьких рішень. Так в статті наведено розробки, що застосовуються в змаганнях «Drop-in player challenge» кубку RoboCup, дослідженнях мультиагентного навчання з підкріпленням університету Іллінойс та алгоритм жорсткої фіксації сценаріїв поведінки у випадку короткочасної втрати зв’язку. Коротко описаний алгоритм Utility AI, що застосовується переважно в ігрових застосунках для реалізації штучного інтелекту. Пропонується використання додаткових вагових коефіцієнтів алгоритмом для формування певної рольової поведінки. Також архітектура розділяється на два прошарки. Перший застосовує саме модифіковану версію Utility Ai для групової координації. Другий – дерево прийняття рішень для індивідуальної тактики. Тестування проводилися в симульованому середовищі футбольного поля – RoboCup. Продемонстровано поетапне трасування ігрового сценарію з наведеними у таблиці вихідними даними та відповідні їм прийняті рішення. Також наданий приклад детального розрахунку алгоритмом майбутньої дії відповідно до обстановки.