Секція 1. ПМА «Прикладна математика»
Постійне посилання зібрання
Переглянути
Перегляд Секція 1. ПМА «Прикладна математика» за Ключові слова "519.688:004.89"
Зараз показуємо 1 - 1 з 1
Результатів на сторінці
Налаштування сортування
Документ Відкритий доступ Вплив величини популяції при використанні машинного навчання з підкріпленням на показники швидкості навчання(КПІ ім. Ігоря Сікорського, 2022) Олефір, О. С.; Галюк, Є. І.; Ковальчук-Хімюк, Л. О.Навчання з підкріплення є одним із різновидів машинного навчання. Агент потрапляє у середовище, в якому потрібно приймати певні рішення для досягнення найкращого результату. Таке навчання спирається на виконанні дій, для отримання за них позитивних чи негативних відгуків для агента, а також передачі найкращих результатів новим поколінням. При цьому в агентів розвивається так звана “інтуїція”, яка допомагає як можна скоріше реагувати на отримані з навколишнього середовища чинників, та обирати правильну послідовність дій у тій чи іншій ситуації.