Human Eye Aberrometry Data Generation Using Generative Adversarial Neural Network
dc.contributor.author | Yaroshenko, M. O. | |
dc.date.accessioned | 2024-03-15T10:33:43Z | |
dc.date.available | 2024-03-15T10:33:43Z | |
dc.date.issued | 2023 | |
dc.description.abstract | It’s obvious that for development and improvement of methods and apparatus for diagnosis and treatment of optical flaws of human eye at the modelling stage, it’s necessary to have sets of real measurements. However, data requests to clinics are accompanied by substantial amount of bureaucracy procedures and, at the same time, acquired dataset may be too small, which can be critical, for example, for training of neural networks. According to the analysis of existing publications, publicly available datasets of aberrometry data (sets of eye’s refractive flaws) are rare and consist of relatively low number of measurements. But, due to current development state of neural networks, it is possible to generate data based on real measurements. The most common solutions are methods based on the usage of the Generative Adversarial Networks (GAN). This tendency is also relevant for the modern ophthalmology, but no publications aimed at aberrometry data synthesis were found. For this reason, objective of this work is development of solution for generation of sets of human eye’s refractive errors using neural networks. Proposed solution includes generator and critic networks trained according to the Wasserstein GAN with Gradient Penalty (WGAN GP) algorithm. In order to improve training, the method of data augmentation called Data Augmentation Optimized for GAN (DAG) was used, moreover, the possibility of augmentation of aberrometry data in two forms was implemented — for both Zernike coefficient vectors and wavefront pixel images. According to the result’s evaluation, generated data has the distribution close to the real sample (Fréchet distance equals 0.7) and, at the same time, it is neither a copy of real measurements (92% creativity rate) nor duplication of a few aberration sets (diversity metric equals 3.64 which is close to the optimal 3.83). The direction of further improvement includes enhancement of existing architectures of generator and critic, search or creation of bigger training dataset and refinement of data augmentation technics. | |
dc.description.abstractother | Отримання медичних даних для статистичних досліджень, розробки нових методів лікування та відповідного обладнання є процесом, який супроводжується великою кількістю бюрократичних процедур, а обсяг отриманої вибірки може виявитись недостатнім. Остання проблема особливо актуальна для розробки методів на основі штучних нейронних мереж. Анонімізовані вибірки медичних даних у відкритому доступі є нечисленними, причому серед них зазвичай не представлені певні специфічні дослідження. Ці фактори також є релевантними для аберацій — оптичних похибок людського ока. Дійсно, аналіз існуючих публікацій демонструє вкрай малу кількість датасетів з аберометричною інформацією, в той час як більший інтерес для наукової спільноти становить обробка офтальмологічних зображень. Діагностику для визначення аберацій високих порядків роблять нечасто, тому для отримання великих обсягів даних необхідно запроваджувати кампанії для діагностики населення, що може бути затратним з точки зору часу та коштів. Іншим способом є використання існуючих методів генерації даних, таких як генеративні змагальні нейронні мережі (Generative Adversarial Neural Networks, GAN). Втім, їхнє навчання є нестабільним і, за малих обсягів даних, виникає ризик перенавчання. Більш стабільний вид GAN — Wasserstein GAN (WGAN) — використовує інший підхід до визначення функцій втрат та жорстке обмеження ваг під час оптимізації. Однак він також має недоліки: наприклад, обмеження ваг вимагає додаткових зусиль на підбір порогового значення, бо в іншому випадку існує ризик вибуху або зникнення градієнтів. Недоліки WGAN усунуто додаванням градієнтного штрафу (Gradient Penalty, GP). Незважаючи на високу стабільність навчання WGAN GP, розмір навчаючої вибірки також грає важливу роль в підготовці мережі. З метою його нарощування, що є актуальним для нечисельних навчаючих вимірювань, використовуються методи аугментації даних — утворення нових примірників шляхом застосування до них нескладних перетворень. Однак звичайне застосування аугментації даних при навчанні GAN не є припустимим через інтеграцію цих перетворень у згенеровані примірники. Одним з методів навчання GAN, які дозволяють використання аугментації даних, є Data Augmentation Optimized for GAN (DAG). Незважаючи на те, що більшість архітектур GAN та супутніх методів навчання та нарощування даних описані для роботи з інформацією у вигляді зображень, це не є перепоною у їхньому застосуванні до вирішення задачі генерації аберометричних даних, адже така інформація може бути представлена у двох формах — вектори коефіцієнтів та піксельні зображення хвильових фронтів. Таким чином, задачею даної роботи є розробка методу генерації аберометричних даних на базі WGAN GP із застосуванням DAG. Запропоноване рішення є WGAN GP оригінальної архітектури, для навчання якої використовувались методи нарощування даних як для графічної форми хвильових фронтів, так і для векторів коефіцієнтів Церніке. Аналіз результату генерації за спеціалізованими метриками спадковості, творчості та різноманіття показав, що запропоноване рішення здатне синтезувати дані, що є схожими на реальні (відстань Фреше дорівнює 0.7), і, які, водночас, не копіюють реальні вимірювання (метрика креативності на рівні 92%), та не мають великої кількості самоповторів (значення метрики різноманіття має значення 3.64, що близько до оптимально 3.83). Подальші дослідження можуть бути напрямлені на використання більш досконалих архітектур штучних нейронних мереж, засобів аугментації даних для GAN та пошук або створення більших навчаючих вибірок. | |
dc.format.pagerange | С. 286366.1-286366.8 | |
dc.identifier.citation | Yaroshenko, M. O. Human Eye Aberrometry Data Generation Using Generative Adversarial Neural Network / M. O. Yaroshenko // Мікросистеми, Електроніка та Акустика : науково-технічний журнал. – 2023. – Т. 28, № 3(125). – С. 286366.1-286366.8. – Бібліогр.: 23 назв. | |
dc.identifier.doi | https://doi.org/10.20535/2523-4455.mea.286366 | |
dc.identifier.orcid | 0000-0002-3092-3856 | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/65555 | |
dc.language.iso | en | |
dc.publisher | КПІ ім. Ігоря Сікорського | |
dc.publisher.place | Київ | |
dc.relation.ispartof | Мікросистеми, Електроніка та Акустика : науково-технічний журнал, 2023, Т. 28, № 3(125) | |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
dc.subject | Ophthalmology | |
dc.subject | Generative adversarial networks | |
dc.subject | Data augmentation | |
dc.subject | офтальмологія | |
dc.subject | генеративні змагальні мережі | |
dc.subject | аугментація даних | |
dc.subject.udc | 617.753+004.825 | |
dc.title | Human Eye Aberrometry Data Generation Using Generative Adversarial Neural Network | |
dc.title.alternative | Генерування аберометричних даних шляхом застосування генеративнозмагальної нейронної мережі | |
dc.type | Article |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- 286366.1-286366.8.pdf
- Розмір:
- 1.04 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: