Комбінація локальної порогової бінаризації та машинного навчання для класифікації пухлин молочної залози

dc.contributor.authorДобровська, Людмила Миколаївна
dc.contributor.authorБабенко, Віталій Олегович
dc.contributor.authorІванченко, Аліна Сергіївна
dc.date.accessioned2023-02-21T14:58:25Z
dc.date.available2023-02-21T14:58:25Z
dc.date.issued2022
dc.description.abstractenEarly diagnosis of breast cancer is of great importance, as this pathology is one of the most common causes of mortality among women around the world. Invasive ductal carcinoma is the most dangerous subtype of breast cancer. Typically, pathologists focus on areas with similar carcinoma, as this allows an aggressiveness score to be assigned to the entire mount specimen. That is why the automated detection of carcinoma in the diagnosis of cancerous tumors of the mammary gland is an important task. The purpose of this work was to establish the main stages of building diagnostic algorithms for the classification of the type of breast cancer tumor based on the analysis of histological images. For this, an algorithm was proposed based on the local threshold binarization method (for extracting informative features from medical images) and machine learning (building breast cancer tumor type recognition models using classification methods). The database of histological images used for the study was taken from the open-source Kaggle, an online resource for running machine learning competitions. Before performing the first stage of the research, which consisted of the application of the local threshold binarization algorithm, the sample of images was divided into working (75%), for model training, and examination (25%), which did not participate in any experiments until obtaining the resulting model. The second stage of the research consisted in obtaining such informative features as duets (combinations of two pixels) and trios (combinations of three pixels). They are calculated after applying the proposed binarization method. Models of the following classification algorithms were built based on these features: group method of data handling, logistic regression, naive Bayesian classifier, the method of k nearest neighbors, and random forest method. The result of the modeling is 10 classification models, the best of which was the k-nearest neighbors model, trained on binarized pixel pairs. This model gave 78.5% classification accuracy on the exam sample, the sensitivity value was 0.803, and the specificity value was 0.767.uk
dc.description.abstractukРання діагностика раку молочної залози має колосальне значення, оскільки дана патологія є одним із найбільш розповсюджених чинників летальності серед жінок по всьому світу. Чи не небезпечнішим підтипом раку молочної залози вважається інвазивна протокова карцинома. Зазвичай патологоанатоми фокусуються на областях з подібною карциномою, так як це дозволяє присвоїти оцінку агресивності усьому зразку монтування. Саме тому важливою задачею є автоматизоване виявлення карциноми при діагностиці ракових пухлин молочної залози. Мета даної роботи полягала у встановленні основних етапів побудови діагностичних алгоритмів класифікації типу ракової пухлини молочної залози на основі аналізу гістологічних знімків. Для цього було запропоновано алгоритм на основі методу локальної порогової бінаризації (для вилучення інформативних ознак з медичних зображень) та машинного навчання для (побудови моделей розпізнавання типу ракової пухлини молочної залози за допомогою методів класифікації). База гістологічних знімків, яка використовувалась для дослідження, була взята з відкритого джерела Kaggle, що є онлайн ресурсом для проведення змагань з машинного навчання. Перед виконанням першого етапу дослідження, який полягав у застосуванні алгоритму локальної порогової бінаризації, вибірку зображень було розбито на робочу (75%), для навчання моделей, та екзаменаційну (25%), яка не приймала жодної участі в експериментах аж до отримання результуючої моделі. Другий етап дослідження полягав у отриманні таких інформативних ознак як дуети (комбінації із двох пікселей) і тріо (комбінації із трьох пікселей). Вони розраховуються після застосування запропонованого методу бінаризації. На основі даних ознак були побудовані моделі наступних алгоритмів класифікації: метод групового урахування аргументів, логістична регресія, наївний Байєсівський класифікатор, метод k найближчих сусідів, а також метод випадкового лісу. Результатом моделювання є 10 моделей класифікації, найкращою з яких стала модель метода k найближчих сусідів, навчена на дуетах бінаризованих пікселей. Ця модель дала на екзаменаційній вибірці 78.5% точності класифікації, значення чутливості становило 0.803, специфічності – 0.767.uk
dc.format.pagerangeС. 40-47uk
dc.identifier.citationДобровська, Л. М. Комбінація локальної порогової бінаризації та машинного навчання для класифікації пухлин молочної залози / Добровська Людмила Миколаївна, Бабенко Віталій Олегович, Іванченко Аліна Сергіївна // Біомедична інженерія і технологія. – 2022. – № 8. – С. 40-47.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/52870
dc.language.isoukuk
dc.publisherКПІ ім.Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.sourceЖурнал Біомедична інженерія і технологія, № 8, 2022uk
dc.subjectштучний інтелектuk
dc.subjectновоутворення молочної залозиuk
dc.subjectкласифікаціяuk
dc.subjectобробка зображеньuk
dc.subjectмашинне навчанняuk
dc.subjectArtificial Intelligenceuk
dc.subjectBreast Neoplasmsuk
dc.subjectClassificationuk
dc.subjectImage Processinguk
dc.subjectMachine Learninguk
dc.subject.udc004.852 + 616-018uk
dc.titleКомбінація локальної порогової бінаризації та машинного навчання для класифікації пухлин молочної залозиuk
dc.typeArticleuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
BmT-2022-8_p40-47.pdf
Розмір:
429.1 KB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.1 KB
Формат:
Item-specific license agreed upon to submission
Опис: