Investigation of Lung Sounds Features for Detection of Bronchitis and COPD Using Machine Learning Methods

dc.contributor.authorPorieva, H. S.
dc.contributor.authorIvanko, K. O.
dc.contributor.authorSemkiv, C. I.
dc.contributor.authorVaityshyn, V. I.
dc.date.accessioned2022-02-17T15:12:35Z
dc.date.available2022-02-17T15:12:35Z
dc.date.issued2021
dc.description.abstractenThe study is dedicated to the issue of investigation of the lung sounds digital analysis processing methods, searching for new informative features of pathological respiratory sounds and using machine learning methods for classifying the state of the bronchopulmonary system. In particular, the use of various methods of lung sounds analysis is considered, namely: frequency, time-frequency, wavelet, and mel-frequency cepstral analysis. The application of signal processing methods to the problem of respiration signals analysis is considered in the paper. In order to investigate the possibilities of machine learning to the problem of classification of respiration signals, the dataset of lung sounds of 296 recordings, which represent 3 classes: norm, bronchitis, and chronic obstructive pulmonary disease, was used in this work. The purpose of this study is to identify and compare the informative features of the lung sounds obtained with different signal processing methods, as well as to choose the classification method that provides the highest accuracy in the identification of the bronchopulmonary system condition. To obtain frequency features, power spectrum density dependence on frequency was calculated for respiratory signals using fast Fourier transform method. The spectral measures, as well as ratios of spectrum powers in different frequency bands, were defined. To extract the spectral-temporal features of the lung sounds, the spectrograms of the analyzed signals were investigated. The mean time dependences of the power spectral density in the indicated frequency ranges were determined. The sum of magnitudes values of the power spectrum curve for each frequency band was used as the features obtained from the spectrogram. The ratios of the energies corresponding to detail levels of the wavelet decomposition to the total energy of the decomposed signal were used as the parameters of signal recognition based on wavelet analysis. The logarithmic (mel) filterbank energies, averaged over time frames, depending on channel index and time, as well as mel frequency cepstrum depending on cepstrum index and time, are proposed to use as features derived from mel-cepstral analysis. The supervised machine learning based on decision trees, discriminant analysis, support vector machines, logistic regression, knearest neighbors classifiers, and ensemble learning were applied to determine the best classification models for computerized disease screening. The accuracy of the different classifiers using these feature sets was determined and compared. Based on this, a combination of features and classifiers, which provides the highest accuracy of lung condition recognition, reaching 93%, is proposed.uk
dc.description.abstractruВ статье показана актуальность рассмотрения вопроса исследования методов цифрового анализа и обработки звуков легких, поиска новых информативных признаков патологических звуков легких и применения методов машинного обучения для классификации состояния бронхолегочной системы. В частности, в данном исследовании рассмотрено применение различных методов анализа звуков легких, а именно: частотного, частотно-временного, вейвлет и мел-частотного кепстрального анализа. С целью исследования возможности применения методов машинного обучения к проблеме классификации сигналов дыхания в работе использован набор данных звуков легких, состоящий из 296 сигналов, представляющих 3 класса: норма, бронхит и хроническая обструктивная болезнь легких (ХОБЛ). Целью данного исследования является сравнение информативных признаков звуков легких, полученных с помощью различных методов обработки сигналов, а также выбор методов классификации, обеспечивающих наиболее высокую точность идентификации состояния бронхолегочной системы. Для получения частотных признаков была рассчитана зависимость спектральной плотности мощности от частоты для сигналов звуков легких с использованием метода быстрого преобразования Фурье. Для каждого сигнала были рассчитаны спектральные показатели и отношения мощностей спектра в разных диапазонах частот. Для выделения спектрально-временных особенностей звуков легких были исследованы спектрограммы анализируемых сигналов. Определены средние временные зависимости спектральной плотности мощности в исследуемых диапазонах частот. В качестве признаков, полученных на основе спектрограммы, использовалась сумма значений спектральной плотности мощности для каждой полосы частот. В качестве параметров распознавания сигналов на основе вейвлет-анализа определены отношения энергий уровней детализации вейвлет-разложения к полной энергии исследуемого сигнала дыхания. В качестве признаков мел-кепстрального анализа предлагается использовать усредненные по временным фреймам логарифмические (мел) энергии банка фильтров, а также усредненный по временным фреймам мел-частотный кепстр. С целью построения лучших моделей классификации для компьютеризированного скрининга заболеваний лёгких было применено машинное обучение с учителем на основе деревьев решений, дискриминантного анализа, метода опорных векторов, логистической регрессии, классификаторов на основе метода k-ближайших соседей и ансамблевого обучения. Определена точность классификации сигналов дыхания для ряда классификаторов, использующих рассмотренные наборы признаков. Для построения моделей, обеспечивающих наиболее высокую точность распознавания состояния легких, предлагается лучшее сочетание информативных признаков звуков легких и методов машинного обучения.uk
dc.description.abstractukУ статтi показана актуальнiсть розгляду питання дослiдження методiв цифрового аналiзу i обробки звукiв легень, пошуку нових iнформативних ознак для розпiзнавання патологiчних звукiв легень i застосування методiв машинного навчання для класифiкацiї стану бронхолегеневої системи. Зокрема, в даному дослiдженнi розглянуто застосування рiзних методiв аналiзу звукiв легень, а саме: частотний, спектрально-часовий, вейвлет i мел-частотний кепстральний аналiз. З метою дослiдження можливостi застосування методiв машинного навчання до проблеми класифiкацiї дихальних сигналiв у роботi використано набiр даних звукiв легень з 296 сигналiв, якi представляють 3 класи: норма, бронхiт та хронiчне обструктивне захворювання легень (ХОЗЛ). Метою даного дослiдження є порiвняння iнформативних ознак звукiв легень, отриманих за допомогою рiзних методiв обробки сигналiв, а також вибiр методу класифiкацiї, що забезпечує найвищу точнiсть iдентифiкацiї стану бронхолегеневої системи. Для отримання частотних ознак розраховано залежнiсть спектральної густини потужностi вiд частоти для сигналiв звукiв легень з використанням методу швидкого перетворення Фур’є. Для кожного сигналу були розрахованi спектральнi показники та спiввiдношення потужностей спектру в рiзних дiапазонах частот. Для видiлення спектрально-часових особливостей звукiв легень були проаналiзованi спектрограми сигналiв дихання. Визначено середнi часовi залежностi спектральної густини потужностi в дослiджуваних дiапазонах частот. В якостi ознак, отриманих зi спектрограми використовувалася сума значень кривої спектральної густини потужностi для набору частотних смуг. У якостi параметрiв для розпiзнавання сигналiв дихання на основi вейвлет-аналiзу розраховано спiввiдношення енергiй рiвнiв деталiзацiї вейвлет-розкладу до повної енергiї аналiзованого сигналу. В якостi ознак мел-кепстрального аналiзу пропонується використовувати усередненi по часовим фреймам логарифмiчнi (мел) енергiї банку фiльтрiв, а також усереднений по часовим фреймам мел-частотний кепстр. З метою отримання кращих моделей класифiкацiї для комп’ютеризованого скринiнгу захворювань легень було застосовано машинне навчання з учителем на основi дерев рiшень, дискримiнантного аналiзу, методу опорних векторiв, логiстичної регресiї, класифiкаторiв на основi методу k-найближчих сусiдiв та ансамблевого навчання. Визначено та порiвняно точнiсть класифiкацiї сигналiв дихання для низки класифiкаторiв, що використовують розглянутi набори ознак. Для побудови моделей, що забезпечують найвищу точнiсть розпiзнавання стану легень, пропонується найкраще поєднання iнформативних ознак звукiв легень та методiв машинного навчання.uk
dc.format.pagerangeС. 78-87uk
dc.identifier.citationInvestigation of Lung Sounds Features for Detection of Bronchitis and COPD Using Machine Learning Methods / Porieva H. S., Ivanko K. O., Semkiv C. I., Vaityshyn V. I. // Вісник НТУУ «КПІ». Радіотехніка, радіоапаратобудування : збірник наукових праць. – 2021. – Вип. 84. – С. 78-87. – Бібліогр.: 24 назв.uk
dc.identifier.doihttps://doi.org/10.20535/RADAP.2021.84.78-87
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/46594
dc.language.isoenuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.sourceВісник НТУУ «КПІ». Радіотехніка, радіоапаратобудування: збірник наукових праць, Вип. 84uk
dc.subjectlung soundsuk
dc.subjectbronchitisuk
dc.subjectchronic obstructive pulmonary diseaseuk
dc.subjectspectral wavelet decompositionuk
dc.subjectmel-frequency cepstral analysisuk
dc.subjectmachine learninguk
dc.subjectзвуки легеньuk
dc.subjectбронхiтuk
dc.subjectхронiчне обструктивне захворювання легеньuk
dc.subjectспектральний аналiзuk
dc.subjectвейвлет-розкладuk
dc.subjectмел-частотний кепстральний аналiзuk
dc.subjectмашинне навчанняuk
dc.subjectзвуки легкихuk
dc.subjectбронхитuk
dc.subjectхроническая обструктивная болезнь легкихuk
dc.subjectспектральный анализuk
dc.subjectвейвлет-разложениеuk
dc.subjectмел-частотный кепстральный анализuk
dc.subjectмашинное обучениеuk
dc.titleInvestigation of Lung Sounds Features for Detection of Bronchitis and COPD Using Machine Learning Methodsuk
dc.typeArticleuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
VKPIRR-2021_84_78-87.pdf
Розмір:
1.1 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.01 KB
Формат:
Item-specific license agreed upon to submission
Опис: