Restore of the tables with partially missing data

dc.contributor.authorStenin, A.
dc.contributor.authorPasko, V.
dc.contributor.authorMelkumian, E.
dc.contributor.authorStenin, S.
dc.date.accessioned2020-06-14T15:25:37Z
dc.date.available2020-06-14T15:25:37Z
dc.date.issued2019
dc.description.abstractenThe problem of data recovery found in a wide variety of statistical analysis applications. For example, it related to the survey in various sectors of the economy. When filling out a questionnaire specialist specific subject area sometimes there is a situation where he cannot answer all the questions for technical reasons (failure of the communication channel) or for personal reasons (he may not prefer one criterion to another). Survey data in many cases are formed in the form of rectangular binary tables, where columns (rows) are the studied variables that correspond to binary numbers (1, 0) or signs ( + , -). This article is devoted to the analysis and recovery of binary data in cases when the table of values of variables for the above reasons is absent. The solution of this problem proposed to carried out by the method of homogeneous groups. The essence of this method is to find in the General population of binary data of homogeneous groups of subjects of the survey and determine the affiliation of the subject of the survey, in the response of which for one of the above reasons there was a transition to one of the selected homogeneous groups. This method works well for large amounts of binary data with relatively few spaces. Otherwise, stricter methods, such as simulation methods using maximum likelihood functions or Bayesian strategies, are used.uk
dc.description.abstractruПроблема восстановления данных встречается в самых разнообразных приложениях статистического анализа. Зачастую это связано с проведением анкетирования в разнообразных сферах народного хозяйства. При заполнении анкеты экспертом конкретной предметной области иногда он может не ответить на все вопросы либо по техническим причинам (сбой канала связи), либо по личным обстоятельствам (не может оказать предпочтения одному критерию перед другим). Данные опроса во многих случаях формируются в виде прямоугольных бинарных таблиц, где столбцы (строки) представляют собой исследуемые переменные, которым соответствуют бинарные числа (1,0) или признаки (+, -). Настоящая статья посвящена анализу и восстановлению бинарных данных в тех случаях, когда в таблице часть значений переменных по указанным выше причинам отсутствует. Решение данной задачи предлагается осуществлять на основе метода однородных групп. Суть данного метода заключается в отыскании в генеральной совокупности бинарных данных однородных групп субъектов опроса и определении принадлежности субъекта опроса, в ответе которого по одной из выше указанных причин появился пропуск, к одной из выделенных однородных групп. Данный метод хорошо работает при больших массивах бинарных данных с относительно небольшим количеством пропусков, но, как и все методы заполнения, обладает рядом указанных выше недостатков и используется там, где пропуски не имеют критического значения. В противном случае используются более строгие методы, например, методы моделирования с использованием функций максимального правдоподобия или байесовских стратегий.uk
dc.description.abstractukПроблема відновлення даних зустрічається в найрізноманітніших додатках статистичного аналізу. Найчастіше це пов'язано з проведенням анкетування в різноманітних сферах народного господарства. При заповненні анкети експертом конкретної предметної області іноді він може не відповісти на всі питання або з технічних причин (збій каналу зв'язку), або з особистих обставин (не може надати переваги одному критерію перед іншим). Дані опитування в багатьох випадках формуються у вигляді прямокутних бінарних таблиць, де стовпці (рядки) являють собою досліджувані змінні, яким відповідають бінарні числа (1,0) або ознаки ( + , -). Ця стаття присвячена аналізу і відновленню бінарних даних в тих випадках, коли в таблиці частина значень змінних за вказаними вище причин відсутня. Рішення даного завдання пропонується здійснювати на основі методу однорідних груп. Суть даного методу полягає в відшуканні в генеральній сукупності бінарних даних однорідних груп суб'єктів опитування і визначенні приналежності суб'єкта опитування, у відповіді якого по одній з вище зазначених причин з'явився пропуск, до однієї з виділених однорідних груп. Даний метод добре працює при великих масивах бінарних даних з відносно невеликою кількістю пропусків, але, як і всі методи заповнення, володіє низкою зазначених вище недоліків і використовується там, де пропуски не мають критичного значення. В іншому випадку використовуються більш суворі методи, наприклад, методи моделювання з використанням функцій максимальної правдоподібності або байєсовських стратегій.uk
dc.format.pagerangePp. 18-24uk
dc.identifier.citationRestore of the tables with partially missing data / A. Stenin, V. Pasko, E. Melkumian, S. Stenin // Адаптивні системи автоматичного управління : міжвідомчий науково-технічний збірник. – 2019. – № 2 (35). – С. 18–24. – Бібліогр.: 8 назв.uk
dc.identifier.doihttps://doi.org/10.20535/1560-8956.35.2019.197427
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/34156
dc.language.isoenuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.sourceАдаптивні системи автоматичного управління : міжвідомчий науково-технічний збірник, 2019, № 2 (35)uk
dc.subjectmethod of questionnaireuk
dc.subjectquestionnaire table of binary datauk
dc.subjecthomogeneous data groupsuk
dc.subjectthe method of homogeneous groupsuk
dc.subjectrestoration of missing datauk
dc.subjectметод анкетуванняuk
dc.subjectтаблиця анкетування двійкових данихuk
dc.subjectоднорідні групи данихuk
dc.subjectметод однорідних групuk
dc.subjectвідновлення відсутніх данихuk
dc.subjectметод анкетированияuk
dc.subjectтаблица анкетирования двоичных данныхuk
dc.subjectоднородные группы данныхuk
dc.subjectметод однородных группuk
dc.subjectвосстановление недостающих данныхuk
dc.subject.udc004.042uk
dc.titleRestore of the tables with partially missing datauk
dc.title.alternativeВідновлення таблиць з частково відсутніми данимиuk
dc.title.alternativeВосстановление таблиц с частично отсутствующими даннымиuk
dc.typeArticleuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
asau2019-2_03.pdf
Розмір:
308.63 KB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.06 KB
Формат:
Item-specific license agreed upon to submission
Опис: