Система аналізу та категоризації текстових медичних даних з використанням SAS технологій

dc.contributor.advisorТерентьєв, Олександр Миколайович
dc.contributor.authorЮрчук, Максим Віталійович
dc.date.accessioned2019-09-20T15:01:17Z
dc.date.available2019-09-20T15:01:17Z
dc.date.issued2019
dc.description.abstractenThesis: 126 p., X fig., X tabl., X append., X sources The theme: “The system for analysis and categorization of textual medical data using SAS technologies”. Relevance of work: for today most of the information is unstructured, so using it with the usual analytical models is impossible. In the medical field, processing text data can greatly improve the quality of feedback from patients, and therefore the quality of drugs. Object of research: medical text reports, namely patient reviews. Subject of research: information search, intellectual analysis, method of maximum likelihood, latent semantic analysis, boolean rules. Purpose: to study existing methods of processing unstructured text data and their implementation in the system of analysis and categorization of text medical reporting. Research method: use of knowledge about natural language processing (NLP), mathematical methods and models for classification and clustering of text information. The results of the work: the analysis of modern methods of information search, the possibilities of using existing tools of text analytics, their adjustment for a specific branch, a system developed that allows creating categories with a certain degree of probability to perform the classification task, receiving a large number of medical reports on the entrance is investigated. Ways of further development of the subject of research - improvement of the chosen architecture of the model, expansion of the collection of texts, markup by experts.uk
dc.description.abstractukДипломна робота: 126 с., 2 табл., рис., 2 дод., 21 джерело Актуальність роботи: на сьогодні більша частина інформації знаходиться у неструктурованому вигляді, тому використання її звичними аналітичними моделями являється неможливим. В медичній сфері, обробляючи текстові дані, можливо значно покращити якість зворотнього зв'язку з пацієнтами, а тому і якість препаратів. Об'єкт дослідження: медичні текстові звіти, а саме – відгуки пацієнтів. Предмет дослідження: інформаційний пошук, інтелектуальний аналіз, метод максимальної правдоподібності, латентно-семантичний аналіз, булеві правила. Мета роботи: дослідження існуючих методів обробки неструктурованих текстових даних та їх впровадження у системі аналізу та категоризації текстової медичної звітності. Метод дослідження: використання знань про обробку природньої мови (NLP), математичних методів та моделей для класифікації та кластеризації текстової інформації. Результати роботи: проведено аналіз сучасних методів інформаційного пошуку, досліджені можливості використання наявних інструментів текстової аналітики, налаштування їх під конкретну галузь, розроблена система, яка дозволяє створювати категорії з певним ступенем вірогідності виконувати задачу класифікації, отримуючи на вхід велику кількість медичних звітів. Шляхи подальшого розвитку предмета дослідження - удосконалення обраної архітектури моделі, розширення колекції текстів, розмітка даних експертами.uk
dc.format.page126 с.uk
dc.identifier.citationЮрчук, М. В. Система аналізу та категоризації текстових медичних даних з використанням SAS технологій : дипломна робота … бакалавра : 6.040303 Системний аналіз / Юрчук Максим Віталійович. – Київ, 2019. – 126 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/29385
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectаналіз данихuk
dc.subjectінформаційний пошукuk
dc.subjectтекстова аналітикаuk
dc.subjectмедицинаuk
dc.subjectобробка природньої мовиuk
dc.subjectкластеризаціяuk
dc.subjectхмарні обчисленняuk
dc.subjectintellectual analysis of datauk
dc.subjectinformation searchuk
dc.subjecttext analyticsuk
dc.subjectmedicineuk
dc.subjectnatural language processinguk
dc.subjectclusterizationuk
dc.subjectcloud computinguk
dc.titleСистема аналізу та категоризації текстових медичних даних з використанням SAS технологійuk
dc.typeBachelor Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Yurchuk_bakalavr.pdf
Розмір:
3.25 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: