Система аналізу та категоризації текстових медичних даних з використанням SAS технологій
dc.contributor.advisor | Терентьєв, Олександр Миколайович | |
dc.contributor.author | Юрчук, Максим Віталійович | |
dc.date.accessioned | 2019-09-20T15:01:17Z | |
dc.date.available | 2019-09-20T15:01:17Z | |
dc.date.issued | 2019 | |
dc.description.abstracten | Thesis: 126 p., X fig., X tabl., X append., X sources The theme: “The system for analysis and categorization of textual medical data using SAS technologies”. Relevance of work: for today most of the information is unstructured, so using it with the usual analytical models is impossible. In the medical field, processing text data can greatly improve the quality of feedback from patients, and therefore the quality of drugs. Object of research: medical text reports, namely patient reviews. Subject of research: information search, intellectual analysis, method of maximum likelihood, latent semantic analysis, boolean rules. Purpose: to study existing methods of processing unstructured text data and their implementation in the system of analysis and categorization of text medical reporting. Research method: use of knowledge about natural language processing (NLP), mathematical methods and models for classification and clustering of text information. The results of the work: the analysis of modern methods of information search, the possibilities of using existing tools of text analytics, their adjustment for a specific branch, a system developed that allows creating categories with a certain degree of probability to perform the classification task, receiving a large number of medical reports on the entrance is investigated. Ways of further development of the subject of research - improvement of the chosen architecture of the model, expansion of the collection of texts, markup by experts. | uk |
dc.description.abstractuk | Дипломна робота: 126 с., 2 табл., рис., 2 дод., 21 джерело Актуальність роботи: на сьогодні більша частина інформації знаходиться у неструктурованому вигляді, тому використання її звичними аналітичними моделями являється неможливим. В медичній сфері, обробляючи текстові дані, можливо значно покращити якість зворотнього зв'язку з пацієнтами, а тому і якість препаратів. Об'єкт дослідження: медичні текстові звіти, а саме – відгуки пацієнтів. Предмет дослідження: інформаційний пошук, інтелектуальний аналіз, метод максимальної правдоподібності, латентно-семантичний аналіз, булеві правила. Мета роботи: дослідження існуючих методів обробки неструктурованих текстових даних та їх впровадження у системі аналізу та категоризації текстової медичної звітності. Метод дослідження: використання знань про обробку природньої мови (NLP), математичних методів та моделей для класифікації та кластеризації текстової інформації. Результати роботи: проведено аналіз сучасних методів інформаційного пошуку, досліджені можливості використання наявних інструментів текстової аналітики, налаштування їх під конкретну галузь, розроблена система, яка дозволяє створювати категорії з певним ступенем вірогідності виконувати задачу класифікації, отримуючи на вхід велику кількість медичних звітів. Шляхи подальшого розвитку предмета дослідження - удосконалення обраної архітектури моделі, розширення колекції текстів, розмітка даних експертами. | uk |
dc.format.page | 126 с. | uk |
dc.identifier.citation | Юрчук, М. В. Система аналізу та категоризації текстових медичних даних з використанням SAS технологій : дипломна робота … бакалавра : 6.040303 Системний аналіз / Юрчук Максим Віталійович. – Київ, 2019. – 126 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/29385 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | аналіз даних | uk |
dc.subject | інформаційний пошук | uk |
dc.subject | текстова аналітика | uk |
dc.subject | медицина | uk |
dc.subject | обробка природньої мови | uk |
dc.subject | кластеризація | uk |
dc.subject | хмарні обчислення | uk |
dc.subject | intellectual analysis of data | uk |
dc.subject | information search | uk |
dc.subject | text analytics | uk |
dc.subject | medicine | uk |
dc.subject | natural language processing | uk |
dc.subject | clusterization | uk |
dc.subject | cloud computing | uk |
dc.title | Система аналізу та категоризації текстових медичних даних з використанням SAS технологій | uk |
dc.type | Bachelor Thesis | uk |