Програмне забезпечення для зберігання та обробки неструктурованих документів

dc.contributor.advisorМихайлова, Ірина Юріївна
dc.contributor.authorМасечко, Ірина Олександрівна
dc.description.abstractenStructure and volume of the dissertation Master’s dissertation consists of introduction, 6 sections, conclusion, list of sources of 37 items, 3 appendixes and has 20 images, 22 tables. Whole dissertation volume is 81 pages, out of which list of sources takes 4 pages, appendixes - 9 pages. Significance of the topic. The processing of unstructured information is currently very relevant to the application of artificial intelligence, since at the moment no more than 20% of world information is structured, at the same time, more and more data are accumulated annually around the world, mostly unstructured, with potentially useful, useful information for companies and enterprises. However, given the complexity of processing unstructured information, it should be made objective to conclude that its analysis is very complex and requires the use of integrated intelligence tools. Today, unstructured data potentially has the greatest value as a source of new knowledge. The paradox is that the result of an analysis depends on the a mount of such data - the more such data, the more likely it is to get the most accurate results. From this point of view, it is interesting to use several additional data sources. The objective of the topic is to create a software product for storing and processing unstructured data. In order to achieve the objective next goals were defined:: 1) analyze the features of work with unstructured data, and a large amount of data; 2) analyze the use of software solutions to improve the efficiency of the system; 3) design and develop the software architecture; 4) develop software for storing and processing unstructured data. The object of research is computer information technology for the processing of unstructured data. The subject of the study is computer information technology for the processing of unstructured data. Research methods. To effectively implement this task, it was decided to use the InterSystems Caché post-relational database. InterSystems Caché's database management system (DBMS) allows you to quickly process data when implementing complex systems, use an object-oriented approach to design, create classes with properties of different types of data and objects, to which, if necessary, you can obtain relational access. Scientific novelty of the results. The most significant scientific results of the master's thesis are application in the development of object technology software and object-oriented database so that the developed system has advantages over competitors, since the applications based on Caché work with the use of much less powerful equipment and without the need for participation database administrators. Data storage in CACHE is carried out using a multidimensional data model, which allows you to reduce the amount of memory required while increasing the speed of data access. Practical significance of the work is in the developed software for storage and processing of unstructured data, through which the user will be able to analyze unstructured data and automate the work with the input documentation.uk
dc.description.abstractukСтруктура й обсяг дипломної роботи Магістерська дисертація складається зі вступу, 6 розділів, висновку, переліку посилань з 36 найменувань, 2 додатків і містить 23 рисунки та 22 таблиці. Повний обсяг магістерської дисертації складає 81 сторінку, з яких перелік посилань займає 3 сторінки, додатки – 9 сторінок. Актуальність теми. Значна частина усієї інформації, яка використовується підприємствами для щоденної роботи, зберігається у вигляді паперових документів або їх відсканованих копій. Це особливо стосується даних, отриманих із зовнішніх джерел. Тобто більшість вхідних даних компаній є неструктурованими. Це призводить до труднощів аналізу, особливо у випадку використання традиційних програм, призначених для роботи зі структурованими даними. Таким чином актуальною є проблема розробки програмної системи для зберігання та обробки неструктурованих даних. Мета дослідження полягає в розробці програмної системи для зберігання та обробки неструктурованих даних з використанням засобів та технологій мультимодельної СУБД InterSystems Caché. Для досягнення поставленої мети були сформульовані наступні завдання дослідження, що визначили логіку дослідження та його структуру: — проаналізувати існуючі програмні системи для роботи з неструктурованими даними, визначити їх переваги та недоліки; — обрати засоби реалізації програмної системи для роботи з неструктурованими данимики; — розробити архітектуру та структуру програмної системи для роботи з неструктурованими даними; — розробити програмну систему для роботи з неструктурованими даними. Об’єктом дослідження є способи зберігання та обробки неструктурованих даних. Предметом дослідження є комп’ютерні інформаційні технології для зберігання та обробки неструктурованих даних. Методи дослідження. Розв’язання поставлених завдань виконувалось засобами та з використанням технологій постреляційної системи керування базами даних (СКБД) InterSystems Caché. Програмна система розроблена у середовищі Microsoft Visual Studio мовою C#. Наукова новизна одержаних результатів. Найбільш суттєвими науковими результатами магістерської дисертації є застосування при розробці програмного забезпечення об’єктної технології та об’єктно-орієнтованої бази даних, завдяки чому розроблена система має переваги на конкурентами, оскільки застосунки на базі Caché працюють з використанням значно менш потужного устаткування і без необхідності участі адміністраторів баз даних. Практичне значення одержаних результатів роботи полягає в розробці програмного забезпечення, направленому на зберігання та обробку неструктурованих даних, завдяки якому користувач зможе проаналізувати неструктуровані дані та автоматизувати роботу з вхідною документацією.uk
dc.format.page76 с.uk
dc.identifier.citationМасечко, І. О. Програмне забезпечення для зберігання та обробки неструктурованих документів : магістерська дис. : 122 Комп’ютерні науки та інформаційні технології / Масечко Ірина Олександрівна. – Київ, 2018. – 76 с.uk
dc.subjectнеструктуровані даніuk
dc.subjectобробка данихuk
dc.subjectмультимодельна СУБД Cachéuk
dc.subjectunstructured datauk
dc.subjectdata-based management systemuk
dc.subjectdata processinguk
dc.titleПрограмне забезпечення для зберігання та обробки неструктурованих документівuk
dc.typeMaster Thesisuk


