Automated lecture note-taking system

dc.contributor.authorSulima, Svitlana V.
dc.contributor.authorGenash, Artem G.
dc.date.accessioned2025-04-09T10:14:54Z
dc.date.available2025-04-09T10:14:54Z
dc.date.issued2024
dc.description.abstractBackground. In the modern world, information technologies evolve rapidly, constantly altering our approaches to learning, work, and daily life. One significant aspect of this evolution is the automation of various processes, including education. Students and teachers are faced with large volumes of information that need to be processed, stored, and used in the educational process. Taking lecture notes is still an important task that requires a lot of time and effort, thus automating this process is both relevant and necessary. Automated lecture note-taking based on video and audio materials greatly facilitates the lives of students and teachers by providing quick access to structured information. The use of speech recognition and artificial intelligence technologies to create notes from lecture materials opens up new opportunities for effective learning. These systems can significantly save time, improve the quality and accuracy of notes, and ensure their accessibility to all participants in the educational process. These systems can not only create notes but also structure them by highlighting key points and providing easy access to information. This allows students to focus on understanding and comprehending the material rather than writing it down, thereby improving the quality of learning and knowledge acquisition. Objective. The purpose of the paper is to simplify the note-taking process and improve its quality by developing a system for automated lecture note-taking based on video and audio materials, ensuring the efficient and rapid creation of structured notes from lecture materials. Methods. Analysis of Literature and Contemporary Studies: Studying scientific articles, monographs, and dissertations related to the topic of automated lecture note-taking, speech recognition, and artificial intelligence. System Analysis: Defining system requirements, analysing possible approaches and tools for implementation. Experimental Method: Developing, implementing, and testing the system. Comparative Analysis: Evaluating the effectiveness of different speech recognition tools and AI models for creating notes. Modelling and Prototyping: Creating a system prototype, testing it, and improving it based on the obtained results. Results. During the implementation of the automated lecture note-taking system, an effective Telegram bot was created, which uses "whisper-1" and "gpt-4" models to provide high-quality speech recognition and the generation of structured notes from video and audio materials. Conclusions. The developed system of automated note-taking of lectures based on video and audio materials significantly simplifies the preparation of materials for students and teachers. Integration with Telegram and implementation of the system through a Telegram bot ensure cross-platform, accessibility and ease of use and at the same time provide an opportunity to avoid creating additional web or mobile applications for a wide range of users. The use of OpenAI's "whisper-1" model demonstrates high accuracy of speech recognition, which allowed improving the quality of transcriptions compared to other tools such as Vosk or FasterWhisper.
dc.description.abstractotherПроблематика. У сучасному світі інформаційні технології стрімко розвиваються, постійно змінюючи наші підходи до навчання, роботи та повсякденного життя. Одним із важливих аспектів цієї еволюції є автоматизація різних процесів, у тому числі освітніх. Студенти та викладачі стикаються з великими обсягами інформації, які необхідно обробляти, зберігати та використовувати в навчальному процесі. Конспектування лекцій залишається актуальним завданням, яке потребує багато часу та зусиль, тому автоматизація цього процесу актуальна та необхідна. Автоматизоване конспектування лекцій на основі відео- та аудіо матеріалів значно полегшує життя студентів і викладачів, надаючи швидкий доступ до структурованої інформації. Використання технологій розпізнавання мовлення та штучного інтелекту для створення конспектів із лекційних матеріалів відкриває нові можливості для ефективного навчання. Ці системи дозволяють значно заощадити час, підвищити якість і точність конспектів, забезпечити їх доступність для всіх учасників навчального процесу. Ці системи можуть не тільки створювати нотатки, але й структурувати їх, виділяючи ключові моменти та забезпечуючи легкий доступ до інформації. Це дозволяє учням зосередитися на розумінні та розумінні матеріалу, а не записувати його, тим самим покращуючи якість навчання та засвоєння знань. Мета дослідження. Метою даної роботи є спрощення процесу конспектування та підвищення його якості шляхом розробки системи автоматизованого конспектування лекцій на основі відео та аудіо матеріалів, що забезпечує ефективне та швидке створення структурованих конспектів із лекційних матеріалів. Методика реалізації. Аналіз літератури та сучасних досліджень: Вивчення наукових статей, монографій та дисертацій, пов’язаних з темою автоматизованого конспектування лекцій, розпізнавання мовлення та штучного інтелекту. Системний аналіз: Визначення системних вимог, аналіз можливих підходів та інструментів для впровадження. Експериментальний метод: розробка, впровадження та тестування системи. Порівняльний аналіз: оцінка ефективності різних інструментів розпізнавання мовлення та моделей ШІ для створення нотаток. Моделювання та прототипування: створення прототипу системи, його тестування та вдосконалення на основі отриманих результатів. Результати дослідження. Під час впровадження автоматизованої системи конспектування лекцій створено ефективний Telegram-бот, який за допомогою моделей «whisper-1» та «gpt-4» забезпечує якісне розпізнавання мовлення та генерацію структурованих нотаток із відео та аудіо. матеріалів. Висновки. Розроблена система автоматизованого конспектування лекцій на основі відео та аудіо матеріалів значно спрощує підготовку матеріалів для студентів і викладачів. Інтеграція з Telegram та реалізація системи через Telegram-бот забезпечують кросплатформність, доступність та зручність використання та водночас дають можливість уникнути створення додаткових веб- чи мобільних додатків для широкого кола користувачів. Використання моделі OpenAI «whisper-1» демонструє високу точність розпізнавання мови, що дозволило підвищити якість транскрипції порівняно з іншими інструментами, такими як Vosk або FasterWhisper.
dc.format.pagerangePp. 20-24
dc.identifier.citationSulima, S. V. Automated lecture note-taking system / Svitlana V. Sulima, Artem G. Genash // Information and telecommunication sciences : international research journal. – 2024. – Vol. 15, N. 2. – Pp. 20-24. – Bibliogr.: 24 ref.
dc.identifier.doihttps://doi.org/10.20535/2411-2976.22024.20-24
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/73304
dc.language.isoen
dc.publisherNational Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
dc.publisher.placeKyiv
dc.relation.ispartofInformation and telecommunication sciences : international research journal, Vol. 15, N. 2
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectautomated note-taking
dc.subjectspeech recognition
dc.subjectTelegram bot
dc.subjectGPT models
dc.subjectaudio and video processing
dc.subjectWhisper-1
dc.subjectавтоматичне ведення нотаток
dc.subjectрозпізнавання мовлення
dc.subjectTelegram-бот
dc.subjectмоделі GPT
dc.subjectобробка аудіо та відео
dc.subject.udc004.7
dc.titleAutomated lecture note-taking system
dc.title.alternativeАвтоматизована система конспетування лекцій
dc.typeArticle

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
20-24.pdf
Розмір:
496.07 KB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: