Моніторинг новинних youtube-каналів за допомогою системи розпізнавання мовлення.

Authors

  • Valentyna Robeiko Міжнародний науково-навчальний центр інформаційних технологій та систем Інститут філології Київського національного університету імені Т. Шевченка
  • Mykola Sazhok Міжнародний науково-навчальний центр інформаційних технологій та систем
  • Ruslan Seliukh м. Київ
  • Dmytro Fedoryn м. Київ
  • Oleksandr Yukhymenko м. Київ

Abstract

Оперативний моніторинг телерадіопрограм є важливим суспільним завданням, що має на меті здійснення запису, зберігання та аналізу аудіовізуальних даних медіа-сервісів на всій території України. На сьогодні велика кількість світових телеканалів ведуть своє мовлення засобами вебсервісу YouTube. Цей сервіс дає змогу користувачам Інтернету переглядати трансляції як наживо, так і окремі випуски телепередач або сюжетів у записі. Українські телеканали віднедавна активно опановують новий спосіб донесення медійної інформації до користувача. В недалекому минулому провести аудіовідеозапис трансляцій телеканалів можливо було через антену або з місцевих сервісів цифрового ТБ. Тепер же до переліку національних новинних каналів, що максимально використовують можливості YouTube, входять канали Еспресо, 5 канал, 112, 24, Zik та ряд інших. Крім того окремі передачі новин, такі як ТСН, Факти ICTV тощо, створюють власні YouTubeканали, викладають туди записи своїх випусків та інколи транслюють їх наживо.

Перша з розроблених в Україні систем, що давала змогу проводити оперативний моніторинг аудіоінформації, забезпечувала надійне перетворення на текст записів спонтанного мовлення, в яких наявні лише незначні шуми і завади — [2]. Сюжети, знайдені за ключовими словами, користувач переглядав синхронно з розпізнаним текстом із метою аналізу або редагування.

Author Biographies

Valentyna Robeiko, Міжнародний науково-навчальний центр інформаційних технологій та систем Інститут філології Київського національного університету імені Т. Шевченка

науковий співробітник , асистент

Mykola Sazhok, Міжнародний науково-навчальний центр інформаційних технологій та систем

кандидат технічних наук, завідувач відділу

References

Вінцюк Т. К., Сажок М. М., Селюх Р. А., Федорин Д. Я., Юхименко О. А., Робейко В. В. Автоматичне розпізнавання, розуміння та синтез мовленнєвих сигналів в Україні. Керуючі системи та комп‘ютери. 2018. № 6. С. 7–24.

Сажок Н. Н., Робейко В. В., Федорин Д. Я., Селюх Р. А. Система преобразования телерадиовещания в текст для украинского языка. Управляющие системы и машины. 2015. № 6. С. 66–73.

Povey D., Ghoshal A., Boulianne G. et. al. The Kaldi Speech Recognition Toolkit. IEEE 2011 Workshop on Automatic Speech Recognition and Understanding.

Tilk O., Alumäe T. Bidirectional Recurrent Neural Network with Attention Mechanism for Punctuation Restoration. Interspeech. 2016. S. 3047- 3051.

http://lang.org.ua/uk/corpora/

Zewoudie A. W., Luque J., Hernando J. The use of long-term features for GMM- and i-vector-based speaker diarization systems. EURASIP Journal on Audio, Speech, and Music Processing (2018) 2018. 14.

Issue

Section

Розділ VІ. Прикладна лінгвістика: напрями та методи дослідження