Моніторинг новинних youtube-каналів за допомогою системи розпізнавання мовлення.

Автор(и)

  • Valentyna Robeiko Міжнародний науково-навчальний центр інформаційних технологій та систем Інститут філології Київського національного університету імені Т. Шевченка
  • Mykola Sazhok Міжнародний науково-навчальний центр інформаційних технологій та систем
  • Ruslan Seliukh м. Київ
  • Dmytro Fedoryn м. Київ
  • Oleksandr Yukhymenko м. Київ

Анотація

Оперативний моніторинг телерадіопрограм є важливим суспільним завданням, що має на меті здійснення запису, зберігання та аналізу аудіовізуальних даних медіа-сервісів на всій території України. На сьогодні велика кількість світових телеканалів ведуть своє мовлення засобами вебсервісу YouTube. Цей сервіс дає змогу користувачам Інтернету переглядати трансляції як наживо, так і окремі випуски телепередач або сюжетів у записі. Українські телеканали віднедавна активно опановують новий спосіб донесення медійної інформації до користувача. В недалекому минулому провести аудіовідеозапис трансляцій телеканалів можливо було через антену або з місцевих сервісів цифрового ТБ. Тепер же до переліку національних новинних каналів, що максимально використовують можливості YouTube, входять канали Еспресо, 5 канал, 112, 24, Zik та ряд інших. Крім того окремі передачі новин, такі як ТСН, Факти ICTV тощо, створюють власні YouTubeканали, викладають туди записи своїх випусків та інколи транслюють їх наживо.

Перша з розроблених в Україні систем, що давала змогу проводити оперативний моніторинг аудіоінформації, забезпечувала надійне перетворення на текст записів спонтанного мовлення, в яких наявні лише незначні шуми і завади — [2]. Сюжети, знайдені за ключовими словами, користувач переглядав синхронно з розпізнаним текстом із метою аналізу або редагування.

Біографії авторів

Valentyna Robeiko, Міжнародний науково-навчальний центр інформаційних технологій та систем Інститут філології Київського національного університету імені Т. Шевченка

науковий співробітник , асистент

Mykola Sazhok, Міжнародний науково-навчальний центр інформаційних технологій та систем

кандидат технічних наук, завідувач відділу

Посилання

Вінцюк Т. К., Сажок М. М., Селюх Р. А., Федорин Д. Я., Юхименко О. А., Робейко В. В. Автоматичне розпізнавання, розуміння та синтез мовленнєвих сигналів в Україні. Керуючі системи та комп‘ютери. 2018. № 6. С. 7–24.

Сажок Н. Н., Робейко В. В., Федорин Д. Я., Селюх Р. А. Система преобразования телерадиовещания в текст для украинского языка. Управляющие системы и машины. 2015. № 6. С. 66–73.

Povey D., Ghoshal A., Boulianne G. et. al. The Kaldi Speech Recognition Toolkit. IEEE 2011 Workshop on Automatic Speech Recognition and Understanding.

Tilk O., Alumäe T. Bidirectional Recurrent Neural Network with Attention Mechanism for Punctuation Restoration. Interspeech. 2016. S. 3047- 3051.

http://lang.org.ua/uk/corpora/

Zewoudie A. W., Luque J., Hernando J. The use of long-term features for GMM- and i-vector-based speaker diarization systems. EURASIP Journal on Audio, Speech, and Music Processing (2018) 2018. 14.

##submission.downloads##

Номер

Розділ

Розділ VІ. Прикладна лінгвістика: напрями та методи дослідження