X Код для використання на сайті:
Ширина px

Скопіюйте цей код і вставте його на свій сайт

X Для завантаження презентації, скористайтесь соціальною кнопкою для рекомендації сервісу SvitPPT Завантажити собі цю презентацію

Презентація на тему:
РОЗПОДІЛЕНЕ СУЧАСНЕ КОМП’ЮТЕРНЕ ДОКУМЕНТУВАННЯ ГОЛОСОВИХ МОВНИХ ФОНОГРАМ

Завантажити презентацію

РОЗПОДІЛЕНЕ СУЧАСНЕ КОМП’ЮТЕРНЕ ДОКУМЕНТУВАННЯ ГОЛОСОВИХ МОВНИХ ФОНОГРАМ

Завантажити презентацію

Презентація по слайдам:

Слайд 1

РОЗПОДІЛЕНЕ КОМП’ЮТЕРНЕ ДОКУМЕНТУВАННЯ ГОЛОСОВИХ МОВНИХ ФОНОГРАМ Ю.Г. Кривонос, Ю.В. Крак, О.В. Бармак, О.С. Загваздін

Слайд 2

Аналіз предметної області Можливі сфери застосування включають: стенографування засідань представницьких органів, органів виконавчої влади, судів, інших засідань Користувачі системи мають обмежені навички користування комп’ютером і вимагають простого інтерфейсу Експлуатація системи має бути простою і не вимагати адміністрування

Слайд 3

Аналіз існуючих рішень і систем Система “Нестор” Центра Речевых Технологий, Москва Комплекс оперативного стенографування «SRS Report 2000», команія SRS, Москва Проект системи стенографування засідань університету Berkeley, США Система стенографувань засідань ILS, Німеччина

Слайд 4

Недоліки існуючих систем Висувають високі вимоги до апаратного забезпечення Вимагають комплексного впровадження і адміністрування Є складними в освоєнні і застосуванні для кінцевого користувача

Слайд 5

Постановка задачі Отримання звукового та відео сигналу для широко вживаних типів форматів (wav, mp3, wma, avi, mpeg тощо) Розбиття сигналу на рівноцінні сегменти з автоматичною фільтрацією від сторонніх шумів Створення багатористувацької системи, яка б не вимагала адімінстрування Створення простого і інтуїтивно зрозумілого інтерфейсу користувача Автоматичне розподілення сегментів між користувачами

Слайд 6

Запропонована система Може працювати як в однокористувацькому, так і в багатокористувацькому режимах Не вимагає сервеного апартного забезпечення, працює на звичайних персональних ком’ютерах або ноутбуках (об’єднаних в локальну мережу) Відповідає вимогам щодо простоти інтерфейсу користувача і не вимагає спеціального навчання та впровадження Здатна виконувати якісне розбиття звукових сигналів на рівноцінні сегменти з автоматичною фільтрацією від сторонніх шумів

Слайд 7

Ергономіка системи Відповідно до класичного дослідження Джорджа Міллера про короткочасну пам’ять людини (1956), людина здатна концентрувати увагу на 7+/-2 об’єктах Кожен сегмент для стенографування має містити 5-9 слів Кількість елементів керування в інтерфейсі користувача не повинна перевищувати 9

Слайд 8

Інтерфейс користувача Всі елемнети керування сконцентровано в одній формі Виділено вісім основних команд для роботи зі звуковими сегментами Для основних команд створено “гарячі клавіші”, щоб користувач під час стеногравування не відривав рук від клавіатури

Слайд 9

Інтерфейс користувача

Слайд 10

Алгоритм розбиття на сегменти Пошук пауз: проходження вікном визначеної довжини по всьому сигналу і пошук інтервалів, в яких середньоквадратичне відхилення не перевищує заданої межі. Межі сегментів визначаються по знайденим паузам Довжина сегменту є не меншою від деякої заданой величини

Слайд 11

Цифрова обробка сигналу Автоматичне видалення шумів з сигналу шляхом застосування вейвлет-перетворень, підібраних певним чином для підвищення якості сигналу Зміна амплітуди сигналу (тихіше/голосніше) Зміна частоти основного тону сигналу, швидкості відтворення Створення ефекту “об’ємного” звучання

Слайд 12

Діаграма активності для розподілення сегментів в мережевому варіанті

Слайд 13

Розподілення сегментів Система без додаткового адміністрування визначає такі ролі користувачів: адміністратор, оператор-стенографіст, коректор з наступною функціональністю: При поступанні сигналу на серверну частину системи, він розбивається на сегменти, які надходять операторам Адміністратор групи стенографістів може контролювати завантаженість операторів і слідкувати за процесом стенографування Після завершення стенографування стоврюється загальний текстовий файл, який надсилається для перевірки коректору

Слайд 14

Результати експерименту (однокористувацький режим) Для створення стенограми засідання тривалістю 2 години при використанні системи одному непідготовленому користувачу потрібно близько 6 годин, проти 12-18 годин при використанні стандартних засобів. Користувач починає впевнено користуватися системою вже після перших 15-30 хвилин роботи

Слайд 15

Результати експерименту (багатокористувацький режим) Для створення стенограми засідання тривалістю 2 години група з 5 оперторів-стенографістів витрачає близько 40 хвилин Загальний файл стенограми створюється автоматично під час стенографовання З урахуванням редагування процес займає близько однієї години

Слайд 16

Подальші дослідження Вдосконалення алогритмів розбиття на сегменти і розподілення їх між користувачами Створення алгоритмів автоматичного розпізнавання мовних сигналів Підтримка словників типових фраз для прискорення вводу

Завантажити презентацію

Презентації по предмету Інформатика