Артозу Е.А. Розробка алгоритмів розпізнавання голосових команд для управління бортовою системою автомобіля

Артозу Катерина Олександрівна
Пензенський державний технологічний університет

Бібліографічна посилання на цю статтю:
Артозу Е.А. Розробка алгоритмів розпізнавання голосових команд для управління бортовою системою автомобіля // Сучасна техніка і технології. 2015. № 9 [Електронний ресурс]. URL: http://technology.snauka.ru/2015/09/7903 (дата звернення: 11.02.2019).

В даний час голосове управління є найбільш зручним способом управління різними електронними приладами без фізичного втручання людини. Особливої ​​актуальності набуває застосування голосового управління в автомобілях, яке сприяє більш комфортному і безпечному водінню і дозволяє водієві не відволікатися на фізичне управління за потрібне приладом, а елементарно вимовляти команди для його активації. Але дані системи вбудовані переважно в дорогих автомобілях.

Система голосового управління дозволяє не тільки зробити водіння автомобіля комфортнішим, а й більш безпечним. Розпізнавання мови є основною складовою системи голосового управління, особливо, в автомобілях [1]. Воно дозволяє спростити і прискорити взаємодію людини з тією чи іншою системою, а головне - зробити його більш природним.

Одна з основних проблем - відсутність системи голосового управління у більшості моделей автомобілів. Актуальність даної проблеми можна обґрунтувати тим, що велика частина людей не має можливості купувати дорогі моделі автомобілів, в яких вже передбачена вбудована система голосового управління. Однак, люди мають уявлення про дану технологію і бажають користуватися нею, тобто планують вмонтувати таку систему в свій автомобіль.

Для кращого розпізнавання голосових команд необхідно розробити алгоритми функціонування підсистеми ідентифікації, яка є основою технології розпізнавання мови. Найчастіше для ідентифікації даних застосовуються штучні нейронні мережі, що відрізняються найбільш точними вихідними даними.

Не у всіх системах розпізнавання мови можна вважати ідеальним, зокрема, в автомобілях, доступних за своєю вартістю більшості людей і мають обмежене число опцій. Як правило, такі машини максимально комфортно не обладнані. Для наочності була проведена класифікація автомобілів по вартості, в результаті отримано 3 категорії автомобілів.

Дорогі автомобілі «бізнес класу» мають вартість 1 млн рублів і більше. Це перша категорія. Друга категорія включає автомобілі, вартість яких менше мільйона рублів, але більше 600 тисяч. І третя категорія - це автомобілі, що стоять менше 600 неоподатковуваних мінімумів доходів громадян.

До другої і третьої категорій можна віднести вітчизняні автомобілі, особливо популярні в автомобілістів, через невисоку вартість. Недолік даних автомобілів - високий рівень шуму всередині салону, що є основною причиною відсутності вбудованих систем голосового управління.

Через те, що в автомобілях 2-ий і 3-ій цінових категорій рівень шумоізоляції низький, і під час руху утворюються шуми, що досягають рівня вище середнього, виникає питання: як домогтися кращого розпізнавання голосових команд в даних умовах.

Для візуального представлення процесів введення і подальшого розпізнавання голосових команд системою голосового управління використовується діаграма діяльності підсистеми ідентифікації.

Дана діаграма представлена ​​на малюнку 1.

Малюнок 1 - Діаграма діяльності підсистеми ідентифікації

Діяльність підсистеми бере свій початок з введення голосової команди. Отриманий сигнал перетвориться в цифровий вигляд іпроходіт процедуру фільтрації зовнішніх шумів. Далі, перетворений сигнал потрапляє з підсистему ідентифікації. У даній підсистемі для розпізнавання команди сперваподается запит до бази даних сигналів. При збігу вхідного і збереженого сигналів розпізнавання проходить успішно, ікоманда передається на виконавчий пристрій, виполняющееопределенное дію. Якщо голосова команда не ідентифікувався, то система повертається до початку - введення голосової команди, і алгоритм действійповторяется знову, поки не буде досягнутий позитивний результат, то естьідентіфікація голосової команди.

Діаграма діяльності, що відображає події, що відбуваються під час роботи ймовірнісної нейронної мережі підсистеми ідентифікації, показана на малюнку 2. Імовірнісна нейронна мережа має три шари, через які проходить сигнал.


Малюнок 2 - діаграма діяльності нейронної мережі

Дана діаграма діяльності показує дії, що відбуваються під час роботи нейронної мережі підсистеми розпізнавання голосових команд.

В результаті проведеного моделювання були розроблені UML-моделі функціонування підсистеми розпізнавання голосових команд, а саме: діаграми діяльності підсистеми ідентифікації системи голосового управління і ймовірнісної нейронної мережі. Розроблені алгоритми можуть використовуватися для вирішення таких питань як [4-12].


бібліографічний список

  1. Система голосового управління в автомобілі. URL:, (дата звернення 09.07.2015).

  2. Bluetooth. URL:, вільний (дата звернення 10.07.2015).

  3. Нейронні мережі в системах розпізнавання мови. , Вільний (дата звернення 10.07.2015).
  4. Мещерякова Е.Н., артозу Е.А. UML-моделювання структурної динаміки інформаційної системи голосового управління електроустаткуванням автомобіля // Сучасні інформаційні технології. 2014. № 20. С. 35-39.

  5. Мурашкина Е.Н., Міхєєв М.Ю. Імітаційне моделювання нейромережевої ідентифікації сигналів складної форми // Праці міжнародного симпозіуму Надійність і якість. 2014. Т. 1. С. 203-206.

  6. Куц А.В., Піскаев К.Ю., Юрманов В.А. Реалізація вагового інтегрування в високоточних інтегруючих АЦП // Питання радіоелектроніки. 2010. Т. 3. № 5. С. 157-165.

  7. Піскаев К.Ю. Аналіз проблеми підвищення точності інтегруючих аналого-цифрових перетворювачів // Вісник Самарського державного технічного університету. Серія: Технічні науки. 2013. № 1 (37). С. 227-231.

  8. Міхєєв М.Ю., Юрманов В.А., Піскаев К.Ю. Інтегрують АЦП з частотно-імпульсною модуляцією // Праці міжнародного симпозіуму Надійність і якість. 2014. Т. 1. С. 315-318.

  9. Щербань А.Б., Братцев К.Є., Жашкова Т.В., Міхєєв М.Ю. Узагальнені структурні моделі інформаційних об'єктів // Известия вищих навчальних закладів. Поволзький регіон. Технічні науки. 2009. № 1. С. 12-22.

  10. Жашкова Т.В. Процедура ідентифікаційний-структурного синтезу моделей для аналізу критичних станів складних систем // Сучасні проблеми науки та освіти. 2013. № 6. С. 55.

  11. Міхєєв М.Ю., Гудков К.В., Гудкова Е.А. //. 2014.. С. 304.

  12. Міхєєв М.Ю., Гудков К.В., Юрманов В.А., Юрков Н.К. //. 2012.. С. 51-54.

  13. Мещерякова Е.Н. Концепція побудови підсистеми ідентифікації та структурування інформації сигналів з датчиків на поверхнево-акустичних хвилях у вигляді інформаційних об'єктів // XXI століття: підсумки минулого і проблеми сьогодення плюс. 2015. № 4 (26). С. 217-222.


Всі статті автора «артозу Катерина Олександрівна»