Распознавание голоса - это технология, которая позволяет использовать голос в качестве идентификационного устройства. Распознавание голоса может использоваться для диктовки текста компьютеру или для отдачи команд (таких как открытие определенных программ, сворачивание меню, сохранение данных). Применения технологии распознавания голоса, используемые на протяжении долгого времени, предполагали произнесение каждого слова отдельно. Это позволяло машине определить, где кончается одно слово и где начинается другое. Такие применения технологии распознавания голоса все еще встречаются для управления компьютерными системами. Современные применения данной технологии позволяют пользователю быстро и слитно произносить текст. Новые системы могут распознать 160 слов в минуту, позволяя преобразовывать непрерывную речь в узнаваемый текст и форматировать его. Часто задаваемые вопросы о голосовой биометрииЧто такое голосовая биометрия? Идентификация по голосу происходит по следующей схеме: система сравнивает образец голоса, представленного в цифровой форме, с так называемым "голосовым отпечатком", хранящимся в базе данных. Голос является уникальной биометрической характеристикой человека и может использоваться для подтверждения его личности. Что такое "голосовой отпечаток"? "Голосовым отпечатком" называется цифровое изображение уникальных характеристик голоса. Голоса различаются, и эти различия обусловлены физиологическими характеристиками, такими как голосовые связки, трахеи, носовой проход; тем, как язык двигается во рту, и тем, как извлекаются звуки, и так далее. Комбинация этих характеристик анализируется и представляется уникальной для каждого человека. Чем отличается верификация говорящего от распознавания речи? Распознавание речи связано с тем, что было сказано, что и является главным отличием от верификации, связанной с тем, кто именно говорит. Системы голосовой идентификации не зависят от какого-либо языка или словаря. Человек может сказать что угодно и на каком угодно языке, что делает эти системы очень "дружелюбными" и идеальными для международного использования. Как осуществляется занесение в базу данных? Весь процесс занесения данных занимает несколько минут. Система предлагает ответить на несколько простых вопросов, например, ваше имя, отчество, фамилия или дата рождения. Ответы становятся идентификационными фразами, которые позднее будут использоваться для идентификации человека. Запомните, неважно, что вы скажете, главное, как вы это скажете; вопросы могут быть самыми разными, главное, чтобы ответ был хорошо знаком человеку, и он бы смог воспроизвести его в любую минуту. Для каждого вопроса пользователь произносит четыре раза свой ответ. Ответ должен состоять как минимум из трех слогов и длиться больше секунды для того, чтобы создать "голосовой отпечаток". Записанные ответы накладывают друг на друга, убирают посторонний шум и через несколько секунд "голосовой отпечаток" готов. Затем система таким же образом поступает с другими вопросами и ответами (системы безопасности предлагают делать несколько таких "голосовых отпечатков"). Через несколько минут создаются "голосовые отпечатки", которые будут применяться каждый раз, когда человек будет проходить через службу безопасности. Как происходит верификация говорящего? Пользователь произносит определенные фразы, и система сравнивает произнесенное с ранее сохраненным "голосовым отпечатком". Человек произносит две или три идентификационные фразы. Если две произнесенные фразы проходят биометрический тест, личность человека идентифицируется. Если одна из этих фраз не принимается, система обращается к третьей произнесенной фразе, и если она принимается системой, то личность пользователя также идентифицируется. Если система не уверена в правильности идентификации пользователя после трех произнесенных идентификационных фраз, она отказывает пользователю в доступе и отправляет к оператору, или связь просто прерывается. Что значит "нормальный голос"? Также как и с другими применениями биометрических технологий, успех голосовой идентификации зависит от неизменного, устойчивого образца. Если сравнивать данную технологию с идентификацией по отпечаткам пальцев, которая предполагает отсутствие порезов или грязи, то для голосовой идентификации неизменный, устойчивый образец - это значит говорить нормально, спокойно, то есть в обычной манере. Также пользователи должны понимать, что жевательная резинка, одышка, а также алкоголь негативно отражаются на голосе. Если человек простужен, то будет ли идентифицирован его голос? Не все характеристики вашего голоса пострадают, если вы простужены. Система голосовой идентификации все равно сможет узнать вас в случае обычной простуды. При серьезных заболеваниях горла, таких как ларингит, конечно, потребуются дополнительные средства идентификации. Каковы границы распознавания? В процессе голосовой идентификации (сравнение произнесенной фразы с ранее записанной) выдается список, который показывает насколько близко совпадает произнесенная идентификационная фраза с занесенной в базу данных. Система выдает цифры от -10,000 до +10,000. В теории, цифра 0 или меньше нуля показывает "вероятно обманщик"; цифра больше нуля показывает "вероятно правильный пользователь". Для того, чтобы быть уверенным в высоком уровне безопасности, сохраняя дружественность системы, для каждого порога установлен свой минимум. Также надо сказать, что установленные пороги распространяются как на оценку ложного доступа(false acceptance rate FAR), так и на оценку ошибочного отказа (false reject rate FRR). FAR и FRR. Что это обозначает? Уровень, по которому система будет пропускать пользователей, определяется каждой организацией. Часто администрация заявляет, что тех, кого система расценивает, как обманщика, вообще не пропускать (false acceptance rate FAR), и то, что не более х% правильных, действительных пользователей могут быть не узнаны системой (false reject rate FRR). В реальности надо признать, что ни одна система не может гарантировать 100% точность. FAR и FRR будут изменяться соответственно. Также многое зависит от характеристик окружающей обстановки, а также от уровня квалификации персонала. Действительно ли голосовая идентификация обеспечивает 100% гарантию безопасности? Нет такого решения, включая и биометрию, которое могло бы гарантировать 100% безопасность. Правда ли, что для сохранения голосового отпечатка нужно много места? В зависимости от длины устойчивого образца, системе понадобится от 20 до 40 Кб для голосового отпечатка. Ожидается, что в ближайшем будущем размеры будут уменьшены до 10-15 Кб. Кто уже пользуется голосовой идентификацией для обеспечения конфиденциальности информации? Применения систем голосовой идентификации уже можно встретить по всему миру. Компании радио- и телевещания используют системы голосовой идентификации для обеспечения безопасности данных, передаваемых на большие расстояния. Правительственные агентства используют такие системы для защиты жизненно важной и секретной информации. |