Штучний інтелект від Google розпізнає окремий голос у натовпі

Опубликованно 03.05.2018 18:50

Розробка Google - це прорив в аналізі голосових даних, яка допоможе інвалідам по слуху та підвищить ефективність сервісів самої Google. Про це пише Engadget.

Розпізнати голос людини, навіть при наявності перешкод, нескладно — проблема в тому, щоб ідентифікувати його власника. Розробники Google просто приставили до мікрофона відеокамеру з алгоритмом, який реагує на міміку людини. Система порівнює руху на обличчі мовця, "читає по губах" і паралельно аналізує звук. Якщо результати співпадають — відмінно, ІІ виокремлює цього персонажа і може стежити лише за його промовою на тлі загальної какофонії звуків.

Нейронну мережу спочатку навчили самій техніці читання по губах, потім навчили відрізняти людей, які говорять від просто сміються, розпізнавати міміку при розмові, навіть якщо особа частково приховано бородою або мікрофоном. Потім в систему додали механізм сортування — коли оратор обчислений, його дані надходять в окремий акустичний профіль. Завдяки цьому ИИ може розрізняти слова різних людей, навіть якщо ті спеціально намагаються його заплутати і промовляють або співають в унісон.

Розуміти розмова конкретної персони — добру справу не тільки для спостерігача. Наприклад, можна з великою точністю передавати на слуховий апарат слова саме співрозмовника інваліда, відсіваючи інші голоси, як шум. Або розширити функціонал відеочатів, начебто Hangouts та Duo. Плюс, це нові можливості для систем голосового управління, так і зламати захист по голосу тільки за допомогою фальшивої акустичної записи тепер буде неможливо.

Інженери компанії поки не розуміють, як можна використовувати розроблену технологію. Видання зазначає, що область застосування такої системи дуже широка, починаючи з групових відеочатів, записи голосу, а також взаємодії зі слуховим апаратом.

Категория: Новости

Штучний інтелект від Google розпізнає окремий голос у натовпі

Спонсор

Спонсор

Реклама

Тут ваша реклама