Робота, яка стала пристрастю на все життя: голосові технології

Сьогодні рідко хто сподівається, що буде займатися однією справою все життя. Але це не про співробітника Microsoft Філа Аллеву (Fil Alleva). Він вже чотири десятиліття займається технологіями розпізнавання голосу.

«Я почав працювати в цій сфері в 1977 році, – розповідає він. – Скоро вже буде 40 років, як я в ній». Проте Аллева не планував одразу стати спеціалістом з комп’ютерних технологій. Під час навчання в Університеті Карнегі-Меллон він хотів бути інженером-хіміком.

Це змінилося, коли він зустрів професора Раджа Редді (Raj Reddy) на вступних заняттях з програмування. Скоро Аллева влаштувався на роботу програмістом за $2 на годину, щоб не працювати в кафетерії навчального закладу. «Радж був піонером у штучному інтелекті та розпізнаванні мови, – розповідає Аллева. – Він навчив мене всього, що знав. Ми працювали разом 17 років».

З того часу Аллева почав мріяти про день, коли люди зможуть взаємодіяти з комп’ютерами так само, як між собою – за допомогою слів. У 1993 році він почав працювати у Microsoft, і його наробітки втілилися в багатьох продуктах. Вони сьогодні впливають на життя тисяч людей у всьому світі. «Cortana є, на нашу думку, незамінною програмою для мови. Це агент, який стане ключовим способом взаємодії з комп’ютерами – сервісами, програмами, аналітикою тощо, – пояснює експерт. – Виконуючи машинне навчання та обробку мови для Cortana, стало зрозуміло, що ми одна з кількох компаній, які можуть створити продукт та надати його сотням мільйонів користувачів. Останні потребують його для продуктивної щоденної роботи».

Аллева працює в Microsoft вже 25 років і каже, що компанія така ж прогресивна, як і в перший день його роботи в ній. «Якщо ви хочете перебувати на вершині технологій та створювати штучний інтелект, який додає продуктивності, – Microsoft є саме таким місцем, – каже він. – Ми маємо персонал, дані та стратегію втілення».

Сьогодні Аллева на власні очі бачить результати своєї роботи, але так було не завжди. «Я зустрічався з однокласниками, які займалися іншими чудовими речами. Вони запитували мене, чи я досі працюю у сфері розпізнавання мови, – розповідає експерт. – Люди казали, що це технологія майбутнього, і вона завжди такою залишатиметься».

Помітні зміни почалися близько десятиліття тому. «Приблизно десять років тому люди почали казати, що мовні технології ще не працюють, але це може скоро змінитися, – згадує Аллева. – Зараз це стало сучасною технологією, і люди вже так не кажуть».

Рішення з автоматичної обробки мови сьогодні використовуються все частіше. «Microsoft має багато продуктів, які підтримують таку технологію, – каже експерт. – Це стало звичною справою. Якщо ви цікавитеся машинним навчанням сьогодні, ви маєте радіти досягненням глибокого навчання».

Алгоритми глибокого навчання дозволяють класифікувати дані на високому рівні. Подібні розробки сьогодні стають популярнішими, і Аллева бачить у них багато перспектив. «Штучні нейромережі розвиваються кілька десятиліть. Але тільки останні чотири чи п’ять років ми змусили їх працювати добре, – говорить він. – З того часу можливості значно змінилися. Системи стають кращими значно швидше».

Сьогодні ця галузь потребує все більше фахівців. «Розвиток наступного покоління машинного навчання значно прискорився, – каже Аллева. – Ми вже пройшли три покоління за останні два роки. Раніше на одне покоління нам потрібно було 10 років. Це дуже захопливо. Microsoft виконує передову роботу з точки зору нових типів машинного навчання. Я думаю, що з такими інструментами можливості інновацій збільшуються».

Для Аллеви під час його роботи над технологіями розпізнавання мови не стояло питання, чи будуть ці рішення стимулом для інновацій. Його цікавило, хто переведе подібні рішення на новий рівень. «Коли я знаходжу когось, хто прагне почати, я кажу, що треба знати, над чим працюєш. А потім треба це робити, – розповідає він. – Це чудовий підхід до кар’єри в будь-якій компанії, але особливо – в Microsoft».