Сліпі люди зможуть знову бачити з програмою на основі штучного інтелекту

У науковця Microsoft Анірадха Коула (Anirudh Koul) дідусь поступово втрачав свій зір. Повернути очі літній людині неможливо, але фахівець придумав, як бачити предмети без них. Він залучив свої знання, штучний інтелект та технології Microsoft, щоб створити програму Seeing AI.

Розробка такого програмного рішення почалася кілька років тому, коли Коул замислився про прогрес у машинному навчанні. Він побачив, що такі технології можуть дозволити розпізнавати предмети навколо. Два роки потому директор Microsoft Сатья Наделла Satya Nadella презентував Seeing AI на конференції Build. Розробка викликала велику цікавість: її показували навіть у Білому домі. «Ми були більш ніж приголомшені, – каже Коул. – Ми навіть не могли мріяти про такий масштабний відгук. Це викликало глибокі емоції».

Робота Коула для багатьох може здатися мрією: 80% часу він працює над власними проектами та ідеями. Фахівець каже, що це зручно робити в Microsoft, яка має передові інструменти, великі набори даних, талановитих працівників та інноваційний підхід. Останній дозволяє науковцям перетворювати свої ідеї на реальні продукти. «Я не міг бажати кращої кар’єри, – говорить Коул. – Якщо ви пристрасні, амбітні та маєте жагу до інновацій, немає кращого місця для вас, ніж Microsoft».

Ірен Чен (Irene Chen) показує «розумні» окуляри від Pivothead

 

Програма Seeing AI є однією з багатьох революційних технологій, які створили у Microsoft завдяки технологіям машинного навчання. Ця утиліта працює на смартфоні та використовує «розумні» окуляри від Pivothead. Вона залучає комп’ютерний зір, розпізнавання мови, щоб описувати оточення для сліпої людини, читати їй текст, відповідати на питання, розпізнавати емоції на обличчях. Короткий аналіз, наприклад, може розказати, що користувач дивиться на собаку, яка грається з фрісбі, на чергу біля каруселі видачі багажу або на людину, яка посміхається.

Однією з перших випробувати Seeing AI змогла студентка Університету Британської Колумбії Ірен Чен у рамках програми Garage Internship Program. У ній інтерни чотири місяці займаються розробкою нових продуктів. Спочатку Чен хотіла просто дізнатися більше про комп’ютерне бачення, але змогла зробити більше, долучившись до Seeing AI. Особливо інтерна вразили випробування розробки сліпою людиною. «Вона певний час звикала, але потім читала, що хотіла. Її обличчя сяяло, – згадує Чен. – Це був поворотний момент для мене. Я відчула, що моя робота справді важлива. Я такого раніше не відчувала».

Чен працювала над розробкою серверної частини. За її словами, там відбувається вся магія алгоритмів. Разом з нею над проектом також працюють фахівці з офісів Microsoft у Японії, Сербії, Каїрі, Лондоні, Вашингтоні та Каліфорнії. «Щоразу, як ми надсилали листа командам у всьому світі та прохали про допомогу, вони з радістю відгукувалися. Навіть попри те, що вони не брали прямої участі в проекті, – каже вона. – Це було неймовірно».

Коул також каже, що значення подібної відкритості важко переоцінити. «Можна відкрити список внутрішніх груп та сказати, що в тебе є проблема. Через одну-дві години отримаєш відповідь від п’яти людей з різних куточків планети, які є експертами у цій галузі, – розповідає він. – Це ніби миттєве вирішення проблем».

Сам Коул зацікавився технологіями ще в дитинстві в Індії. Його батьки купили комп’ютер на базі операційної системи MS-DOS з чорно-білим екраном. Вони мало користувалися придбаним девайсом, тоді як Коул почав писати на ньому програми. Він отримав диплом у комп’ютерних науках в Університеті Далхосі в Канаді та працював чотири роки інженером в Yahoo. Потім Коул пішов до Університету Карнегі-Меллон, щоб отримати диплом магістра в обробці даних. «Я був повністю занурений у програми з відкритим кодом, Linux та стартапи, – каже він. – Мені здавалося, що Microsoft була наче бегемотом, який повільно рухається».

Усе змінилося, коли з Коулом зв’язався рекрутер Microsoft. Фахівець пішов на інтерв’ю та відразу зрозумів, що його попередні думки були хибними. «Люди, яких я зустрічав, мали дух хакерства, – каже він. – Вони також мали величезні обсяги даних, які було важко отримати в будь-якій іншій компанії». У свій перший день у Microsoft він запустив програму, яка виконувалася дві години на кластері з тисячі комп’ютерів. На домашньому ПК, згадує Коул, це тривало б сім місяців. «Вони зробили інструменти доступними, тому науковець з обробки даних може дуже швидко проводити ітерації та отримувати відповіді», – говорить він.

Проект Seeing AI зародився для минулорічного однотижневого хакатону. Коул поділився своєю ідеєю з колегами, які працювали з організаціями для сліпих. Багатьом його пропозиція здалася надто амбітною, але йому вдалося зібрати команду із 16 учасників з різних офісів Microsoft. «З прогресом у комп’ютерному баченні та машинному навчанні я знав, що ми зможемо створити щось більш корисне, ніж вже існує», – каже він.

Подібну ідею також пробував втілити Саквіб Шаїх (Saqib Shaikh) з офісу Microsoft у Лондоні. Він працює програмним інженером та сліпий із 7 років. Як тільки Шаїх дізнався про проект Коула, він зв’язався з ним. «Ми говорили годинами про різні ідеї та технології», – згадує Шаїх.

Проект Seeing AI змагався з 13 тисячами інших учасників і виграв у категорії «Технології заради кращого». «Це було неймовірно, – ділиться Шаїх. – Ми вирішили, що цим варто займатися. Ми хотіли досягти успіху незалежно від чогось. Перемога в хакатоні була ягідкою на торті».

Після хакатону команда продовжила роботу над проектом. Начальники Шаїха побачили його пристрасть та дали йому два місяці на роботу із Seeing AI. Коул також залучив до роботи інтернів дослідної лабораторії Garage.

«Microsoft надала можливість безпосередньо працювати зі спільнотами сліпих, доступ до великих обчислювальних ресурсів та можливість демонструвати роботу всьому світу, – каже учасниця проекту Маргарет Мітчел (Margaret Mitchell). – Більше немає такого місця, яке поєднує свободу та ресурси».

Коул каже, що проект, швидше за все, не мав би майбутнього поза Microsoft. «Я бачив багато розробок для людей з обмеженими можливостями, які б не вийшли, якби їх розробляли поза Microsoft, – говорить він. – Доступність глибоко вбудована в нашу культуру. Вона заохочує людей думати, як зробити речі сприйнятливими для всього суспільства».

Проект Seeing AI є лише початком, адже фахівці мають багато гарних ідей. Дідусь Коула мало знав про цей проект, але він був вражений тим, над чим працює його онук. Сам Коул вдячний, що може перетворювати свої ідеї на реальні продукти. «У чому цікавість працювати, якщо ти не побачиш втілення ідеї в життя?», – каже він.