Дослідники MIT створили новий тип штучного ока, шляхом об’єднання світлочутливої електроніки з нейронною мережею на одному крихітному чипі. Цей розумний чип може зрозуміти те, що він бачить. Для цього йому потрібно всього кілька наносекунд, що набагато швидше, ніж можуть існуючі датчики зображення.
Чому це важливо
Комп’ютерний зір є невід’ємною частиною багатьох пристроїв з ШІ – від безпілотних автомобілів до промислових роботів та інтелектуальних датчиків, які діють як наші очі у віддалених місцях – і машини стали дуже добре реагувати на те, що вони бачать. Але для розпізнавання більшості зображень потрібно багато обчислювальної потужності. Частина проблеми – вузьке місце в основі традиційних датчиків, які збирають величезну кількість візуальних даних, незалежно від того, чи корисно це для класифікації зображення. Скорочення всіх цих даних уповільнює роботу. Датчик, який захоплює і обробляє зображення одночасно, без перетворення або передачі даних, робить розпізнавання зображень знічно швидше, використовуючи набагато менше енергії.
Як працює розумний чип
Команда створила розумний чип з листа діселеніда вольфраму товщиною всього в декілька атомів, протравленого світлочутливими діодами. Потім вони підключили діоди для формування нейронної мережі. Матеріал, що використовується для виготовлення чипа, надає йому унікальні електричні властивості. Завдяки цьому світлочутливість діодів – вузлів у мережі – може бути змінена ззовні. Це означає, що мережу можна навчити класифікувати візуальну інформацію, регулюючи чутливість діодів, поки вона не дасть правильні відповіді. Таким чином, інтелектуальний чип навчався розпізнавати стилізовані піксельні версії літер n, v та z.
Цей новий датчик – ще один захоплюючий крок на шляху до збільшення кількості штучного інтелекту в апаратному забезпеченні, що робить його більш швидким і ефективним. Але попереду ще довгий шлях. Для початку, око складається тільки з 27 детекторів і не може мати справу з більш ніж блоковими зображеннями 3 х 3. Тим не менш, мікросхема може виконувати кілька стандартних контрольованих і неконтрольованих завдань машинного навчання, включаючи класифікацію та кодування букв. Дослідники стверджують, що масштабування нейронної мережі до набагато більших розмірів було б простим завданням.