Международная группа исследователей из США и Китая спроектировала и построила чип, который выполняет вычисления непосредственно в памяти периферийных устройств и может запускать широкий спектр приложений искусственного интеллекта (ИИ). Об этом сообщает портал TechXplore. Перевод основных положений публикации представлен изданием discover24.

Нейроморфный чип NeuRRAM приближает ИИ к работе на широком спектре периферийных устройств, способных выполнять сложные когнитивные задачи в любом месте и в любое время, не полагаясь на сетевое подключение к централизованному серверу. Подобные приложения, вынужденно требующие сетевое подкулючение, сейчас изобилуют в каждом уголке мира и во всех аспектах нашей жизни: от смарт-часов до гарнитур виртуальной реальности, смарт-наушников, смарт-датчиков на заводах и вездеходов для исследования космоса.

Чип NeuRRAM в два раза более энергоэффективен, чем современные чипы «вычисления в памяти» (инновационный класс гибридных чипов, обеспечивающих столь же точные вычисления, как и обычные чипы). В то же время обычные платформы ИИ намного крупнее и ограничены необходимостью использования больших серверов данных, работающих в «облаке».

В настоящее время вычисления с применением ИИ требуют много энергии и мощных аппаратных ресурсов. За счет снижения энергопотребления, необходимого для применения ИИ на периферии, чип NeuRRAM может привести к созданию более надежных, интеллектуальных и доступных периферийных устройств. Это также может привести к повышению конфиденциальности данных, поскольку их передача в «облако» сопряжена с повышенными рисками безопасности.

В микросхемах ИИ перемещение данных из памяти в вычислительные устройства является одним из основных узких мест. «Это эквивалентно восьмичасовой дороге на работу при двухчасовом рабочем дне», – пояснил Вейер Ван, один из ведущих разработчиков NeuRRAM.

Чтобы решить эту проблему, исследователи использовали так называемую резистивную память с произвольным доступом – тип энергонезависимой памяти, который позволяет выполнять вычисления непосредственно в памяти, а не в отдельных вычислительных блоках. RRAM и другие новые технологии памяти, используемые в качестве массивов синапсов для нейроморфных вычислений, впервые были разработаны в лаборатории Филипа Вонга, научного руководителя Вана в Стэнфорде и основного участника текущего исследования.

Ключом к энергоэффективности NeuRRAM является инновационный метод определения выходных данных в памяти. В традиционных подходах в качестве входных данных используется напряжение, а в качестве результата измеряется ток. Но это приводит к необходимости более сложных и энергоемких схем. В NeuRRAM команда разработала нейронную схему, которая измеряет напряжение и выполняет аналого-цифровое преобразование энергоэффективным способом. Это измерение в режиме напряжения может активировать все строки и все столбцы массива RRAM за один вычислительный цикл, обеспечивая более высокий параллелизм.

В архитектуре NeuRRAM нейронные схемы CMOS физически чередуются с модулями RRAM. Это отличается от обычных конструкций, в которых схемы CMOS обычно находятся на периферии RRAM. Соединения цифрового «нейрона» с массивом RRAM можно настроить так, чтобы они служили либо входом, либо выходом нейрона, что позволяет нейронной сети делать выводы в различных направлениях потока данных без ущерба по площади или энергопотреблению и, в свою очередь, упрощает реконфигурацию архитектуры.

Являясь нейроморфным чипом ИИ, NeuroRRAM выполняет параллельную распределенную обработку данных в 48 нейросинаптических ядрах. Чтобы одновременно достичь высокой универсальности и высокой эффективности, NeuRRAM поддерживает параллелизм данных, сопоставляя слой в модели нейронной сети с несколькими ядрами для параллельного вывода по нескольким данным, а также модельный параллелизм за счет сопоставления различных слоев модели с разными ядрами и выполнения логических выводов конвейерным способом.

Исследователи измерили энергоэффективность чипа по параметру, известному как «продукт задержки энергии» (EDP), который объединяет как количество энергии, так и количество времени, необходимое для завершения операции. Чем меньше этот показатель, тем эффективнее чип. NeuRRAM показал снижение EDP в 1,6-2,3 раза, а также вычислительную плотность в 7-13 раз выше, чем у современных чипов.

Исследователи выполняли на чипе различные тестовые задачи с применением ИИ. Он достиг 99% точности в задаче распознавания рукописных цифр; 85,7% на задаче классификации изображений; и 84,7% в задаче распознавания голосовых команд Google. Кроме того, чип также добился 70-процентного снижения ошибок реконструкции изображения в задаче восстановления изображения. Эти результаты сравнимы с существующими цифровыми чипами, которые выполняют вычисления с той же битовой точностью, но много большими затратами энергии.

Разработка NeuRRAM стала результатом совместных усилий международной группы исследователей. Специалисты из Калифорнийского университета в Сан-Диего разработали схемы CMOS, которые реализуют нейронные функции, обучили модели ИИ и создали цепочку программных инструментов, которая отображает приложения ИИ на чипе.

Помимо этого, массив синапсов RRAM и условия его работы были тщательно оптимизированы в Стэнфордском университете. Непосредственное изготовление массива RRAM и его интеграцию в CMOS осуществили специалисты Университета Цинхуа в Пекине (КНР).

Следующие шаги, намеченные исследовательской группой, включают в себя улучшение архитектуры и схем, а также масштабирование проекта до узлов с более продвинутыми технологиями. Исследователи также планируют заняться другими приложениями, такими как импульсные нейронные сети.