Что действительно делают процессоры, сделанные для ИИ?
Крупнейшие технические игроки полностью приняли революцию искусственного интеллекта. Apple, Qualcomm и Huawei сделали мобильные чипсеты, которые предназначены для более эффективного решения задач машинного обучения, каждый из которых имеет несколько иной подход. Huawei запустила свой Kirin 970 в IFA в этом году, назвав его первым чипсетом с выделенным нейронным процессором (NPU). Затем Apple представила чип A11 Bionic, который поддерживает iPhone 8, 8 Plus и X. A11 Bionic предлагает нейронный движок, который, по словам компании, «специально разработан для машинного обучения», среди прочего.
На прошлой неделе Qualcomm анонсировала Snapdragon 845, который отправляет задачи ИИ в наиболее подходящие ядра. Между подходами трех компаний нет большой разницы - в конечном итоге это сводится к уровню доступа, который каждая компания предлагает разработчикам, и о том, сколько энергии потребляет каждая установка.
Прежде чем мы начнем с этого, давайте выясним, действительно ли чип ИИ действительно сильно отличается от существующих ЦП. Термин, который вы услышите много в отрасли со ссылкой на ИИ в последнее время, - это «гетерогенные вычисления». Это относится к системам, которые используют несколько типов процессоров, каждый со специализированными функциями, для повышения производительности или экономии энергии. Идея не нова - многие существующие чипсеты используют ее - три новых предложения, о которых идет речь, просто используют концепцию в разной степени.
Процессоры для смартфонов за последние три года использовали ARM's big.LITTLE architecture, которая сочетает относительно медленные энергосберегающие ядра с более быстрыми, энергосберегающими. Основная цель - использовать как можно меньше энергии, чтобы увеличить время автономной работы. Некоторые из первых телефонов, использующих такую архитектуру, включают Samsung Galaxy S4 с собственным чипом Exynos 5, а также Mate 8 и Honor 6 от Huawei.
В этом году «ИИ-чипы» делают эту концепцию еще одним шагом, добавив новый выделенный компонент для выполнения задач машинного обучения, или, в случае Snapdragon 845, используя другие малые ядра для этого. Например, Snapdragon 845 может использовать свой цифровой процессор сигналов (DSP) для решения долговременных задач, требующих много повторяющейся математики. С другой стороны, такие функции, как распознавание изображений, лучше управляются графическим процессором, сказал директор по управлению продуктами Qualcomm Гэри Бротман. Бротман возглавляет ИИ и машинное обучение для платформы Snapdragon.
Тем временем Apple A11 Bionic использует в своем графическом процессоре нейронный движок для ускорения Face ID, Animoji и некоторых сторонних приложений. Это означает, что когда вы запускаете эти процессы на своем iPhone X, A11 включает нейронный движок для выполнения вычислений, необходимых для проверки того, кто вы есть, или для отображения ваших мимических выражений.
Kirin 970 NPU принимает на себя такие задачи, как сканирование и перевод слов на снимках, сделанных с помощью Microsoft Translator, который пока является единственным сторонним приложением для оптимизации этого набора микросхем. Huawei заявила, что гетерогенная вычислительная структура «HiAI» максимизирует производительность большинства компонентов на ее чипсете, поэтому она может назначать задачи ИИ больше, чем просто NPU.
Отличия в стороне, эта новая архитектура означает, что вычисления машинного обучения, которые раньше обрабатывались в облаке, теперь можно более эффективно выполнять на устройстве. Используя другие компоненты, кроме CPU, для запуска задач ИИ, ваш телефон может делать больше вещей одновременно, поэтому вы вряд ли столкнетесь с задержкой при ожидании перевода или нахождении фотографии вашей собаки.
Кроме того, выполнение этих процессов на вашем телефоне вместо отправки их в облако также лучше для вашей конфиденциальности, поскольку вы уменьшаете потенциальные возможности для хакеров, чтобы получить ваши данные.
Еще одно большое преимущество этих чипов ИИ - экономия энергии. Энергия - это ценный ресурс, который нужно разумно распределить, поскольку некоторые из этих действий могут повторяться весь день. GPU имеет тенденцию высасывать больше энергии, поэтому, если что-то более энергоэффективное DSP может работать с аналогичными результатами, тогда лучше использовать последний.
Чтобы быть ясным, сами чипсеты не решают, какие ядра использовать при выполнении определенных задач. «Сегодня разработчики или OEM-производители хотят, чтобы они запускали их, - сказал Бротман. Программисты могут использовать поддерживаемые библиотеки, такие как Google TensorFlow (или, более конкретно, мобильную версию Lite), чтобы определять, на каких ядрах запускать свои модели. Qualcomm, Huawei и Apple работают с самыми популярными опциями, такими как TensorFlow Lite и Facebook Caffe2. Qualcomm также поддерживает новый Open Neural Networks Exchange (ONNX), в то время как Apple добавляет совместимость для еще большего числа моделей машинного обучения через свою базовую платформу Core ML.
Пока что ни один из этих чипов не принес очень заметных реальных преимуществ. Производители чипов будут использовать свои собственные результаты тестов и контрольные показатели, которые в конечном счете бессмысленны, пока процессы ИИ не станут более важной частью нашей повседневной жизни. Мы находимся на ранних стадиях внедрения машинного обучения на устройствах, и разработчики, которые использовали новое оборудование, немногочисленны и находятся далеко друг от друга.
Однако сейчас ясно, что гонка готова к тому, чтобы выполнять задачи, связанные с машинным обучением, на вашем устройстве намного быстрее и энергоэффективнее. Нам просто нужно подождать еще дольше, чтобы увидеть реальные преимущества этого стержня для ИИ.