Arm Mali-G77 GPU - повні входи та виходи

Автор: Randy Alexander
Дата Створення: 3 Квітень 2021
Дата Оновлення: 1 Липня 2024
Anonim
Arm Mali-G77 GPU - повні входи та виходи - Технології
Arm Mali-G77 GPU - повні входи та виходи - Технології

Зміст


Поряд зі своїм новим процесорним ядром Cortex-A77, Arm представила GPU нового покоління, призначене для смартфонів нового покоління. Mali-G77, не плутати його з новим дисплеєм процесора Mali-D77, відзначає відхід Arm's Bifrost архітектури та перехід на Valhall.

Ми через мить розберемося в тонких деталях нової архітектури. По-перше, ми перейдемо безпосередньо до того, що очікують користувачів у плані підвищення продуктивності.

Огляд продуктивності Mali-G77

Arm може похвалитися 40-відсотковим підвищенням продуктивності графіки на пристроях наступного покоління Mali-G77 в порівнянні з сьогоднішніми моделями Mali-G76. Ця кількість враховує процес, а також архітектурні вдосконалення. Mali-G77 може налаштовуватися від 7 до 16 шейдерних ядер, і кожне ядро ​​майже такого ж розміру, як ядро ​​G76. Це означає, що смартфони високого класу, швидше за все, поставлятимуться з аналогічними ядрами GPU, як і сьогодні - десь у підлітків. Це зручно, і це дозволяє нам зробити деякі спекулятивні оцінки продуктивності щодо існуючих чіпсетів.


Дивлячись на популярний бенчмарк Manhattan GFXBench, 40-відсоткове підвищення продуктивності відкриває значні переваги в порівнянні з обладнанням сучасного покоління. Для чіпа Adreno наступного покоління Qualcomm знадобиться власне суттєве підвищення продуктивності, щоб підтримувати рівень ігрового поля. Таблиці, здається, обертаються на користь Arm.

В архітектурному відношенні ефективність ігор збільшується на 20-40%, тоді як машинне навчання заробляє 60%

Виходячи з цього досить грубого паркового паркування, 10-ядерний Mali-G77 (конфігурація, яку ми часто бачимо від Huawei) виглядає майже за межею вершини цього покоління в лінійці мобільного графічного обладнання. 12-ядерна конфігурація, як правило, спостерігається в Samsung Exynos, забезпечує велику роль для останнього GPU Arm. Звичайно, реальні орієнтири залежатимуть від інших факторів, включаючи вузол процесу, кеш-пам’ять GPU, конфігурацію пам’яті LPDDR та тип програми, яку ви протестуєте. Тож візьміть наведений графік із здоровенною дозою солі.


Що стосується лише нової архітектури, Arm заявляє, що Mali-G77 пропонує в середньому на 30 відсотків поліпшення енергоефективності та щільності роботи. Завдяки точній підтримці продуктів INT8 також є величезний 60-відсотковий приріст додатків для машинного навчання. Очікування від ігрової ефективності встановлюються десь від 20 до 40 відсотків, залежно від назви та типу графічного навантаження.

Щоб зрозуміти, як саме Arm досяг цього підвищення продуктивності, давайте глибше зануримось у архітектуру.

Знайомтесь з Валхоллом, наступником Біфроста

Vahall - скалярна архітектура GPU другого покоління. Це 16-широкий механізм виконання основи, що по суті означає, що GPU виконує 16 інструкцій паралельно за цикл, на одиницю обробки, на ядро. У Bifrost це 4 та 8 ширини.

Інші нові архітектурні особливості включають динамічне планування інструкцій, що повністю керується апаратним забезпеченням, і абсолютно новий набір інструкцій, який зберігає оперативну еквівалентність Bifrost. Інші включають підтримку формату стиснення Arm AFBC1.3, цілі FP16 візуалізації, багатошарове відображення та виходи вершинних шейдерів.

Малі-G77 робить на 33% більше математики паралельно, ніж G76.

Ключі для розуміння основних архітектурних змін знаходять, вивчаючи блок виконання всередині ядра. Ця частина GPU відповідає за скорочення кількості.

Всередині двигуна виконання

У Bifrost кожне ядро ​​графічного процесора містило три двигуни виконання або два у випадку деяких дизайнів Mali-G52 нижнього класу. Кожен двигун містить i-кеш, файл реєстру та блок управління основою. У Mali-G72 кожен двигун виконує 4 інструкції за цикл, що збільшилося до 8 у минулому році Mali-G76. Розподіл цих трьох ядер дозволяє 12 та 24 32-бітні плаваючі точки з плаваючою точкою (FP32) плавними множинами-накопиченнями (FMA) інструкції за цикл.

У Valhall та Mali-G77 є лише один механізм виконання у кожному ядрі GPU. Як і раніше, в цьому двигуні розміщений блок управління, реєстр і ікаче, який тепер ділиться між двома технологічними блоками. Кожен процесорний блок обробляє 16 інструкцій основи за цикл, для загальної пропускної здатності 32 інструкцій FP32 FMA на ядро. Це 33-відсотковий приріст пропускної здатності для навчання через Малі-G76.

Arm перейшов від трьох до всього одного виконавчого блоку на ядро ​​GPU, але зараз є два процесорні блоки в ядрі G77.

Крім того, кожен із цих блоків обробки містить два нові математичні блоки функцій. Новий блок перетворення (CVT) обробляє основні цілі числа, логіку, гілки та інструкції перетворення. Спеціальний функціональний блок (SFU) прискорює ціле множення, ділення, квадратний корінь, логарифми та інші складні цілі функції.

У стандартному блоці FMA спостерігається декілька налаштувань, що підтримують 16 інструкцій FP32 за цикл, 32 FP16 або 64 крапки інструкцій продукту INT8. Ці оптимізації дають 60-відсоткове підвищення продуктивності в додатках машинного навчання.

Quad текстури Mapper

Інша ключова зміна Mali-G77 - це впровадження чотиригранного картографічного текстура, порівняно з подвійним картографом текстури в попередньому поколінні. Макет текстури відповідає за відображення 3D-полігонів у сцені у 2D-представлення, яке ви бачите на екрані. Він відповідає за вибірку, інтерполяцію та фільтрування, щоб згладити кут і переміщення вмісту, щоб уникнути різких, якісних країв.

Залишається недороге розгладжування для покращення якості зображення, але подвоєння продуктивності текстури є головною перевагою тут. Тепер текстурний блок обробляє 4 білінеарних текселі за годинник в порівнянні з 2 раніше, 2 трилінійні текстоліси на годинник і обробляють швидше фільтрацію FP16 та FP32.

Квадратний графік текстури розділений на два контури, забезпечуючи коротший конвеєр для потоків, які потрапляють на вміст у кеш. Шлях пропуску, який обробляє перетворення формату та декомпресію текстури, має більш широкий інтерфейс до кешу L2. Це також корисно для машинного навчального навантаження, яке може часто потребувати втягування нових даних із пам'яті.

З’єднайте все разом у Mali-G77

Arm зробила ряд інших перетворень на Mali-G77, щоб збігатися з основними змінами в архітектурі Valhall. Блок управління спрощений завдяки одній конструкції блоку виконання, тоді як внутрішній динамічний планувальник фактично дозволяє більш гнучко видавати інструкції всередині кожного ядра. Маючи більшу пропускну здатність у кожному ядрі, трафік даних також коротший і менший затримки, аж до всього 4 циклів від 8 раніше.

Нова конструкція також краще узгоджується з API Vulkan, спрощуючи дескриптори драйверів, щоб знизити накладні витрати для покращення продуктивності «до металу».

Підводячи підсумок, Mali-G72 та Valhall внесли важливі зміни від Bifrost, які обіцяють значне підвищення продуктивності для ігор та програм машинного навчання. Важливо, що дизайн відповідає таким же бюджетам енергії та площі, що і Bifrost, забезпечуючи, що мобільні пристрої зможуть запропонувати більш високу продуктивність, не турбуючись про витрати на тепло, енергію та кремній. Виходячи з прогнозів продуктивності, Mali-G77 повинен бути в змозі забезпечити наступне покоління Qrenocomm Adreno за найкращі гроші.

Глибоке навчання та штучний інтелект - це технології, які стоять у світі завтрашнього дня. Насправді до 2030 року консалтингова компанія PwC прогнозує, що майже 40 відсотків усіх робочих місць в США м...

Зараз на ринку є безліч бездротових зарядних пристроїв. Багато з них - це просто невеликі пластикові диски, які мають одну мету: зарядити смартфон. Бездротовим зарядним пристроєм Defene Duo є оновленн...

Ми Рекомендуємо Вам