Arm Cortex-A77 - все, що потрібно знати

Автор: Randy Alexander
Дата Створення: 2 Квітень 2021
Дата Оновлення: 1 Липня 2024
Anonim
Arm Cortex-A77 - все, що потрібно знати - Технології
Arm Cortex-A77 - все, що потрібно знати - Технології

Зміст


Поряд із своїм новим графічним процесором Mali-G77 та процесором дисплея Mali-D77, Arm представила свою останню високопродуктивну модель процесора - Cortex-A77. Як і у минулому році Cortex-A76, Cortex-A77 розроблений для додаткового рівня додатків, що вимагає низької енергоспоживання підпису Arm. Все, починаючи від смартфонів і закінчуючи ноутбуками, і, швидше за все, не тільки.

Завдяки Cortex-A77, Arm орієнтується на максимальне збільшення інструкцій за цикл / такт (IPC), які вона може управляти в порівнянні з Cortex-A76. Частотні частоти, енергоспоживання та площа - усі розроблені таким чином, щоб вони залишалися приблизно в одному і тому ж самому центрі, але нове ядро ​​може розчавитись завдяки більшій інструкції одразу. Для цього Arm сконструював ще більш широке ядро, ніж минулого року, і вніс низку вдосконалень, щоб ядро ​​процесора живилося чим завгодно. Але перш ніж ми дістанемося до цього, давайте заглибимось у оглядові та показники високого рівня.

Попадання цілей ефективності

Ще в серпні 2018 року Arm нехарактерно поділив дорожню карту процесора до 2020 року. З дизайну Cortex-A73 до Hercules до 2016 року компанія обіцяє в 2,5 рази збільшити ефективність обчислень. Справедливий шматок цієї величезної проекції був досягнутий з великим зрушенням мікроархітектури з Cortex-A76, більш високими сучасними тактовими частотами, а також з переходом від 16 до 10 і тепер 7 нм виготовленням з 5 нм для подальшої роботи. До минулого року було досягнуто приблизно 1,8 разів надбавки дорожньої карти, а Cortex-A77 забезпечує приблизно 20 відсотків подальшого збільшення IPC. Це ставить нас на шляху до досягнення 2,5-кратної цілі Arm, хоча мобільні пристрої з обмеженим енергетичним та тепловим бюджетами не очікують побачити всі ці вигоди.


Для порівняння, минулорічний Cortex-A76 забезпечив 30-35-відсотковий приріст порівняно з Cortex-A75. Цього року ми дивимось на більш приглушений, але все ще значний 20-відсотковий коефіцієнт виграшу IPC між A77 та A76. Це хороша новина, оскільки означає більшу продуктивність, дотримуючись аналогічних теплових та енергетичних обмежень, як раніше. Ідея полягає в тому, що A77 приблизно на 17 відсотків більший, ніж A76, тому коштуватиме трохи більше в плані кремнію. Якщо ви хочете порівняти з лідерами настільних ПК, AMD зуміла 15-відсоткове підвищення IPC між Zen2 та Zen +, а Intel IPC залишається практично статичним протягом багатьох років.Звичайно, ми говоримо тут про різні сегменти ринку, але це демонструє, як команда дизайнерів Arm в останніх поколіннях зробила вражаючі успіхи.

20-відсоткове підвищення продуктивності пропонується для SoC-систем на базі Cortex-A77 нового покоління


Звідси випливає, що A76 відзначився значним мікроархітектурним зрушенням з величезними підвищеннями продуктивності, тоді як ми повернулися до покращення рівня оптимізації з A77. Якщо це не вийде, давайте зануримось у те, що нового у Arm Cortex-A77.

Cortex-A77 будується на мікроархітектурі A76

Ключовим фактором для розуміння різниці між Cortex-A77 та A76 є розуміння того, що розуміється під "ширшим" дизайном основної ями. По суті, ми говоримо про можливість виконувати більше інструкцій для кожного тактового циклу, що збільшує пропускну здатність ядра. Домогтися цього права є дві важливі частини - збільшити кількість одиниць виконання, щоб виконати обробку, і забезпечити, щоб ці підрозділи підтримувались добре. Почнемо з останньої частини і зосередимось у частинах диспетчеризації, кешу та гілок передбачувача SoC.

Cortex-A77 бачить 50-відсотковий приріст для ширини відправки, до шести інструкцій на цикл із чотирьох із A76. Це означає, що додаткові інструкції спрямовуються до ядра виконання для кожного тактового циклу для отримання більшого потенціалу. Вікно виконання замовлення поза замовленням також збільшується в результаті, збільшуючи до 160 записів, щоб виявити більше паралелізму. Існує знайомий кеш-кеш інструкцій 64K, тоді як цільовий буфер відгалуження (BTB), який містить адреси для передбачувача гілки, на 33 відсотки більше, ніж раніше, щоб обробляти зростання паралельними інструкціями. Тут нічого незвичайного, це по суті більш широка версія дизайну минулого року.

Більш інтригуючим доповненням переднього кінця є абсолютно новий кеш-пам'ять MOP 1.5K, який зберігає макро-Ops (MOP), які подаються назад з блоку декодування. Архітектура процесора Arm розшифровує інструкції з додатка користувача на більш дрібні макрооперації, а потім далі в мікрооперації, які розуміє ядро ​​виконання. Ви можете бачити це на діаграмі вище в розділі декодування. Кеш MOP використовується для зниження штрафу за пропущені гілки та флеші, оскільки ви тримаєте макро-операції, а не розшифровуєте їх знову, і збільшуєте загальну пропускну здатність ядра. Витяги з MOP, а не i-cache обходять етап декодування, зберігаючи один цикл. Arm стверджує, що кеш-пам'ять MOP може досягти 85 відсотків або більше частоти звернень у різних робочих навантаженнях, що робить його дуже корисним доповненням до стандартного i-кешу.

Переходячи до основної частини процесора виконання, відзначте додавання четвертого ALU та другого підрозділу відділення. Цей четвертий ALU збільшує загальну кількість пропускної здатності процесора на 50 відсотків. Цей додатковий ALU здатний виконувати основні інструкції з одного циклу (такі як ADD і SUB), а також двоциклові цілочисельні операції, такі множення. Два інших ALU можуть обробляти лише основні інструкції на один цикл, тоді як підсумкова одиниця заряджається більш досконалими математичними операціями, такими як поділ, множення-накопичення тощо. Другий підрозділ гілки всередині ядра виконання подвоює кількість одночасних гілок стрибків core може обробляти, що корисно в тих випадках, коли дві з шести відправлених інструкцій - це стрибки гілки. Це звучить трохи дивно, але внутрішнє тестування в Arm виявило переваги продуктивності від прийняття цього другого блоку.

Cortex-A77 пропонує покращений паралелізм та нове використання кешів, що попередньо вибирають

Інші зміни в ядрі процесора включають додавання другого конвеєра шифрування AES. Тепер у трубопроводах для зберігання даних є виділені порти випусків, щоб подвоїти пропускну здатність пам'яті. Ці порти раніше ділилися з АЛУ, які іноді можуть стати вузьким місцем. Також є вдосконалювач даних нового покоління для підвищення енергоефективності, а також збільшення пропускної здатності до системи DRAM.

Частина цієї системи в Cortex-A77 також має абсолютно нову систему попереднього вибору системи, що обізнана з системою. Це покращує продуктивність пам’яті на основі широкого діапазону підрахунків ядер процесора, ємності кеш-пам'яті та затримок та конфігурацій підсистеми пам’яті в кінцевих пристроях. Спеціальне обладнання для спілкування з блоком динамічного планування (DSU) як складової частини кластера процесорів DynamIQ, який відстежує використання спільного кешу L3. Основні характеристики динамічного рівня відстані та агресивності для зменшення використання кешу в ситуаціях, коли пропускна здатність L3 обмежена іншими ядрами процесора. Більш високі показники ядер, такі як Cortex-A77, швидше насичують доступ DSU до пам'яті, тоді як більш низькі потужності, як A55, навряд чи будуть.

Встановлюючи все це разом

У Cortex-A77 є багато невеликих змін, які суттєво відрізняються від його попередника. Коротше кажучи, новий кеш-пам'ять MOP A77s у поєднанні з ширшим та довшим вікном інструкцій допомагає тримати покращені блоки ALU, відділення та пам’яті зайнятими завданнями. Дизайн електростанції Cortex-A76 було розширено, щоб покращити його пропускну здатність ще більше, ніж A77, не покладаючись на більш високу тактову частоту.

Найбільший приріст продуктивності Cortex-A77 надходить у вигляді математики з цілим числом і плаваючою комою. Це підтверджується внутрішніми критеріями Arm, які демонструють 20–35-відсоткове підвищення продуктивності в цілому цілому та плаваючій точці відповідно. Поліпшення пропускної здатності пам’яті сягають десь від 15 до 20 відсотків, знову ж таки підкреслюючи, що найбільший приріст відбувається у вигляді скорочення числа. В цілому, ці вдосконалення дають A77 в середньому на 20 відсотків підвищення в порівнянні з попереднім поколінням. Ми також можемо побачити певні, більш незначні вигоди в результаті вдосконалених 7-нм виробничих процесів пізніше цього року або на початку 2020 року.

Що стосується смартфонів, то SoC, що працюють на Cortex-A77, призначені для високопродуктивних, флагманських продуктів. Arm повністю розраховує, що дизайн електростанції використовує 4 + 4 біт. Враховуючи збільшену пропускну здатність і невеликий наріст розміру площі A77, ми, швидше за все, побачимо, що дизайнери SoC продовжують знижувати тенденцію 1 + 3 + 4 або 2 + 2 + 4. З одним або двома потужними великими ядрами з більшими сховищами та більш високими тактовими частотами, підкріпленими 2 або 3 ядрами A77 з меншими розмірами кешу та меншими тактовими годинниками, щоб заощадити на енергії та площі. У кінцевому рахунку Cortex-A77 пише хороші речі для мікросхем смартфона та зростаючого ринку завжди підключених ноутбуків на основі Arm. Слідкуйте за анонсами кремнію пізніше цього року.

Тривалий час аркадні ігри були одними з найпопулярніших у світі. Зазвичай вони мають короткі ігрові часи, послідовний виклик та просту гру. Вони відзначаються збільшенням викликів у міру просування г...

Компанія AT&T завжди пропонує спеціальні пропозиції для задоволення своїх клієнтів. Сюди входять знижки на смартфони та інші технічні продукти, пропозиції BOGO, різні пакети тощо....

Вибір Сайту