A+ A A-

Инновации AMD в мобильном (низковольтном) сегменте — архитектура AMD Bobcat

  • Обновлено 01.01.2013 20:15
  • Автор: Николай Андрианов (Slayer)

Содержание материала


Блок целочисленных операций:
Блок целочисленных операций


Блок содержит два устройства ALU. Сам блок использует технологии, снижающие число операций по копированию/перемещению данных между исполнительными элементами блока целочисленных операций.

Блок операций с плавающей точкой:
Блок операций с плавающей точкой


Блок операций с плавающей точкой содержит два исполнительных устройства для данных вычислений (MMX Alu). Централизованный планировщик позволяет максимально заполнять стеки выполнения этих блоков.

Помимо блоков MMX Alu, есть отдельные блоки для исполнения других операций: FP Mul Unit – для операций умножения, FP Add Unit – для операций сложения.
Блоки FP Mul Unit и  FP Add Unit могут выполнять до двух операций за такт процессора.


Кэши первого и второго уровня.

Может, кто-то из читателей помнит фразу из рекламы американской версии фильма «Годзилла»:  «Размер имеет значение».
Размер процессорных кэшей имеет важное значение для повышения производительности процессора.

Ядро Bobcat обладает следующими кэшами:
Кэши ядра Bobcat


Основной кэш — кэш данных (DCACHE) имеет объем 32Кб. Ранее, во всех современных х86 архитектурах AMD использовался кэш данных объемом 64Кб на ядро.
Ширина шины кэша не стала меньше — все те же 64 байта, а ассоциативность выросла с двух до восьми.
Данная формула повторяет рецепт от Intel, применяемый начиная с архитектуры Intel Core 2 и заканчивая решениями Intel Core i.

Эффективному кэшированию данных помогает блок Load Store Unit:
Блок Load Store Unit


Load Store Unit взаимодействует с блоком шины (Bus Unit) и через него с кэшем второго уровня:
Кэш второго уровня


Кэш второго уровня имеет привычный размер в 512Кб, ширину шины 64 байта и ассоциативность 16. Поддержка четности также на месте.
Нововведением в кэше является его сниженная вдвое частота (множитель 2:1). Сделано это с целью снижения энергопотребления всего ядра. Как это скажется на производительности — пока неизвестно.

Блок шины осуществляет взаимодействие процессора и чипсета:
Взаимодействие процессора и чипсета



Конвейер ядра Bobcat:
Конвейер ядра Bobcat


Короткий конвейер позволяет достигнуть высокой производительности на такт, и у Bobcat конвейер достаточно короткий — 12 стадий.
Латентность загрузки данных на исполнение из кэша первого уровня — 3 такта процессора, из кэша второго уровня — 17 тактов процессора.

«Поэтажный» план ядра Bobcat:
План ядра Bobcat



Резюмирум обзор архитектуры ядра Bobcat:
Резюме обзора архитектуры ядра Bobcat



Снижение энергопотребления ядра Bobcat:
Снижение энергопотребления ядра Bobcat


Одним из ключевых элементов стратегии снижения потребления электричества ядром Bobcat при работе стало введение дополнительных кэшей, которые AMD называет Register Files (см. выше, в описании архитектуры).

Второй элемент снижения энергопотребления — более эффективное управление состояниями блоков процессора.

Третий элемент — ликвидация маркирующих битов инструкций в блоке ICACHE и другие оптимизации.

Четвертый элемент — снижение токов утечек.

Итог

Ядро Bobcat должно помочь AMD расширить свое присутствие в сегменте мобильных решений, в том числе, планируется создать процессоры с потреблением менее одного ватта и вторгнуться в сегмент бюджетных нетбуков.

Высокопроизводительные версии процессоров на ядре Bobcat должны занять свою долю в недорогих полноформатных ноутбуках.

Пожелаем AMD удачи, ведь конкуренция — это большой плюс для нас, потребителей!

 

Обсудить статью в конференции

Комментарии