A+ A A-

AMD Fusion для настольных систем в действии. Часть 1: архитектура, тесты CPU

  • Обновлено 01.01.2013 20:15
  • Автор: Заставной Михаил (Maikl)

Содержание материала

Несколько лет назад компания AMD объявила о новой концепции, названной AMD Fusion. Ее суть заключается в выпуске на потребительский рынок нового типа процессоров APU (Accelerated Processor Unit, ускоренный процессорный элемент), которые содержат в себе не только центральный процессор, но и графический процессор. Таким образом, появляется возможность создавать компактные системы с низким уровнем энергопотребления и достаточно высоким уровнем производительности.

AMD APU Fusion

В начале 2011 года первой ласточкой концепции AMD Fusion оказались процессоры для мобильных платформ: APU Ontario (C-серия) и APU Zacate (E-серия). Первые нацелены на использование в нетбуках, вторые – в ноутбуках и компактных настольных системах. Мы уже писали про них в статьях: "Эра APU AMD Fusion начинается", "CeBIT 2011: материнские платы и не только" и "Тестирование 15.6" ноутбука eMachines E644: младший брат в одежке старшего".

AMD Fusion С и Е-серии

 

Применение процессоров с интегрированным дискретным графическим процессором начального уровня позволило поднять общую планку производительности мобильных платформ при сохранении невысокого потребления, однако невысокая производительность процессорных ядер ограничивает их сферы применения и не позволяет на базе них создавать "настоящие" домашние мультимедийные системы.

Как и следовало ожидать, летом 2011 года состоялся анонс APU процессоров A-серии для настольных и мобильных систем под кодовым именем Llano.

    

Архитектура Llano

Особенностью процессоров APU Llano стало то, что в нем объединили центральный процессор (с количеством ядер до 4-х), дискретное видеоядро с блоком UVD3 (аппаратное декодирование видео) и поддержкой DirectX 11, а так же северный мост.

Подобный подход позволяет повысить суммарную производительность системы за счет использования вычислительной мощности процессорных и графических ядер. Однако для использования всего потенциала нужна соответствующая поддержка со стороны программного обеспечения.

Новые процессоры изготавливаются с применением 32 нм техпроцесса, при этом площадь кристалла составляет 228 мм2. Сам процессор содержит 1,45 млрд. транзисторов.

APU Llano

 

Фото кристалла процессора выглядит следующим образом:

APU Llano. Фотография кристалла

 

Размещение блоков на нем:

APU Llano. Размещение блоков на кристалле

    

Процессорные ядра x86

Основу архитектуры составляют процессорные ядра x86 предыдущего поколения с кодовым именем "STARS" (K10.5), в которые внесли незначительные улучшения. В итоге новая архитектура приобрела название "Husky".

Процессорные ядра x86. Husky

 

Количество процессорных ядер в "новой" архитектуре может составлять 2, 3 и 4, каждое из которых имеет по 1 Мбайту кеш-памяти L2. Некоторые модели приобрели поддержку технологии AMD Turbo Core – повышения частоты процессора с увеличением  нагрузки, при работе которой учитывается загрузка не только процессорных ядер, но и графического ядра (GPU), чтобы суммарный тепловой пакет (TDP) не превышал заданный.

Процессорные ядра x86. Технология AMD Turbo Core

 

В случае простоя GPU, частота процессорных ядер в режиме Turbo Core будет максимальной, при возрастании нагрузки на GPU частота процессорных ядер будет снижаться до приемлемого уровня TDP.

Процессорные ядра x86. Технология AMD Turbo Core

 

Таким образом ожидать чуда от работы процессорных ядер не стоит. Все осталось по-старому.

 

Интегрированное видеоядро Radeon HD 6xxx

Для того чтобы обеспечить пользователю приемлемую графическую производительность, компания AMD внедрила в состав процессора графическое ядро с кодовым именем Sumo. Основой GPU Sumo стала архитектура "Redwood", на котором построена дискретная видеокарта Radeon HD 5570. В итоге ядро Sumo приобрело 400 потоковых процессоров, 20 блоков текстурирования и 8 блоков растеризации.

GPU Sumo

 

Учитывая особенность организации, когда блоки можно отключать, у компании AMD появилась гибкая возможность предлагать пользователю модельный ряд процессоров с различной производительностью графической подсистемы.

Для аппаратного декодирования видео используется современный блок UVD 3, поддерживающий все современные форматы обработки видео.

GPU Sumo. UVD 3

 

Графическое ядро Sumo не имеет встроенной памяти и его архитектура приспособлена для использования оперативной памяти системы.   

Предусмотрена возможность организации режима Dual Graphics. Это разновидность режима CrossFireX, где используется интегрированное видеоядро и дискретная видеокарта. Единственное, AMD рекомендует использовать определенные типы дискретных видеокарт в зависимости от установленной модели Llano.

GPU Sumo. Dual Graphics

 

В итоге, в процессоре появилось современное графическое ядро начального уровня, способное предоставить пользователю большие возможности, по сравнению с другими поколениями интегрированной видеографики. А при необходимости увеличить производительность за установки второй видеокарты и включения режима Dual Graphics.

 

Северный мост

Использование интегрированного видеоядра в процессор, а так же общая память для процессора и видеоядра накладывает определенный отпечаток на требования к пропускной способности шины.

В первую очередь, контроллер памяти стал поддерживать более скоростную память DDR3-1866, тем самым увеличилась пропускная способность шины памяти до 29,8 Гбайт/сек.

Вместо привычной шины HyperTransport появилось два вида шин: Radeon Memory Bus и Fusion Compute Link.

Северный мост. Radeon Memory Bus и Fusion Compute Link

    

Radeon Memory Bus используется интегрированным графическим ядром и имеет более высокий приоритет обращения к системной памяти, по сравнению с другими запросами. Шина Fusion Compute Link предназначена для взаимодействия процессорных ядер и GPU через обращения к общей памяти, сохраняя когерентность кеша и памяти. Таким образом, CPU и GPU смогут взаимодействовать друг с другом для решения одной общей задачи, но это если только она будет поддерживать APU.

Контроллер шины PCI-E имеет до 24 линий PCI-E 2.0, из которых 16 отводятся для подключения дискретной видеокарты, 4 линии используются для связи с южным мостом (шина UMI – Unified Media Interface), а остальные 4 необходимы для работы периферийных устройств.

Северный мост. Контроллер шины PCI-E

Предусмотрена возможность работы двух дискретных видеокарт в режиме CrossFireX с разделением линий PCI-E x16 на две PCI-E x8.

 

Платформа Lynx

Переход к концепции Fusion потребовал изменения структуры материнских плат, в частности, в них остался только южный мост (Fusion Controller Hub, FCH), ведь все остальное было интегрировано в процессор Llano.

Платформа Lynx

 

Всего предложено 2 реализации FCH: A75 и A55.

Платформа Lynx. А75

Платформа Lynx. А75

Технические характеристики представлены в таблице ниже:

Характеристика

FCH A75

FCH A55

Техпроцесс, нм

65

Потребление, Вт

7,8

7,6

SATA 3.0

6

Нет

SATA 2.0

Нет

6

RAID

0, 1, 10

Поддержка FIS

Есть

Нет

HD аудио

Есть

PCI-E GPPs

4x1 Gen 2

Шина UMI

x4 Gen 2 +DP

USB 3.0

4

Нет

USB 2.0

10

14

USB 1.1

2

2

Контроллер SD

Есть

Поддержка IR

Есть

Поддержка PCI 33 МГц

до 3 слотов

 

Основное их отличие - в поддержке старшей моделью A75 современных интерфейсов SATA 6 Гбит/сек и USB 3.0. Младшая имеет поддержку SATA 3 Гбит/сек и USB 2.0.

Изменился и сокет процессорного разъема, теперь он называется Socket FM1 и имеет 937 контактов.

Сокет FM1

 Несмотря на изменение конструктива сокета с точки зрения физических размеров крепления для установки систем охлаждения, оно совпадает с предыдущим креплением для сокета AM3, в итоге удалось оставить совместимость с существующими системами охлаждения.

 

Модельный ряд процессоров Llano

Как можно было заметить, в модельный ряд процессоров входят 3 семейства, отличающиеся типом используемого дискретного ядра.

Модельный ряд процессоров Llano

Модельный ряд получился сравнительно небольшой, отсутствуют модели с разблокированным множителем (серия Black Edition), но, в зависимости от назначения, есть из чего выбрать.

Стоит отметить, что топовую систему на этих процессорах навряд ли удастся собрать из-за невысокой частоты процессорных ядер, да и для оверклокеров процессоры с заблокированным множителем малоинтересны.

Вполне возможно, после отладки производства, появятся и новые модели – с высокой частотой и разблокированным множителем.

Комментарии