AMD Radeon HD 6000 стали первыми графическими процессорами компании, из логотипа и из названия которых полностью исчезло какое-либо упоминание об ATI, канадском разработчике видеокарт, купленном AMD в 2006 году. Карты предыдущей серии носили официальное название ATI Radeon HD 5000.
Особенности микроархитектуры Northern Islands
Поговорим об архитектурных отличиях семейства Radeon HD 6000 от ускорителей предыдущего поколения. Интересующихся конструктивными особенностями Radeon HD 5000 отсылаем к подробной статье о микроархитектуре R800.
Начнём с графических процессоров Barts, на основе которых выпускаются видеокарты AMD Radeon HD 68xx. Обратимся к блок-схеме этого чипа.
Нетрудно заметить, что в новой микросхеме уменьшилось общее число универсальных процессоров (унифицированных шейдеров): до 1120 по сравнению с 1600 в Cypress. В чипе 14 SIMD-ядер, каждое из которых состоит из 16 блоков суперскалярных потоковых процессоров по пять вычислительных ядер ALU (архитектура VLIW5). Число блоков текстурирования - 56, на каждый SIMD-блок приходится по четыре текстурных. Для связи с видеопамятью типа GDDR5 применяется 256-битная шина с четырьмя 64-разрядными двухканальными контроллерами.
Инженеры AMD не ограничились чисто количественными сокращениями SIMD-ядер, в Barts были внесены и качественные изменения. Главное из них - обновлённый аппаратный движок тесселяции 7-го поколения (по неким внутренним подсчётам AMD). Разработчики говорят об улучшенных механизмах управления потоками и буферизации и утверждают, что по геометрической производительности новый движок не уступает тесселятору чипов NVIDIA на архитектуре Fermi, ранее значительно опережавшему решения AMD. В качестве фактора тесселяции было выбрано значение в 16 пикселей: более «мелкие» полигоны способны лишь тормозить расчёты, не давая принципиального повышения качества изображения.
В Barts также доработаны алгоритмы анизотропной фильтрации и реализован новый механизм сглаживания Morphological Anti-Aliasing (MLAA). Фактически это программный фильтр пост-обработки для двухмерного изображения, рассчитывающий «полутоновые» переходы между пикселями и делающий картинку более естественной.
Из важнейших аппаратных изменений необходимо упомянуть также уницифированный модуль видеодекодера третьего поколения (UVD3), способный аппаратно декодировать не только традиционные форматы H.264 или MPEG-2, но и MPEG-4 (DivX/XviD) и Blu-ray, включая Blu-ray 3D. UVD3 реализован во всех чипах нового поколения, за исключением Radeon HD 6750 и HD 6770 на базе старых микросхем Juniper, где применяется UVD2. Поддерживаются самые свежие версии цифровых видеоинтерфейсов: DisplayPort 1.2 и HDMI 1.4a (с возможностью передачи 3D-видео).
На интерфейсах стоит остановиться отдельно, поскольку все карты серии Radeon HD 6000, включая самые доступные, поддерживают фирменную технологию AMD Eyefinity, позволяющей за счёт вывода нескольких каналов по шине DisplayPort подключать к одному разъёму сразу несколько мониторов. Пропускной способности интерфейса DisplayPort 1.2 достаточно для одновременного подключения к одному порту четырёх дисплеев. Возможны две конфигурации: использование специального хаба (разветвителя) оснащённого набором различных интерфейсов (DP, VGA, DVI или HDMI), либо последовательное соединение дисплеев, полностью совместимых с DisplayPort 1.2, то есть имеющих как входы, так и выходы DP.
Наконец, была переименована технология неграфических вычислений ATI Stream, которая теперь официально называется AMD Accelerated Parallell Processing. Принципиальных аппаратных доработок здесь нет, всё так же поддерживаются API OpenCL и DirectCompute.
Графический процессор Juniper не претерпел никаких изменений: это всё тот же урезанный Cypress с 10 SIMD-ядрами и видеодекодером UVD2, а чипы Radeon HD 6770 и HD 6750 в действительности представляют собой переименованные Radeon HD 5770 и 5770. Единственное отличие - поддержка HDMI 1.4, но неполная, без возможности работы с 3D-видео, которую даёт UVD3.
Бюджетный процессор Turks представляет собой серьёзно урезанный Barts: в нём 6 SIMD-ядер, в каждом из которых работают по 16 блоков потоковых процессоров с 5 ALU. Шина памяти сужена вдвое - до 128 бит. При этом в чипе реализованы все изменения, внесённые в Barts, включая улучшенный тесселятор, поддержку MLAA и видеодекодер UVD3. Младшая модификация Radeon HD 6570 может работать не только с видеопамятью GDDR5, но и с дешёвой памятью DDR3.
Чип начального уровня Caicos - предельно упрощённый Barts: в нём всего два SIMD-ядра и единственный 64-битный контроллер памяти. Производитель предлагает довольно широкий диапазон рабочих частот как процессора, так и видеопамяти, причём поддерживается оба варианта микросхем, как GDDR5, так и DDR3.
Графический процессор Cayman претерпел наибольшие изменения по сравнению с чипами Cypress предыдущего поколения, и они затронули не только чисто количественные показатели, но и саму архитектуру микросхемы. Для оптимизации энергопотребления и упрощения конструкции было принято решения отказаться от суперскалярной архитектуры VLIW5, в который каждый потоковый процессор оснащался пятью вычислительными блоками ALU: четыре из них были рассчитаны на выполнение простых арифметических операций, а пятый ("трансцендентный") - на сложные алгебраические вычисления. Эта схема была разработана ещё инженерами ATI, но спустя годы стало очевидно, что она неоправданно усложняет чипы, не принося существенного прироста производительности.
В Cayman применяются потоковые процессоры нового типа на базе архитектуры VLIW4, состоящие из четырёх одинаковых вычислительных модулей ALU. При этом сложные операции выполняются тремя из четырёх модулей, что теоретически снижает общую производительность, однако заметно упрощает микросхему и уменьшает её площадь. Зато распределять задачи по одинаковым модулям значительно проще, а значит, и быстрее, в особенности при вычислениях с двойной точностью.
Кроме того, для подъёма производительности в Cayman используется целый ряд новых конструктивных решений. Процессор состоит из 24 SIMD-ядра с 16-ю блоками процессоров по 4 ALU в каждом. Флагман получил сразу 16 текстурных блоков для обработки геометрии и два блока тесселяции уже восьмого поколения. По данным самой AMD, это позволило втрое повысить скорость тесселяции у Radeon HD 6970 по сравнению с предыдущим флагманом HD 5870.
В чипах Cayman также реализован новый алгоритм сглаживания Enhanced Quality Anti-Aliasing (EQAA) и обеспечивающий значительно более высокое качество изображения, чем MSAA при существенно меньшей потери производительности, составляющей не более нескольких процентов.
Наконец, последняя из важнейших новых технологий, появившихся в Cayman, это технология динамического управления рабочими частотами и напряжением графического ускорителя AMD PowerTune. Благодаря датчикам, встроенным во все блоки микросхемы, управляющий модуль постоянно отслеживает нагрузку, температуру и напряжение и при превышении установленных значений снижать частоты и напряжение, предотвращая повреждение чипа. Через утилиту ATI Overdrive можно устанавливать свои предельные значения, но, разумеется, под ответственность пользователя.
Модельный ряд Radeon HD 6000
В линейку AMD/ATI Radeon HD 6000 входят несколько графических карт: HD 6990 (Antilles), HD 6970 (Cayman XT), HD 6950 (Cayman Pro), HD 6870 (Barts XT), HD 6850 (Barts Pro), HD 6790 (Barts LE), HD6770 (Juniper XT), HD 6750 (Juniper Pro), HD 6670 и HD 6570 (Turks) и HD 6450 (Caicos).
К топовым моделям относится двухпроцессорная Radeon HD 6990, базовая HD 6970 и младшая HD 6950. Как обычно, хотя в HD 6990 устанавливаются два чипа HD 6970, их тактовая частота, а также частоты работы памяти, несколько понижены - это сделано для того, чтобы обеспечить разумное энергопотребление и благоприятный температурный режим для этой высокопроизводительной карты, по достоинству считающейся самым мощным в мире десктопным 3D-ускорителем и опережающей такого сильного конкурента, как двухпроцессорный NVIDIA GeForce GTX 590.
В картах применяется система двойных BIOS: одна из микросхем защищена от перезаписи, что позволяет восстановить работоспособность карты в случае неудачных экспериментов. Аппаратный переключатель BIOS расположен рядом с разъёмом CrossFireX.
Основные технические характеристики видеокарты Radeon HD 6990 (в скобках - данные для режима uber mode)
• Два графических процессора Cayman (кодовое название Antilles)
• 3072 универсальных процессора
• 2 х 96 текстурных и 2 х 32 блока блендинга
• Тактовая частота ядра - 830 (880) МГц
• Частота видеопамяти, эффективная - 5000 МГц (4 х 1250 МГц)
• Тип видеопамяти - GDDR5
• Объём памяти - 2 х 2 Гбайта
• Шина памяти - 2 х 256 бит
• Пропускная способность памяти - 2 х 160 Гбайт/с
• Максимальная скорость выборки - 159 (169) Гтекст/с
• Максимальная скорость закраски - 53 (56) Гпикс/с
• Максимальная производительность - 5099 Гфлопс
• Интерфейс - PCI Express 2.1 x16
• Поддержка CrossFireX
• Порты - DVI-I Dual Link, четыре mini DisplayPort
• Пиковое энергопотребление - 350 (415) Вт