Смекни!
smekni.com

Архитектура видеоадаптеров (стр. 5 из 5)

Все дорожки на плате объединяют между собой графическое ядро (GPU – графический процессор, видеоядро), видеопамять, раздельные подсистемы питания ядра и памяти (иногда и разъём для дополнительного питания – в случае мощной видеокарты), интерфейсный разъём для подключения к материнской плате, а также разъёмы для подключения мониторов и телевизора.

Ключевым компонентом любой современной видеокарты является графический процессор, который занимается расчётами выводимой на экран информации и трёхмерных сцен. На данный момент разработкой графических процессоров занимаются в основном компании NVIDIA, продвигающая серию GeForce, и AMD, купившая канадскую компанию ATI с её линейкой Radeon. Остальные игроки графического рынка, увы, не выдержали конкуренции и той скорости, с которой разрабатываются очередные поколения видеокарт, и если и выпускают свою продукцию, то отличной производительностью и массовостью похвастаться не могут. В зависимости от того, какой GPU положен в основу видеокарты, определяются её характеристики: поддержка тех или иных технологий визуализации и рендеринга, тип памяти и ширина её шины.

Графическое ядро представляет собой припаянный к плате чип, в большинстве случаев без защитной крышки, кристалл которого содержит сотни миллионов транзисторов (даже в несколько раз больше, чем у центральных процессоров). Каждый такой чип состоит из вычислительных блоков, контроллеров шины и памяти, блоков для вывода видеоинформации (RAMDAC). Вся эта структура определяется архитектурой ядра, которая сперва разрабатывается для самого мощного видеоадаптера в семействе-поколении, например: G70, G80 – NVIDIA, R580, R600 – AMD. Затем «топовое» ядро упрощается для менее производительных решений методом исключения определённых блоков. Случаи разработки принципиально новых ядер для среднего и нижнего уровня рынка довольно редки.

Для того чтобы удалось разместить всё больше и больше транзисторов в кристалле ядра, используются новые, более тонкие техпроцессы, благодаря которым уменьшаются размеры элементов и повышается рабочая частота чипа. На данный момент графические процессоры производятся по 90, 80 и 65 нм технологическим нормам. В сравнении с концом 90-х годов и началом 2000-х, когда доминировал техпроцесс 250-220 нм, современное производство без каких-либо оговорок можно считать настоящим прорывом, тем более что на носу уже техпроцесс 45 нм. Общее правило «тоньше техпроцесс – выше частота – меньше тепла» объясняется следующим образом: транзистор, мельчайшая единица, из которого состоят все блоки GPU, представляет собой своеобразные ворота для электронов. Стенки и «створка ворот» – затвор транзистора – изготавливаются из диэлектрика, не пропускающего ток, а передаются электроны по стоку. Но так как идеального диэлектрика нет, существуют токи утечки – некоторое количество электронов всё же пробивается через закрытый затвор, вызывая тот самый нагрев. Для того чтобы заставить транзисторы переключаться быстрее (повысить частоту), нужно подать на них больший ток, а это приведёт к большему нагреву. Более мелкие транзисторы, произведённые по более тонкому техпроцессу, требуют для своей работы меньшие токи, а следовательно, и токи утечки у них меньше. Вот потому-то более «тонкие» чипы, как правило, работают на более высокой частоте и греются меньше. Кроме того, производители полупроводников и занимающиеся собственно производством чипов неустанно изыскивают новые способы уменьшить токи утечек: новые диэлектрические сплавы и вещества с низкой проницаемостью. Вот уже мы дожили до того, что, например, ядро G86 (GeForce 8600) при хорошем охлаждении достигает и перешагивает через порог 1 ГГц.

В данный момент времени происходит переход от архитектуры традиционной конвейерной обработки данных графическим процессором к унифицированной и более гибкой благодаря новому API DirectX 10. В предыдущем поколении видеокарт данные, полученные от центрального процессора, сперва обрабатываются вершинным блоком (также называется процессором, конвейером): создаются вершины, над которыми производятся преобразования, дополненные вершинными шейдерами (программы, добавляющие некоторые эффекты объектам, например – мех, волосы, водная гладь, блеск и так далее). Далее вершины собираются в примитивы – треугольники, линии, точки, после чего переходят в пиксельный блок. Здесь определяются конечные пиксели, которые будут выведены на экран, и над ними проводятся операции освещения или затенения, текстурирования (этим занимается блок TMU – Texture Mapping Unit, который связан с пиксельным конвейером), присвоения цвета, добавляются эффекты от пиксельных шейдеров.

Классический пример конвейера.

Далее вычисляются координаты конкретного пикселя, чтобы отбросить те, которые будут скрыты другими объектами и не видны пользователю. В следующем блоке фрагменты собираются в полигоны, состоящие из отдельных пикселей, и уже готовая картинка передаётся в память для последующей выборки и вывода на экран. В характеристиках видеокарт, поддерживающих DirectX 9, всегда упоминается количество пиксельных, вершинных процессоров и текстурных блоков. Например, в видеоадаптере GeForce 7600 GT есть 12 пиксельных и 5 вершинных процессора (ввиду меньшей нагрузки на вершинные конвейеры их количество – в пределах 2-8 шт. в зависимости от уровня графического процессора) и 12 TMU – по одному на пиксельный конвейер. Естественно, чем больше текстурных блоков, тем больше будет производительность видеокарты. Но компания ATI, начиная с серии Radeon X1000, отошла от привычной формулы «один TMU на один пиксельный конвейер», уменьшив общее количество «текстурников», которые теперь не связаны напрямую с пиксельными процессорами благодаря оптимизации архитектуры видеоядра. При этом количество пиксельных конвейеров в самой старшей модели видеокарты было увеличено до 48, а количество TMU осталось на уровне 16 шт. Такое решение – своего рода задел на будущее, так как в последние годы всё более заметно, что разработчики игр ориентируются не на грубую силу в виде огромного числа полигонов, а на тонкий расчёт, то есть использование сложных шейдеров, требующих математической вычислительной мощи.

Недостаток процесса формирования 3D-сцены при классическом рендеринге состоит в том, что, если уже обработанные данные нужно снова запросить и изменить, приходится дожидаться завершения всего конвейера и заново вычитывать их из памяти или вообще снова получать данные от центрального процессора. Также разделение ядра на отдельные вершинные и пиксельные процессоры сильно ограничивает разработчиков графических приложений, ведь необходимо предусмотреть все варианты геометрии и эффектов в будущих играх, учитывая особенности решений обоих ведущих производителей видеокарт.

Унифицированная архитектура.

Теперь поговорим о будущем графических процессоров. В основу унифицированной архитектуры легла концепция потоковой обработки данных, благодаря которой появилась возможность отправки данных на повторную обработку без ожидания завершения всех стадий конвейера. Также был добавлен новый вид шейдеров – геометрический, работающий с геометрией на уровне примитивов, а не вершин, что способствует разгрузке центрального процессора от лишней работы. И, конечно же, отказ от разделения на пиксельные и вершинные процессоры – теперь они общие, получили новое название – потоковые процессоры (стрим-процессоры) и в любой момент могут быть перепрограммированы под конкретные нужды приложения. Если необходим просчёт «скелета» сцены, то для текстурирования и пиксельной работы выделяется необходимое число блоков, а остальное идёт на вершинные операции. Если же, например, необходимо воссоздать бушующее море, всё наоборот: все силы бросаются на пиксельную обработку, а для геометрии, естественно, только необходимое. Количество стрим-процессоров в новых ядрах достигает 128 шт. (NVIDIA) или 320 шт. (AMD), но напрямую их сравнивать нельзя из-за их особенностей. Кстати, если говорить по всей строгости, процессоров у AMD R600 не 320, а 64, но каждый из них за один такт выполняет до 5 инструкций, что равняется 320 виртуальным процессорам. Блоки TMU теперь не связаны напрямую с шейдерными, и их количество не сильно изменилось при переходе к унифицированной архитектуре.

Ядро и память.Разгон.

Частота графического процессора задаётся, исходя из возможностей чипа или маркетинговых соображений разработчиков, иногда даже поддаётся заводскому разгону (оверклокинг – повышение рабочих частот компонентов компьютера) производителями видеокарт, чтобы выделить продукт и привлечь потенциального покупателя. Плохого в этом ничего нет, так что если есть возможность приобрести изначально разогнанный видеоадаптер, да ещё и по той цене, что и обычный, то это будет отличным выбором. Ядро рассматриваемой нами видеокарты Chaintech GeForce 7600GT функционирует на частоте 600 МГц, в отличие от номинальной в 560 МГц, – налицо заводской разгон. Обычно высокоуровневые видеокарты работают на более низких частотах, чем младшие собратья, – виной тому более высокая сложность чипа класса High-End, и с ростом частоты таких ядер будет повышаться уровень энергопотребления, а следовательно, и тепловыделение. В видеокартах классом ниже справиться с повышенным тепловыделением куда проще, чем в высокоуровневом сегменте. В некоторых графических процессорах компании NVIDIA используются различные частоты для большей части ядра и некоторых функциональных блоков, например, в GeForce 8800GTX ядро работает на частоте 575 МГц, а стрим-процессоры на частоте 1350 МГц. Или же в GeForce 7900GS ядро работает на частоте 450 МГц, а блок геометрии на 470 МГц. Более того, частота стрим-процессоров растёт не линейно по отношению к основной частоте ядра, а в процентном соотношении: если ядро разогнать с 575 до 625 МГц, то есть на 8,6%, то частота шейдерного домена составит 1466 МГц.

Заключение.

Видеокарты – наиболее используемый ресурс персональных компьютеров, и их значение очень велико в том смысле, что имея столько возможностей, они постоянно развиваются, что влечет за собой постоянные замены всех остальных комплектующих.

В связи с тем, что нагрузки на них возрастают, уже сейчас мы наблюдаем огромные скачки в развитии этого направления.

Возможно, уже совсем скоро забудут названия сегодняшних новинок, ведь все индустрии сейчас требуют как можно большего количества обработанных с ПК данных, а кино - и игровая индустрии являются одними из самых прибыльных по всей планете. Производительность видеокарт растет в геометрической прогрессии, равно как и их стоимость. Прогресс в этой области не остановить и уже совсем скоро, благодаря возможностям видеоадаптеров, виртуальная жизнь станет ещё более яркой.

ИСТОЧНИКИ:

http://www. radeon.ru

http://www.spravkapc.ru

http://www.ixbt.com

http://www.ferra.ru

http://www.igromania.ru

http://ru.wikipedia.org

http://www.nvidia.ru

http://www.kompstat.ru

http://www.sd-company.su

http://www.mobimag.ru