Барьеры частотного роста

Евгений Рудометов

authors@rudometov.com

На пути увеличения производительности процессоров за счет уменьшения масштаба литографии и роста тактовых частот стоят барьеры, связанные с физическими законами. Решение проблем – в разработке и внедрении новейших технологий и архитектур.   

За сравнительно короткий период развития компьютеров, созданных на основе полупроводниковых элементов, вычислительная мощь этих ставших незаменимыми устройств возросла во много тысяч раз. Этому в немалой степени способствовала эволюция архитектуры процессоров и совершенствование их внутренних структур. Реализуемые с помощью новейших полупроводниковых технологий предлагаемые нововведения обеспечивали постоянный рост тактовых частот, обеспечивающих увеличение производительности.

С точки зрения пользователя, производительность процессора — это время выполнения определенного набора команд, последовательность которых образует компьютерную программу. Чем оно меньше, тем лучше, то есть тем более производительным является используемый в системе процессор. Это означает, что под производительностью можно понимать количество команд, выполняемых за такт, умноженное на тактовую частоту процессора:

Производительность=(Количество команд за такт)х(Тактовая частота)

Количество команд, выполняемых за такт, зависит как от выполняемой программы, так и от архитектуры процессора (с каким набором машинных команд способен работать процессор и как осуществляется эта работа). На уровне процессора одна команда программы преобразуется в несколько машинных инструкций или элементарных команд, причем эффективность такого преобразования зависит и от архитектуры процессора, и от оптимизации кода под конкретную архитектуру процессора. Кроме того, в зависимости от архитектуры процессора элементарные команды могут исполняться параллельно.

Кстати, из вышесказанного должно быть ясно, что некорректно было бы сравнивать производительность процессоров, имеющих различную архитектуру, основываясь только на тактовой частоте процессоров. Вот почему при одной и той же тактовой частоте одни приложения более эффективно могут выполняться на процессорах, например, от компании Intel, а другие — на процессорах от AMD.

Однако если рассматривать одно и то же семейство процессоров, представленных моделями  одинаковой архитектуры, то сравнивать их производительность, исходя из тактовой частоты процессора, будет вполне корректно.

Итак, для повышения производительности процессора целесообразно повышать тактовую частоту его работы, точнее полупроводникового кристалла — ядра процессора, составляющего основу этого важнейшего элемента и определяющего его возможности.

Каждый процессор рассчитан именно на указанную частоту, и если процессор, скажем, рассчитан на работу на частоте 3 МГц, то это не прихоть производителя, а объективная реальность. Конечно, изначально процессоры одной модельной линейки изготавливаются по одной и той же технологии, в одних и тех же условиях и на одной и той же технологической линии. Однако на любом производстве, в силу различных обстоятельств, возникают отклонения от заданных норм, которые приводят к тому, что микросхемы процессоров имеют несколько отличные друг от друга характеристики. Для выявления последствий таких отклонений проводятся технический контроль и тестирование продукции. Безусловно, тестировать в отдельности каждый кристалл на всех многочисленных этапах его изготовления, учитывая масштабы подобного производства, не представляется возможным. Именно поэтом, как правило,  проводится выборочное тестирование из каждой партии готовой продукции. В ходе тестирования выявляется способность процессоров работать на той или иной частоте, после чего вся партия процессоров маркируется в соответствии с данной частотой. Остается вероятность того, что приобретенный пользователем процессор не прошел выборочного тестирования и способен поддерживать несколько большую частоту, чем указано на маркировке. Кроме того, производитель закладывает некоторый “запас прочности”, учитывающий статистический разброс параметров, связанный с невозможностью обеспечить 100% повторяемости производственных процессов. В результате большинство процессоров, попадающих в руки пользователей, могут успешно работать на повышенных частотах. Однако признавая возможность нештатных режимов, следует учитывать, что подобные режимы снижают не могут быть рекомендованы для корпоративного рынка, связанного .

Однако необходимо отметить, что по мере совершенствования технологий, с использованием которых выпускаются процессоры, статистический разброс параметров сужается. Это позволяет не только уменьшать устанавливаемый производителем “запас прочности”, но и постепенно выпускать в рамках технологических возможностей все более производительные модели. Однако постепенно резерв технологии исчерпывается. И несмотря на совершенствование внутреннего дизайна ядра, выпуск новых моделей верхнего частотного диапазона дается все труднее и труднее.

И все же, что мешает безграничному росту частоты работы внутренних структур полупроводникового ядра процессора, какие эффекты, какие физические процессы препятствуют этому процессу?

Чтобы ответить на этот вопрос, необходимо напомнить, что современные процессоры настольных компьютеров уже сравнительно давно состоят из десятков миллионов элементов. Эти элементы представлены полевыми транзисторами, изготовленными по специальной технологии КМОП (комплементарная логика на основе технологии металл-окисел-полупроводник, CMOS). Более того, полупроводниковое ядро Northwood, созданное по технологии 130 нм и долгое время являвшееся основой процессоров Intel Pentium 4, имеет в своем составе 55 млн. транзисторов. Однако стремительно сменяющее своего предшественника 90 нм ядро Prescott получило на несколько десятков миллионов элементов больше, в результате чего число транзисторов достигло астрономического значения в 125 млн. 

Здесь следует напомнить, что параметры транзисторов в значительной степени зависят от их типоразмеров. Изменение же типоразмеров определяется эволюцией технологических процессов, в соответствии с которыми осуществляется выпуск процессоров. Основным параметром, характеризующим техпроцесс, является масштаб технологии, определяющий размеры полупроводниковых элементов, составляющих основу внутренних цепей процессоров, состоящих из соответствующим образом соединенных между собой транзисторов.

Таблица 1. Эволюция технологических процессов фирмы Intel

Наименование процесса

P854

P856

P858

Px60

P1262

P1264

P1266

P1268

Внедрение, год

1995

1997

1999

2001

2003

2005

2007

2009

Масштаб, нм

350

250

180

130

90

65

45

32

Пластина Si, мм

200

200

200

200/300

300

300

300

300

Межсоединения

Al

Al

Al

Cu

Cu

Cu

Cu

Cu

Длина затвора, нм

350

200

130

70

50

30

20

15

Диэлектрик затвора

SiO2

SiO2

SiO2

SiO2

SiO2

SiO2

High-k

High-k

Канал

Si

Si

Si

Si

Strained Si

Strained Si

Strained Si

Strained Si

Улучшение технологии и пропорциональное уменьшение размеров транзисторов способствуют улучшению их параметров, важнейшими из которых являются их скоростные свойства.

При уменьшении длины затвора (Х) в М раз пропорциональным образом возрастают частотные параметры и плотность размещения транзисторов.

Таблица 2. Изменение параметров транзисторов в зависимости от их типоразмеров

Параметры

Коффициент

Длина затвора (X)

1/M

Ширина затвора (Y)

1/M

Толщина затвора (Z)

1/M

Плотность размещения

M*M

Частота работы

M

Напряжение

1/M

Размеры каждого из транзисторов, входящих в состав процессорного ядра Prescott, уже меньше всем известного вируса гриппа. Соединенные определенным образом между собой более сотни миллионов микроскопических транзисторов сосредоточены на чрезвычайно малой площади и работают нередко на частотах, значительно превышающей десять гигагерц. Очевидно, что все эти элементы оказывают друг на друга взаимное негативное влияние. Это влияние можно легко проиллюстрировать на примере двух расположенных рядом проводников, соединяющих элементы в ядре процессора.

Рис. 1. Два расположенных рядом проводника, соединяющих элементы в ядре

Эти проводники обладают взаимной емкостью. Эта емкость, как известно, зависит от расстояния между проводниками и площади обращенных друг к другу сторон по известной формуле: C = k ´ S / d, где С — емкость, S — площадь, d — расстояние, k — коэффициент, смысл которого будет уточнен далее.

Из-за взаимной емкости образуются неконтролируемые токи, поскольку на высоких частотах образованный проводниками конденсатор обладает проводимостью, хотя для постоянного тока такое расположение является надежным изолятором. Конечно, оценивая поведение приведенной схемы на высоких частотах, нельзя не заметить, что размеры проводников малы, но мало и расстояние между ними. Учитывая же величины частот, а также количество таких проводников, число которых составляет многие миллионы, можно утверждать, что их влиянием на частотные свойства внутренних структур процессорного ядра нельзя пренебрегать. Особенно если принять во внимание то обстоятельство, что каждый проводник обладает еще и активным сопротивлением, и индуктивностью. А это означает, что эквивалентная схема двух проводников представляет собой совокупность емкостей, резисторов и индуктивностей. Очевидно, что она обладает свойствами интегрирующей схемы с многочисленными резонансами. Более того, в реальной жизни необходимо учитывать взаимное влияние нескольких проводников друг на друга. Это иллюстрирует следующий рисунок, на котором представлен вариант трех проводников.

Рис. 2. Вариант трех расположенных рядом проводников, соединяющих элементы в ядре

Вероятно, нет необходимости доказывать, что частотные свойства такой системы уже много сложнее простого варианта двух проводников. Остается добавить, что и активные (сопротивления), и реактивные (емкости, индуктивности) составляющие полного импеданса являются распределенными по всей длине проводников. Это многократно усложняет описание и поведение подобных систем на высоких частотах. Однако ситуация становится еще сложнее, если вспомнить, что описанная система находится не в вакууме, и между проводниками находятся вещества, обладающие определенными диэлектрическими параметрами, влияющими на величины взаимных емкостей. Более того, учитывая, что диэлектрическая проницаемость используемых в микросхемах материалов больше единицы, величины взаимной емкости по сравнению с предыдущими случаями увеличиваются соответствующим образом. Примерная схема приведена на рис. 3.

Рис. 3. Вариант двух проводников, учитывающий влияние диэлектриков

Из приведенного рисунка должно быть ясно, почему конструкторы стремятся использовать для изоляции элементов полупроводниковых микросхем материалы с меньшей величиной диэлектрической проницаемости (k).

Остается добавить, что высокочастотные параметры описанных схем зависят от многих факторов. Достаточно перечислить, например, геометрические размеры проводников, их взаимное расположение, состав металлов и окружающих диэлектриков, микроскопические дефекты. Любые вариации этих параметров порождают соответствующие изменения в частотных свойствах. Кстати, это одна из причин необходимости закладывать “запас прочности” в сложные высокочастотные изделия.

Кроме топологии проводников необходимо учитывать и влияние самих транзисторов, чья структура и физическая суть много сложнее отдельных проводников, хотя бы потому, что они являются активными элементами. Однако транзисторы не только осуществляют управление текущими через них электротоками, выполняя функции быстродействующих электронных ключей. Дело в том, что эти миниатюрные полупроводниковые элементы являются мощными источниками электромагнитного излучения. При этом, оказывая электромагнитное воздействие на соседние элементы, они в свою очередь сами испытывают аналогичное влияние от соседних цепей. Входящие же в состав транзисторов p‑n‑переходы способны осуществлять непредусмотренное детектирование наведенных токов, их усиление и последующую передачу. К слову сказать, трудно представить и точно описать электромагнитный фон внутри кристаллов процессоров, который благодаря тесной упаковке элементов характеризуется переменными полями очень высокой напряженности. Эти поля образуют сложную структуру, которая непрерывно изменяется в соответствии с разными частотами работы внутренних структур процессора, При этом образуются переменные максимумы и минимумы в разных участках полупроводникового кристалла процессора, картина которых постоянно изменяется в соответствии с выполняемыми операциями.

Рис. 4. Структура традиционного КМОП-транзистора

Общая картина многократно усложняется, если учитывать, что размеры транзисторов уже достигли тех значений, когда все большее влияние начинают оказывать квантовые эффекты. Данные эффекты, несмотря на постоянное совершенствование архитектуры транзисторов и уменьшение их размеров, способствуют увеличению неконтролируемых токов. Их общий поток складывается из токов, порождаемых неидеальностью изоляции, а также утечками различной природы через межэлементные емкости и даже за счет туннельного эффекта.

Результатом миниатюризации полупроводниковых элементов, составляющих основу электронных схем на полупроводниковых кремниевых кристаллах и работающих на сверхвысоких частотах в условиях значительных электромагнитных помех, является стремительный рост токов утечки.

Здесь следует напомнить, что для сохранения устойчивости работы электронных схем, токи, контролируемые работающими элементами, должны быть больше неуправляемых токов утечки.   В результате негативных явлений, порождаемых процессами миниатюризации, неуправляемые токи, основу которых составляют токи утечки, а также паразитные токи, связанные с ростом частоты переключения транзисторов, ограничивают уменьшение теплообразования процессоров. Это означает, что ожидаемого существенного уменьшения теплообразования не происходит, несмотря на уменьшение напряжения питания, достигнутое благодаря уменьшению типоразмеров транзисторов.

Рис. 5. Рост мощности тока утечки из-за уменьшения типоразмеров транзисторов CMOS (по материалам IDF

Доля указанной неконтролируемой части электрического тока довольно значительная и увеличивается с ростом частоты. Это еще одна причина, заставляющая производителя закладывать в свои полупроводниковые изделия “запас прочности”.

В борьбе с ростом негативных тенденций, происходящих в электронных схемах, реализованных в кристаллах процессоров и других микросхемах, специалисты внедряют новые технологии. В качестве примера можно привести, например, использование медных проводников вместо алюминиевых, материалов с низкими показателями диэлектрической проницаемости - low k, технологий напряженного кремния - Strained Si и кремний-на-изоляторе – SOI.

Замена алюминия медью для соединяющих транзисторы проводников обеспечило снижение потерь при передаче сигналов. В результате это уменьшило в целом тепловыделение и позволило увеличить тактовые частоты процессора.

Те же цели преследовали разработчики, применяя материалы low k и Strained Si. Первые, используемые для изоляции внутренних цепей, включая соединяющие проводники, снижают значения паразитных межэлементных емкостей, препятствующих росту тактовых частот. Вторые же предназначены для уменьшения сопротивления канала исток-сток. Связано это с тем, что напряженный кремний, характеризуется большим расстоянием между атомами его кристаллической решетки, что обеспечивает меньшее сопротивление потоку электронов. А это уменьшает тепловыделение и позволяет увеличить тактовые частоты.

Следует отметить, что борьбе с тепловыделением направлено использование и такие технологии, как SOI. Эта технология обеспечивает снижение паразитных токов через подложку.

Аналогичной цели, но только для цепей затворов, направлено и применение материалов с high k. Эти материалы планируется использовать в качестве изолирующих слоев затворов транзисторов взамен традиционно применяемой пленки окиси кремния. Толщина этой пленки  уже составляет менее десяти атомов, что вызывает значительный неуправляемый ток утечки. Использование же новых материалов позволит уменьшить ток утечки примерно в тысячу раз. Это значительно уменьшит тепловыделение и позволит наращивать тактовые частоты. С той же целью в дополнение к использованию материалов high k произойдет замена поликрасталлических затворов на металлические. В дальнейшем же следует ожидать применение так называемых трехзатворных структур и терагерцевых транзисторов.

Внедрение указанных нововведений позволит продолжить процесс миниатюризации элементов, наращивая их частотный потенциал и плотность размещения транзисторов на полупроводниковых кристаллах. Последний параметр позволяет увеличивать от поколения к поколению количество транзисторов, составляющих ядро процессора. Данный массив является ресурсом разработчиков и соответственно источником увеличения потенциальных возможностей компьютерных комплектующих, а следовательно и создаваемых изделий. 

Рост же массива транзисторов происходит в соответствии с эмпирическим законом Мура, в соответствии с которым осуществляется стремительная эволюция микросхем и совершенствование архитектуры процессоров. Результатом же является рост тактовых частот и увеличение производительности процессоров.

Для компенсации же негативных явлений и обеспечения устойчивой работы процессоров на высоких тактовых частотах производителям приходится увеличивать напряжение питания ядер. В справедливости этого утверждения можно убедиться, если сравнить уровни штатных напряжений питания для младших и старших моделей процессоров. Независимо от технологии и архитектуры процессоров для старших моделей одной линейки напряжение питания ядра, а также мощность теплообразования всегда выше. Однако такое увеличение, как правило, не ведет к существенному сокращению сроков работы процессоров за счет ускоренной деградации полупроводников.

Необходимо отметить, что тепловая мощность последние годы имеет тенденцию роста даже в штатных режимах процессоров. И это несмотря на то, что конструкторы в борьбе за ее снижение совершенствуют внутренние структуры процессоров и стараются уменьшить  напряжение питание ядра. К слову сказать, снижение уровней питания стало возможным благодаря уменьшению геометрических размеров транзисторов, и, как следствие, уменьшению размеров их затворов. Действительно, током Исток-Сток (Source-Drain) управляет поле затвора (Gate), а чем тоньше затвор, тем меньшее напряжение требуется на затворе для сохранения требуемой напряженности поля.

В дополнение к этому, сокращение длины канала сопровождается уменьшением потерь, включая джоулево тепло. Кроме того, улучшению параметров способствуют также и новейшие разработки в области топологии транзисторов.

Совершенствование архитектуры процессоров и технологических процессов их производства обеспечивает рост тактовых частот и вычислительной мощности процессоров (рис. 6).

 

Рис. 6. Экспоненциальный рост производительности процессоров (по материалам IDF)

К сожалению, обратной стороной этого роста, опять же, является сравнительно быстрое  увеличение теплообразования процессоров. Учитывая же тот факт, что площадь кристалла процессора практически остается постоянной, рост теплообразования способствует увеличению плотности энергии.

 

Рис. 7. Рост плотности энергии в кристалле процессора и ее сопоставление с другими системами (по материалам IDF)

Высокая же мощность теплообразования в случае неадекватных средств охлаждения сопровождается перегревом внутренних структур процессора, что негативно сказывается на работоспособности, а также усиливает и укоряет процессы деградации полупроводников.

Действительно, из физики известно, что полупроводники крайне чувствительны к увеличению температуры. При повышении температуры растет средняя энергия колебания атомов в кристалле. В результате все большее количество связей в кристаллической решетке кремния начинает разрываться, появляются все новые пары электронов и дырок. Начиная же с определенного момента роста температуры, свойства полупроводника меняются, например, с ростом температуры проводимость полупроводников и диэлектриков возрастает. Как результат, появляются сбои и повторяющиеся зависания. Именно борьбой с этими эффектами объясняется необходимость в использовании адекватных средств поддержания оптимальных температурных режимов. Сейчас уже ни один высокочастотный, высокопроизводительный процессор не обходится без соответствующих кулеров, в составе которых применяются массивные радиаторы и мощные охлаждающие вентиляторы. Логично предположить, что, предприняв особые меры по охлаждению процессора, можно добиться стабильной работы чипов, рассчитанных на комнатную температуру, — причем на тактовых частотах, значительно превышающих “штатные” мегагерцы. Подобные, как правило, неафишируемые широко меры, применялись, в частности, при демонстрациях на Форуме IDF. В ходе этих мероприятий показывались возможности перспективных технологий, лежащих в основе высокопроизводительных процессоров.

Возвращаясь же вопросу высокого теплообразования, необходимо отметить, что, к сожалению, повышение напряжения питания и тактовой частоты увеличивает тепловую мощность. А это, как отмечалось выше, сопровождается рядом негативных явлений, среди которых можно привести и локальные, и общий перегревы полупроводникового кристалла со всеми вытекающими из этого факта негативными последствиями. Кроме того, нельзя сбрасывать со счета и повышенные уровни энергопотребления, тяжелым бременем ложащихся на источники электропитания компьютерных систем, и необходимость использования мощных средств охлаждения, и т. д., и т. п.

Решая проблему снижения энергопотребления своих изделий, конструкторы стали встраивать в состав архитектуры ядер специальные цепи, регулирующие работу процессоров. Данные цепи, чье функционирование поддержано системным программным обеспечением, в зависимости от вычислительной нагрузки и условий эксплуатации обеспечивают установку оптимальных электрических и частотных режимов. Это, в частности, означает, что в случае снижения вычислительной нагрузки происходит уменьшение тактовой частоты работы ядра. 

Кстати, при снижении тактовой частоты процессора ниже штатной величины, напряжение питания его ядра может быть соответствующим образом снижено без нарушения устойчивости работы системы. Это позволяет теплообразование процессора. Такие операции, выполняемые в автоматическом режиме аппаратно-программным обеспечением, являются стандартными для портативных компьютеров и предназначены для экономии энергии батарей. Однако понижение напряжения и частоты уже используется и для моделей серверного сектора компьютерного рынка. В качестве иллюстрации стоит упомянуть реализованные в недавно выпущенных по 90 нм техпроцессу моделях Intel Xeon (ядро Nocona) технологии Demand Based Switching (DBS) и Enhanced Intel SpeedStep – динамической регулировки и снижения потребляемой мощности процессора.  

Для оценки эффективности подобных технологий для снижения тепловой нагрузки на ядро процессора целесообразно воспользоваться следующей формулой:

P»C×V2×F

где — тепловая мощность процессора, С — коэффициент, учитывающий взаимную емкость элементов ядра процессора и зависящий от архитектуры его ядра (обычно возрастает с увеличением плотности размещения элементов на кристалле микросхемы), V — напряжение питания ядра, F — тактовая частота.

Данную формулу можно привести к виду:

где переменные с индексом k обозначают соответствующие параметры изменяемых режимов, а переменные с нулевым индексом — параметры штатного режима.

Используя приведенную формулу, можно заметить, что уменьшение тактовой частоты и напряжения питания ядра на 5% обеспечивает снижение мощности теплообразования почти на 15%. Уменьшение же тактовой частоты на 10%, а напряжения питания на 7%, приводит к снижению энергопотребления, а, следовательно, и теплообразования почти на четверть.    

Остается добавить, что расширение частотного и энергетического диапазонов регулирования приводит к еще большему уменьшению уровня теплообразования. А это еще больше снижает тепловую нагрузку на полупроводниковый кристалл процессора и средства охлаждения, электрическую – на элементы энергопитания. Кроме того, благодаря уменьшению температуры внутри корпуса улучшаются условия эксплуатации остальных компонентов системы.       

Кстати, в мобильных системах такой подход позволяет уменьшать энергопотребление в несколько раз.

В заключение, необходимо отметить, что, несмотря на существующие барьеры на пути повышения производительности элементов и ситем, ученые и инженеры успешно их преодолевают. Они предлагают различные пути решения встающих перед компьютерной отраслью проблем. Это и улучшение полупроводниковых техпроцессов, и совершенствование архитектуры высокочастотных микросхем, и внедрение перспективных технологий, и даже поиск путей модификации конструктивов системных блоков.   

В качестве примера можно назвать, например, Sun, DEC, IBM, Compaq. Кстати, в 1991 году стартовал совместный проект Intel и NCR по “промышленному температурному разгону”, известный под именем Cheetah. Именно портфель патентов, зарегистрированных в рамках проекта, позже перешел в распоряжение шести основателей фирмы KryoTech, которые в то время были инженерами NCR. В дальнейшем данные разработки позволили специалистам фирмы KryoTech создать целую серию установок, обеспечивающих эффективное охлаждение серверных процессоров, эксплуатируемых в форсированных режимах за счет помещения их вместе с материнскими платами в морозильные камеры. Однако эта тема уже других статей.


Статья опубликована в журнале Байт (http://www.bytemag.ru).