DDR5 получит больше функций безопасности и управления питанием

Недавнее обновление стандарта от JEDEC Solid State Technology Association (Сообщество Инженеров, специализирующихся в области электронных устройств – мировой лидер в разработке стандартов для микроэлектронной промышленности; комитет инженерной стандартизации полупроводниковой продукции при Electronic Industries Alliance, промышленной ассоциации, представляющей все отрасли электронной промышленности) повышает безопасность и надежность DDR5 SDRAM, в то время как компания Rambus добавила ещё и возможности управления питанием в модули DDR5 DIMM.

Безопасность и управление питанием на уровне устройств памяти становятся всё более важными аспектами с ростом рабочих нагрузок ИИ, поскольку модели и запатентованные алгоритмы представляют собой ценнейшую интеллектуальную собственность, а центры обработки данных, управляемые ИИ, угрожают повышением уровня энергопотребления.

Стандарт JESD79-5C DDR5 SDRAM представляет построчный подсчет активаций (PRAC) для улучшения целостности данных DRAM и повышения производительности в широком спектре применений (от высокопроизводительных серверов до новых технологий, таких как ИИ и машинное обучение), а также для повышения безопасности. PRAC точно подсчитывает количество активаций DRAM на гранулярности мировой линии (worldline granularity), таким образом, когда DRAM обнаруживает чрезмерное количество активаций, она предупреждает систему о необходимости приостановить трафик и выделить время для принятия мер по снижению нагрузки.

В ходе брифинга для EE Times председатель комитета JEDEC JC-42 Кристофер Кокс отметил, что стандарты отражают то, как безопасность является фундаментальным краеугольным камнем при разработке DRAM, вне зависимости от того, какой это стандарт, будь то DDR, LPDDR, GDDR или HBM. “Мы обязаны поддерживать должный уровень безопасности”, - сказал он.

«Но угрозы постоянно развиваются, поэтому, как только обнаруживаются уязвимости, они должны быть устранены в соответствующем стандарте памяти. Как вы понимаете, с кремнием на это уходит немного больше времени», - добавил Кристофер.

По словам Кокса, безопасность – это фактор первой необходимости, равно как и требования к энергопотреблению и производительности. С появлением DDR5, были введены дополнительные средства защиты от угроз безопасности, такие как RowHammer, в рамках усилий по укреплению DRAM от уязвимостей. Функциональность PRAC является расширением этих возможностей, за счет добавления счетчиков на каждую отдельную строку внутри DRAM — а таких строк могут быть тысячи. “Теперь у нас есть микро счетчики для каждой из этих строк, так что мы можем следить за неадекватной активностью, если кто-то пытается активировать это устройство слишком интенсивно, и это выходит за рамки обычного доступа для чтения», - подчеркнул Кристофер.

Когда строка «забивается», она многократно активируется и пытается подозрительным образом активировать свои соседние строки, что приводит к перестановке битов (bit flip). По словам Кокса, устройство, работающее только на запись, не особо полезно, но PRAC дает возможность отслеживать подозрительную активность и добавляет механизмы, позволяющие DRAM сообщать хосту о возникновении проблемы путем установки порогового значения.

По мнению Кристофера, за добавление таких функций, как PRAC, всегда приходится расплачиваться производительностью, будь то исправление ошибок, обнаружение вредоносной активности или защита от естественных сбоев битов. «Всё имеет свою цену, будь то влияние на размер чипа или реальное влияние на производительность».

В идеале нужно сделать DRAM простой, а сложность добавить в контроллер, но RowHammer является примером того, как конструкция ячейки используется против неё же самой.

DRAM превратилась в нечто большее, чем простое устройство для чтения и записи – она является частью сложной системы, которая должна обеспечивать баланс между безопасностью, производительностью и управлением питанием. Последним компания Rambus занимается с помощью нового семейства серверных IC для управления питанием DDR5 (PMIC).

PMIC от Rambus предназначен для увеличения количества каналов памяти, модулей большей емкости и пропускной способности, а также включает продукты для спецификаций JEDEC с экстремальным током (PMIC5020), высоким током (PMIC5000) и низким током (PMIC5010).

«Подобно тому, как JEDEC целенаправленно стремились укрепить безопасность DDR5, около пяти лет назад начались сознательные усилия по решению проблемы управления питанием DIMM», - сказал в интервью EE Times Джон Эбл, исполнительный вице-президент по маркетингу продукции Rambus.

В предыдущих поколениях DDR питание регулировалось на материнской плате, и оно должно было обеспечивать низкое напряжение при высоком токе через материнскую плату, через коннектор и затем на DIMM. Поскольку подача напряжения со временем снижалась для поддержания уровня мощности при более высоких скоростях передачи данных, поддержание требуемого уровня напряжения становилось всё более сложной задачей из-за падения IR, которое является падением напряжения, возникающим при протекании тока через резистор.

По словам Эбла, внедрение PMIC в модули DDR5 RDIMM практически полностью устраняет падение IR, поскольку в центрах обработки данных наблюдается тенденция к обеспечению как можно более высокого напряжения, чтобы максимально приблизиться к предельной точке эксплуатации. Он отметил, что модули DDR5 DIMM способны понижать напряжение до необходимого уровня, что обеспечивает гибкость модулей DIMM для достижения целевых показателей производительности, обеспечивая при этом целостность питания.

Добавлений функций управления питанием и безопасности в модули DDR5 DIMM стало возможным благодаря более интеллектуальной архитектуре DIMM, которая помогает достичь поставленной промышленностью цели – а именно, увеличить пропускную способность и емкость памяти, сохранив при этом энергопотребление в пределах той же границы на помодульной основе. Эбл подчеркнул, что клиентам выгоднее добавлять систему управления питанием по мере увеличения количества модулей DIMM.

Rambus также решает проблемы безопасности DRAM, включая RowHammer. Их технология перестановки и переназначения карт адресов рядов (Row Address Map Permutation and Reassignment Technique - RAMPART) снижает вероятность атак RowHammer и повышает надежность серверных систем памяти за счет перестановки адресов в каждой DRAM. Новый подход, совместимый с функциями защиты от RowHammer в DDR5, ограничивает перестановку битов RowHammer одним устройством для любого адреса строки-жертвы.

В сочетании с современными методами обнаружения и исправления ошибок система, использующая RAMPART, может обнаруживать и исправлять перестановки битов в результате успешной атаки, позволяя системе памяти самовосстанавливаться.