Искусственный интеллект меняет требования к памяти: DRAM и NAND уступают место новым технологиям. ReRAM и PCM обещают ускорить нейросети и сделать вычисления энергоэффективнее. Разбираем реальные преимущества, ограничения и сценарии применения этих типов памяти в ИИ-железе.
Рост искусственного интеллекта изменил требования к компьютерному железу быстрее, чем любая предыдущая волна технологий. Если раньше производительность определялась скоростью процессора, то сегодня ключевым фактором становится память: её задержки, пропускная способность и энергопотребление. Именно память всё чаще ограничивает масштабируемость нейросетей и эффективность ИИ-чипов.
На этом фоне всё больше внимания привлекают новые типы памяти - ReRAM и PCM. Их рассматривают как альтернативу или дополнение к традиционным DRAM и NAND, особенно в задачах, связанных с искусственным интеллектом и вычислениями в памяти. Эти технологии обещают снизить энергопотери, сократить задержки и приблизить хранение данных к месту вычислений.
Однако между лабораторными прототипами и реальным ИИ-железом лежит большая дистанция. Важно понять, какие свойства ReRAM и PCM действительно востребованы сегодня, где они уже применяются на практике, а где пока остаются перспективой. Эта статья как раз об этом - без маркетинга и футуризма, только про то, что реально работает.
Современные системы искусственного интеллекта всё реже упираются в вычислительные блоки и всё чаще - в память. GPU и специализированные ИИ-ускорители способны выполнять колоссальное количество операций параллельно, но эффективность этой мощности напрямую зависит от того, насколько быстро к ним поступают данные. Именно здесь классическая архитектура начинает давать сбой.
Проблема кроется в разрыве между вычислениями и памятью. DRAM физически вынесена за пределы вычислительных массивов, а NAND используется ещё дальше - как хранилище. Для нейросетей это означает постоянное перемещение весов и активаций по шинам данных. Даже при высокой пропускной способности задержки и энергозатраты на передачу информации становятся сопоставимы или превышают стоимость самих вычислений.
Этот эффект особенно заметен в задачах ИИ. Обучение и инференс нейросетей - это не сложная логика, а массовые операции над матрицами. Тысячи одинаковых умножений и сложений требуют непрерывного доступа к памяти. В результате возникает парадокс: вычислительные блоки простаивают, ожидая данные, а энергопотребление системы растёт не из-за вычислений, а из-за движения битов.
Упираясь в так называемую memory wall, индустрия сталкивается с ограничениями, которые нельзя решить простым масштабированием. Увеличение частоты DRAM почти не даёт выигрыша, а рост числа каналов памяти резко усложняет и удорожает чипы. Это и стало причиной смещения фокуса - от ускорения вычислений к пересмотру самой роли памяти в архитектуре ИИ-железа.
Именно на этом фоне появляются подходы, в которых память перестаёт быть пассивным хранилищем и начинает участвовать в вычислениях напрямую. Идея вычислений в памяти становится логичным ответом на фундаментальные ограничения классической модели.
Вычисления в памяти - это архитектурный подход, при котором операции выполняются непосредственно там, где хранятся данные, без постоянной передачи их в отдельный вычислительный блок. В контексте ИИ это означает отказ от классической схемы "память → процессор → память", которая и создаёт основную задержку и перерасход энергии.
Для нейросетей такой подход особенно логичен. Большая часть вычислений сводится к умножению матриц весов на входные данные и накоплению результатов. Если веса уже находятся в ячейках памяти, то сам физический процесс чтения можно использовать как элемент вычисления - например, суммирование токов или изменение сопротивлений. В этом случае данные не перемещаются, а результат формируется прямо внутри массива памяти.
Ключевое преимущество вычислений в памяти - резкое снижение энергопотребления. Передача данных между памятью и вычислительными блоками тратит в разы больше энергии, чем сами арифметические операции. Для ИИ-систем, особенно в дата-центрах и edge-устройствах, это становится критичным фактором: ограничение уже не в производительности, а в тепле и энергобюджете.
Кроме того, такой подход лучше масштабируется. Вместо увеличения частоты или сложности вычислительных ядер можно просто расширять массивы памяти, где каждая ячейка участвует в вычислениях. Это открывает путь к нейроморфным и матричным архитектурам, ближе всего имитирующим работу биологических нейронных сетей.
Однако вычисления в памяти невозможны на классических DRAM и NAND без серьёзных компромиссов. Эти типы памяти не предназначены для аналоговых операций и плохо подходят для массового параллелизма на уровне ячеек. Именно поэтому внимание исследователей и производителей сместилось к альтернативным типам памяти - таким как ReRAM и PCM, которые физически лучше соответствуют требованиям ИИ-нагрузок.
ReRAM (резистивная память) хранит данные не в заряде, как DRAM, и не в плавающем затворе, как NAND, а в сопротивлении материала. Ячейка ReRAM может находиться в состоянии с высоким или низким сопротивлением, а переход между ними достигается короткими электрическими импульсами. На уровне физики это выглядит просто, но именно эта простота делает технологию особенно интересной для ИИ.
Главное преимущество ReRAM - естественная совместимость с вычислениями в памяти. Изменяя сопротивления ячеек, можно кодировать веса нейросети прямо в массиве памяти. При подаче напряжения токи суммируются по законам физики, и операция умножения матрицы на вектор происходит фактически "сама собой". Это не цифровая арифметика, а аналоговое вычисление, выполняемое параллельно на тысячах ячеек.
С точки зрения энергоэффективности ReRAM выигрывает у DRAM на порядки. Энергия тратится не на перенос данных, а на их локальное взаимодействие. Для ИИ-ускорителей это означает возможность выполнять инференс с минимальным тепловыделением, что особенно важно для периферийных устройств, автономных сенсоров и мобильных систем.
Ещё одно важное свойство - высокая плотность хранения. Ячейки ReRAM можно масштабировать до очень малых размеров, а сама технология хорошо сочетается с трёхмерной интеграцией. Это делает её потенциальной заменой части DRAM и даже NAND в специализированных ИИ-чипах, где важна не универсальность, а эффективность под конкретные операции.
При этом ReRAM уже не является чисто лабораторной технологией. Её прототипы используются в экспериментальных нейроморфных ускорителях и матричных сопроцессорах, где важна именно работа с весами нейросетей. Однако у технологии есть и серьёзные ограничения - нестабильность сопротивлений, разброс параметров и сложности точного контроля аналоговых состояний.
Эти проблемы не делают ReRAM бесперспективной, но сильно ограничивают область применения. В массовых вычислениях она пока не готова заменить DRAM, зато в специализированных ИИ-архитектурах её преимущества оказываются решающими.
PCM (phase-change memory) работает за счёт изменения фазового состояния материала - обычно халькогенида. В аморфном состоянии он имеет высокое сопротивление, в кристаллическом - низкое. Переключение между этими состояниями достигается точными тепловыми импульсами, что делает PCM принципиально иной по физике по сравнению с DRAM и ReRAM.
По своим свойствам PCM занимает промежуточное положение между оперативной и постоянной памятью. Она быстрее NAND, энергонезависима и при этом способна хранить данные плотнее, чем DRAM. Именно это сочетание сделало PCM одним из первых кандидатов на роль "универсальной памяти" - попытки закрыть разрыв между скоростью и ёмкостью.
Для ИИ PCM интересна прежде всего стабильностью состояний. В отличие от ReRAM, где сопротивления могут плавать и дрейфовать, фазовые состояния PCM более предсказуемы и лучше поддаются контролю. Это важно при хранении весов нейросетей, особенно если требуется высокая точность и воспроизводимость результатов.
Кроме того, PCM хорошо подходит для частично аналоговых вычислений. Изменяя степень кристаллизации материала, можно кодировать не только бинарные значения, но и промежуточные уровни, что позволяет хранить веса с пониженной разрядностью. В задачах ИИ это даёт компромисс между точностью и энергоэффективностью, особенно при инференсе.
Однако у PCM есть и слабые стороны. Переключение фаз требует нагрева, что увеличивает энергопотребление и ограничивает скорость записи. Ресурс перезаписи также ниже, чем у DRAM, а тепловые эффекты усложняют масштабирование массивов. Именно поэтому PCM не смогла стать массовой заменой оперативной памяти.
На практике PCM нашла нишу в специализированных ускорителях и системах хранения с акцентом на ИИ-нагрузки, где важны энергонезависимость и предсказуемость, а не максимальная скорость записи. Это делает её не универсальным решением, а инструментом под конкретные архитектурные задачи.
Сравнивать новые типы памяти с DRAM и NAND в лоб - ошибка. ReRAM и PCM не пытаются заменить всю иерархию памяти целиком, их ценность проявляется в конкретных сценариях, прежде всего связанных с ИИ. Именно здесь различия между технологиями становятся не академическими, а прикладными.
DRAM остаётся самой быстрой памятью для произвольного доступа, но она энергозависима, плохо масштабируется по плотности и требует постоянного обмена данными с вычислительными блоками. Для нейросетей это означает высокие задержки и огромные энергопотери на каждом проходе весов. NAND, в свою очередь, слишком медленна и ориентирована на хранение, а не на вычисления, что делает её бесполезной для активной работы моделей.
ReRAM и PCM выигрывают не скоростью одной операции, а архитектурой. Они позволяют сократить или полностью устранить перемещение данных, которое и является главным тормозом ИИ-систем. В задачах инференса это даёт реальный выигрыш: меньше энергии, меньше тепла, выше плотность вычислений на единицу площади кристалла.
Если рассматривать ReRAM, её сила - в аналоговых вычислениях и массовом параллелизме. Она плохо подходит для универсальных задач, но отлично работает как матричный ускоритель, где тысячи ячеек одновременно участвуют в вычислении. В таких сценариях ReRAM не конкурирует с DRAM, а фактически заменяет вычислительные блоки, превращая память в процессор.
PCM, напротив, ближе к компромиссу. Она может выступать как энергонезависимая память для хранения весов между запусками моделей или как медленная, но плотная альтернатива DRAM в ИИ-ускорителях. В реальных системах её используют там, где важна предсказуемость и стабильность, даже ценой скорости записи.
Практика показывает, что ни ReRAM, ни PCM не вытесняют DRAM и NAND полностью. Вместо этого формируется гибридная архитектура: DRAM обслуживает управляющую логику, NAND отвечает за хранение, а новые типы памяти берут на себя работу с весами и вычисления внутри ИИ-блоков. Именно в такой роли они и оказываются действительно полезными.
Несмотря на активные исследования, ReRAM и PCM пока редко встречаются в массовых потребительских устройствах. Их реальная зона применения - специализированное ИИ-железо, где архитектура проектируется под конкретные модели и типы нагрузок, а не под универсальность.
ReRAM сегодня чаще всего используется в экспериментальных и предсерийных ИИ-ускорителях, ориентированных на вычисления в памяти. Такие чипы применяются для инференса нейросетей с фиксированными весами - например, в системах компьютерного зрения, распознавания сигналов и edge-устройствах. Здесь важны энергоэффективность и минимальные задержки, а не абсолютная точность вычислений. Аналоговая природа ReRAM хорошо ложится на задачи, где допустимы небольшие погрешности.
Особенно заметно применение ReRAM в нейроморфных архитектурах. В них массивы памяти напрямую соответствуют синапсам, а вычисления происходят за счёт физических свойств материала. Это позволяет реализовывать компактные и холодные ИИ-модули, которые могут работать автономно и без активного охлаждения - критичное требование для встроенных и периферийных систем.
PCM, в отличие от ReRAM, уже имеет опыт промышленного внедрения. Она использовалась в специализированных решениях как энергонезависимая память с более низкими задержками, чем у NAND. В контексте ИИ PCM применяется для хранения весов моделей и промежуточных данных, когда важна сохранность состояния и быстрый запуск без повторной загрузки из медленного хранилища.
В серверных и исследовательских системах PCM тестируется как часть многоуровневой памяти - между DRAM и NAND. Такой подход позволяет держать крупные модели ближе к вычислительным блокам и снижать время доступа к данным при инференсе. Это особенно актуально для больших нейросетей, где объём весов измеряется десятками и сотнями гигабайт.
Важно понимать, что в реальных продуктах ReRAM и PCM почти всегда работают в связке с классической памятью. Они не заменяют DRAM или NAND, а дополняют их, беря на себя самые "болезненные" для ИИ участки - работу с весами и повторяющимися вычислениями. Именно такая гибридная модель сегодня считается наиболее жизнеспособной.
Несмотря на привлекательные свойства, ReRAM и PCM далеки от статуса универсального решения. Их основные проблемы связаны не с принципом работы, а с физикой материалов и сложностью промышленного производства. Именно эти факторы сегодня сдерживают массовое внедрение новых типов памяти в ИИ-железе.
Для ReRAM ключевой проблемой остаётся вариативность ячеек. Даже в пределах одного массива сопротивления могут заметно отличаться, а со временем дрейфовать под воздействием температуры и повторных циклов записи. Для аналоговых вычислений это означает накопление ошибок и необходимость сложной калибровки. Чем больше массив, тем труднее обеспечить стабильность и воспроизводимость результатов.
PCM сталкивается с другими ограничениями. Переключение фаз требует нагрева, что увеличивает энергопотребление и усложняет тепловой режим чипа. Кроме того, ресурс перезаписи у PCM ниже, чем у DRAM, что делает её менее подходящей для интенсивных обучающих нагрузок. Масштабирование плотности также упирается в тепловые перекрёстные эффекты между соседними ячейками.
Отдельная проблема - стоимость. Производство ReRAM и PCM требует новых материалов, дополнительных технологических шагов и высокой точности контроля. Это делает такие чипы дороже классической памяти при меньших объёмах выпуска. Пока технологии не выйдут на массовые тиражи, их использование остаётся экономически оправданным только в нишевых ИИ-ускорителях.
Также стоит учитывать программную сторону. Вычисления в памяти требуют новых моделей программирования, компиляторов и алгоритмов, адаптированных под неточную и аналоговую природу вычислений. Без экосистемы софта даже самая эффективная память остаётся экспериментом, а не продуктом.
В результате ReRAM и PCM сегодня находятся в зоне технологического компромисса. Они уже доказали свою полезность для ИИ, но их масштабирование ограничено физикой, ценой и сложностью интеграции. Именно поэтому индустрия движется не к замене всей памяти, а к аккуратному встраиванию этих технологий в гибридные архитектуры.
Новые типы памяти ReRAM и PCM появились не как очередная эволюция DRAM или NAND, а как ответ на фундаментальные ограничения ИИ-железа. В задачах нейросетей узким местом стали не вычисления, а перемещение данных, и именно здесь классическая архитектура перестала масштабироваться.
ReRAM показала себя как эффективный инструмент для вычислений в памяти и нейроморфных архитектур. Она позволяет радикально снизить энергопотребление и приблизить хранение весов к самим вычислениям, но требует сложной калибровки и не подходит для универсальных задач. PCM, в свою очередь, заняла нишу стабильной энергонезависимой памяти между DRAM и NAND, оказавшись полезной для хранения весов и ускорения инференса в специализированных ИИ-системах.
Практика показывает, что ни одна из этих технологий не заменяет классическую память целиком. Реальное будущее - за гибридными архитектурами, где DRAM, NAND, ReRAM и PCM сосуществуют, каждая решая свою задачу. Такой подход позволяет получить максимальную эффективность без попыток сделать одну технологию универсальной.
Для ИИ-железа это означает смену парадигмы: память перестаёт быть пассивным компонентом и становится активной частью вычислений. И именно в этом качестве новые типы памяти уже сегодня находят своё место - не в маркетинговых обещаниях, а в реальных архитектурных решениях.