Trong phần một của loạt bài này, How AI Broke the Memory Market, chúng ta đã xem xét cách nhu cầu từ các trung tâm dữ liệu AI biến bộ nhớ thành nút thắt cổ chai và vì sao giá DRAM và NAND khó có thể sớm trở lại bình thường. Giờ đây, chúng ta sẽ tìm hiểu cách vận hành trong bối cảnh này. Nếu bạn đang thiết kế hoặc tìm nguồn phần cứng trong năm 2026, bạn vẫn cần đưa ra các lựa chọn: nên chỉ định linh kiện nào, cấu trúc thiết kế ra sao để có tính linh hoạt, và cách quản lý rủi ro chuỗi cung ứng.
Chúng tôi sẽ điểm qua các linh kiện bộ nhớ “làn sóng tiếp theo” đang trong lộ trình phát triển, sau đó chuyển sang một số linh kiện DRAM và flash chủ lực. Từ đó, chúng tôi sẽ đưa ra các cẩm nang thực tiễn cho cả kỹ thuật và thu mua.
Để tìm hiểu tổng quan về các linh kiện bộ nhớ, các trang danh mục của Octopart dành cho memory ICs và flash memory là điểm khởi đầu tốt để tìm kiếm theo nhà sản xuất, kiểu đóng gói và tình trạng sẵn hàng.
Được thiết kế cho AI trên thiết bị, ô tô và các nền tảng di động cũng như PC thế hệ tiếp theo, LPDDR6 của Samsung mang lại mức cải thiện hiệu suất năng lượng đáng kể so với LPDDR5X, kiến trúc I/O mở rộng và tốc độ ban đầu lên tới 10,7 Gbps; tiêu chuẩn LPDDR6 cũng được thiết kế để tiếp tục mở rộng khi hệ sinh thái trưởng thành hơn. Bạn sẽ chưa thấy LPDDR6 trên kệ của các nhà phân phối, nhưng nếu bạn thiết kế xoay quanh các SoC hàng đầu hoặc thiết bị flagship, bạn nên chuẩn bị sẽ gặp nó.
Ở đỉnh cao của phân khúc, các thiết bị HBM4 16 lớp, 48 GB của SK Hynix hứa hẹn băng thông hơn 2 TB/s, với mục tiêu sản xuất hàng loạt vào khoảng quý 3 năm 2026. Samsung đang theo đuổi một hướng tiếp cận khác, sử dụng logic 4 nm và DRAM 1c để cải thiện hiệu năng nhiệt. Các kỹ sư làm phần cứng AI thường sẽ không tìm nguồn các linh kiện này từ các nhà phân phối theo danh mục, nhưng HBM4 vẫn quan trọng với tất cả mọi người vì nó đang hấp thụ một phần lớn công suất DRAM tiên tiến, và đó là một trong những lý do khiến DRAM thông thường vẫn khan hiếm.
Với hơn 400 lớp và giao tiếp 5,6 GT/s, V-NAND thế hệ thứ 10 của Samsung nhắm tới các SSD PCIe 5.0 và PCIe 6.0 trong tương lai cho khối lượng công việc trung tâm dữ liệu và AI. Hãy kỳ vọng TLC mật độ cao dựa trên nền silicon này sẽ là nền tảng cho nhiều ổ đĩa doanh nghiệp và ổ khách hàng cao cấp trong vài năm tới.
BiCS10 332 lớp này với giao tiếp Toggle DDR 6.0 cung cấp 4,8 Gb/s trên mỗi chân, nhắm tới lưu trữ AI và hyperscale. Theo EE Times, Kioxia cho biết toàn bộ sản lượng NAND năm 2026 của hãng đã được bán cho các ứng dụng liên quan đến AI, và hãng đã đẩy sớm kế hoạch tăng sản lượng BiCS10 từ nửa cuối năm 2027 lên năm 2026 để đáp ứng nhu cầu.
Các linh kiện này có thể đặt hàng từ các nhà phân phối lớn vào đầu tháng 3 năm 2026. Tình trạng sẵn hàng thay đổi rất nhanh, vì vậy hãy xác minh tồn kho và trạng thái vòng đời trên Octopart trước khi chốt BOM.
Trong bối cảnh này, các kỹ sư phần cứng vẫn có rất nhiều hành động có thể thực hiện để giúp thiết kế có khả năng chống chịu tốt hơn.
Tình hình này đòi hỏi bạn phải chú ý sát sao. Vào cuối tháng 2 năm 2026, Lenovo đã cảnh báo các đối tác kênh đặt hàng trước cuối tháng để tránh đợt tăng giá trong tháng 3, trong khi TrendForce dự báo giá DRAM PC bình quân gộp (DDR4/DDR5) sẽ tăng 105–110% so với quý trước chỉ riêng trong quý 1. Cẩm nang dưới đây phản ánh thực tế mới này.
Trong phần đầu của loạt bài này, chúng tôi đã đề cập đến nguyên nhân đằng sau cuộc khủng hoảng bộ nhớ. Còn ở đây, chúng tôi đã xem xét câu hỏi phải làm gì tiếp theo. Câu trả lời là như nhau dù bạn là kỹ sư hay làm ở phía thu mua: tính linh hoạt là biện pháp phòng ngừa tốt nhất. Hãy thiết kế để có thể thay thế, thẩm định rộng rãi và sử dụng các công cụ như Octopart để luôn nhìn thấy các lựa chọn của mình và cập nhật chúng. Những đội ngũ vượt qua chu kỳ này trong trạng thái tốt nhất sẽ là những đội đã sớm xây dựng tính tùy chọn vào thiết kế và chuỗi cung ứng của mình, đồng thời tiếp tục thích nghi khi nguồn cung và giá cả thay đổi.
Tình trạng thiếu hụt hiện nay xuất phát từ việc phân bổ wafer, chứ không phải giới hạn công nghệ. Các nhà cung cấp bộ nhớ đang ưu tiên nhu cầu AI có biên lợi nhuận cao, đặc biệt là HBM và DRAM cho trung tâm dữ liệu, theo các hợp đồng nhiều năm. Vì HBM tiêu tốn công suất wafer trên mỗi bit nhiều hơn đáng kể so với DRAM thông thường, nên công suất còn lại cho DDR5, LPDDR và NAND ít hơn, khiến nguồn cung tiếp tục căng thẳng.
LPDDR6 và HBM4 cho thấy nền tảng đang đi về đâu, nhưng phần lớn sản phẩm năm 2026 sẽ được xuất xưởng với DDR5, LPDDR5X và NAND trưởng thành hiện đang sẵn có. Các kỹ sư nên thiết kế với khả năng tương thích tương lai trong đầu, đồng thời chọn các linh kiện có thể được tìm nguồn đáng tin cậy trong quá trình sản xuất, thay vì đặt cược vào những linh kiện chưa được phân phối rộng rãi.
Các thiết kế có khả năng chống chịu tập trung vào tính linh hoạt và khả năng thay thế. Điều này bao gồm chuẩn hóa trên các giao tiếp phổ biến, thẩm định nhiều mức dung lượng và nhiều nhà cung cấp, tránh các giả định bộ nhớ bị mã hóa cứng trong firmware, và sử dụng socket hoặc module khi có thể. Hỗ trợ các tùy chọn bộ nhớ down-binned giúp sản phẩm vẫn có thể xuất xưởng khi các linh kiện dung lượng cao hơn bị khan hiếm.
Bộ phận thu mua nên xem bộ nhớ như một nguồn lực chiến lược, không phải là một mặt hàng thông dụng. Các phương pháp tốt nhất bao gồm chốt phân bổ dài hạn cho các SKU quan trọng, xây dựng AVL xoay quanh các họ linh kiện thay vì chỉ một linh kiện đơn lẻ, theo dõi vòng đời sản phẩm và các linh kiện thay thế bằng những công cụ như Octopart, đồng thời chủ động dự trữ tồn kho có chọn lọc cho các sản phẩm có vòng đời dài để tránh phải thiết kế lại ngoài ý muốn.