The Japan Times - Graid Technology bringt ein agentenbasiertes KI-Speicherportfolio auf den Markt, um Engpässe bei KV-Caches zu beseitigen

EUR -
AED 4.183233
AFN 72.900796
ALL 94.178505
AMD 419.314312
ANG 2.039391
AOA 1044.526125
ARS 1682.963331
AUD 1.650836
AWG 2.050323
AZN 1.940938
BAM 1.953816
BBD 2.29467
BDT 140.137703
BGN 1.926028
BHD 0.429564
BIF 3383.764104
BMD 1.139068
BND 1.474203
BOB 7.873316
BRL 5.906116
BSD 1.139343
BTN 106.936538
BWP 15.483957
BYN 3.304345
BYR 22325.7403
BZD 2.291333
CAD 1.616088
CDF 2585.685641
CHF 0.921945
CLF 0.026716
CLP 1051.47848
CNY 7.750051
CNH 7.748997
COP 3924.853754
CRC 517.274756
CUC 1.139068
CUP 30.185312
CVE 110.152667
CZK 24.262503
DJF 202.435681
DKK 7.474852
DOP 66.942027
DZD 151.891398
EGP 56.388104
ERN 17.086026
ETB 183.690043
FJD 2.581248
FKP 0.861953
GBP 0.862588
GEL 3.012882
GGP 0.861953
GHS 12.846463
GIP 0.861953
GMD 83.152397
GNF 9982.863336
GTQ 8.692174
GYD 238.447299
HKD 8.931931
HNL 30.484046
HRK 7.534145
HTG 148.908797
HUF 353.806604
IDR 20318.644856
ILS 3.419541
IMP 0.861953
INR 107.482778
IQD 1492.484522
IRR 1566275.979936
ISK 143.990074
JEP 0.861953
JMD 179.437798
JOD 0.807645
JPY 184.248302
KES 147.464231
KGS 99.611968
KHR 4573.356185
KMF 494.356077
KPW 1025.161943
KRW 1749.07411
KWD 0.352667
KYD 0.949478
KZT 552.798685
LAK 25007.607115
LBP 102029.928944
LKR 382.987923
LRD 207.538374
LSL 18.727983
LTL 3.363373
LVL 0.689012
LYD 7.313542
MAD 10.683358
MDL 20.201374
MGA 4819.022121
MKD 61.650608
MMK 2391.4173
MNT 4078.140908
MOP 9.203718
MRU 45.46983
MUR 54.345384
MVR 17.599037
MWK 1975.671941
MXN 19.928917
MYR 4.656556
MZN 72.790718
NAD 18.727983
NGN 1569.96699
NIO 41.927427
NOK 11.321935
NPR 171.101263
NZD 2.019175
OMR 0.437978
PAB 1.139393
PEN 3.885055
PGK 4.999879
PHP 69.810658
PKR 317.086147
PLN 4.288536
PYG 6953.908432
QAR 4.152965
RON 5.240402
RSD 117.409287
RUB 89.840095
RWF 1668.578957
SAR 4.278556
SBD 9.171725
SCR 15.116694
SDG 683.441416
SEK 11.086063
SGD 1.474085
SHP 0.85043
SLE 28.253073
SLL 23885.698624
SOS 651.167384
SRD 42.695744
STD 23576.41575
STN 24.475148
SVC 9.968834
SYP 125.903618
SZL 18.716995
THB 37.997617
TJS 10.544809
TMT 3.986739
TND 3.377019
TOP 2.742604
TRY 53.107967
TTD 7.743002
TWD 36.285825
TZS 2987.418743
UAH 51.139324
UGX 4181.643799
USD 1.139068
UYU 45.735567
UZS 13685.704189
VES 707.080099
VND 29957.498463
VUV 136.632283
WST 3.172872
XAF 655.291613
XAG 0.019292
XAU 0.000279
XCD 3.07839
XCG 2.053315
XDR 0.816089
XOF 655.288739
XPF 119.331742
YER 271.810235
ZAR 18.752312
ZMK 10252.986409
ZMW 20.523521
ZWL 366.779554
  • DAX

    -323.6100

    24671.22

    -1.31%

  • MDAX

    -383.9900

    31588.65

    -1.22%

  • TecDAX

    -32.5600

    3860.16

    -0.84%

  • Euro STOXX 50

    -45.9800

    6221.55

    -0.74%

  • SDAX

    -86.7100

    17767.77

    -0.49%

  • Goldpreis

    55.4000

    4103

    +1.35%

  • EUR/USD

    0.0013

    1.139

    +0.11%

Graid Technology bringt ein agentenbasiertes KI-Speicherportfolio auf den Markt, um Engpässe bei KV-Caches zu beseitigen
Graid Technology bringt ein agentenbasiertes KI-Speicherportfolio auf den Markt, um Engpässe bei KV-Caches zu beseitigen

Graid Technology bringt ein agentenbasiertes KI-Speicherportfolio auf den Markt, um Engpässe bei KV-Caches zu beseitigen

Von Edge-Inferenz bis NVIDIA STX: speziell entwickelte KV-Cache-Infrastruktur für konsistente Leistung in großem Maßstab.

Textgröße:

SUNNYVALE, CA / ACCESS Newswire / 21. April 2026 / Graid Technology, der Pionier im Bereich GPU-beschleunigter NVMe-Speicher, hat heute sein Agentic AI Storage Portfolio vorgestellt: eine speziell entwickelte Familie von KV-Cache-Lösungen, die darauf ausgelegt ist, den Speicherengpass zu beseitigen, der „Always-on"-Produktions-KI ausbremst. Das Portfolio umfasst drei Bereitstellungsebenen: KV-Cache-Server, KV-Cache-Rack und KV-Cache-Plattform, die alle auf der SupremeRAID™-Technologie basieren. Die KV-Cache-Plattform, die höchste Stufe des Portfolios, ist auf die STX-Referenzarchitektur von NVIDIA abgestimmt, wobei die native BlueField-4-DPU-Ausführung für das zweite Halbjahr 2026 geplant ist.

Da agentische KI vom Experimentierstadium in die Produktion übergeht, haben sich die Infrastrukturannahmen, die der Single-Shot-Inferenz zugrunde lagen, als unhaltbar erwiesen. Modelle, die kontinuierliche mehrstufige Aufgaben ausführen und den Kontext über stundenlangen Betrieb hinweg aufrechterhalten, erzeugen KV-Cache-Anforderungen, die den GPU-HBM überlasten. Die Folge: Latenzspitzen von bis zu 18-fach, eine GPU-Auslastung von nur 50 % sowie Fehler auf Modellebene, darunter Halluzinationen und eine Verschlechterung der Schlussfolgerungsfähigkeit, die schwer zu erkennen und kostspielig zu beheben sind.

SupremeRAID™geht dieses Problem direkt an, indem es bis zu 32 NVMe-Laufwerke zu einem einzigen virtuellen Pool mit 280 GB/s bündelt, die CPU über GPU Direct Storage umgeht und KV-Cache-Lesevorgänge mit 1,3 ms liefert - 77-mal schneller als bei Standard-NVMe. Die drei Portfolio-Stufen machen diese Fähigkeit für jede Bereitstellungsgröße verfügbar:

KV-Cache-Server - NVMe-Beschleunigung auf Einzelknotenebene für einzelne Inferenzserver und Edge-AI-Bereitstellungen. Ab sofort verfügbar.

KV-Cache-Rack - Rack-Scale-Lösungen, die von Partnern validiert und gemeinsam mit führenden Server-OEM-Partnern für Multi-GPU-Cluster in Unternehmen entwickelt wurden. Jetzt verfügbar.

KV-Cache-Plattform - Speziell für die STX-Referenzarchitektur von NVIDIA entwickelt, mit nativer BlueField-4-DPU-Ausführung und einer auf Rack-Ebene skalierbaren Speichererweiterung in der Roadmap.

„Vor einem Jahr, auf der GTC 2025, prognostizierte Jensen Huang, dass Speicher erstmals GPU-beschleunigt werden würde. In diesem Jahr hat NVIDIA dieses Konzept mit STX und CMX in eine Architektur umgesetzt", sagte Leander Yu, CEO von Graid Technology. „Unser KV-Cache-Portfolio ist genau für diesen Moment konzipiert und liefert die Speicherleistung, die agentische KI erfordert, und das zu den Kosten einer Speicherebene."

Für Unternehmen und Infrastrukturteams, die den Einsatz von agentischer KI evaluieren, sind die vollständige Bereitstellungsarchitektur, technische Spezifikationen und Details zur NVIDIA STX-Kompatibilität im Solution Brief verfügbar: Graid Technology Agentic AI Storage Portfolio: Speziell entwickelte KV-Cache-Lösungen für Inferenz in großem Maßstab

Weitere Informationen zu den KI-Angeboten von Graid Technology finden Sie unter graidtech.com/ai

Medienanfragen:

Andrea Eaken, Sr. Direktor für Marketing, Americas & EMEA

[email protected]

____________________________________

Über Graid Technology

Graid Technology entwickelt die Speicherinfrastruktur für die Zukunft von KI, Unternehmen und Hochleistungsrechnen. Als Entwickler von SupremeRAID™, dem weltweit ersten und einzigen GPU-basierten RAID, und als globaler Verfechter von Intel® Virtual RAID on CPU (Intel® VROC) bietet Graid Technology flexible RAID-Lösungen, die die NVMe-Leistung maximieren und gleichzeitig einen ausfallsicheren, skalierbaren Datenschutz für moderne Dateninfrastrukturen gewährleisten. Graid Technology hat seinen Hauptsitz im Silicon Valley und verfügt über weltweite Niederlassungen sowie Forschungs- und Entwicklungszentren in Taiwan. Das Unternehmen treibt RAID-Innovationen für die nächste Generation datenintensiver Workloads voran. Weitere Informationen finden Sie unter graidtech.com.

QUELLE: Graid Technology Inc.

T.Sasaki--JT