Arm Cortex-A320 Erster Armv9-Prozessorkern für Edge-KI- und Embedded-Anwendungen

Von Sebastian Gerstl 3 min Lesedauer

Anbieter zum Thema

Arm hat seinen ersten Prozessorkern für Edge-KI- und Embedded-Anwendungen entwickelt, der den ARMv9-Befehlssatz verwendet. Dies ist ein grundlegender Wandel für Embedded-Entwickler, die bisher einen High-End-Mikrocontroller verwendet haben, sagt Paul Williamson, General Manager von Arm.

Mit dem Armv9-basierten Prozessorkern Arm Cortex A320 möchte der britische IP-Anbieter Arm die Embedded-Entwicklung „grundlegend verändern": Support für Echtzeitbetriebssysteme, mehr Flexibilität in der Speicheradressierung und direkte Unterstützung der bereits etablierten Ethos-U85-NPU sollen in der Entwicklung von Embedded-Systemen neue Möglichkeiten eröffnen.(Bild:  Arm)
Mit dem Armv9-basierten Prozessorkern Arm Cortex A320 möchte der britische IP-Anbieter Arm die Embedded-Entwicklung „grundlegend verändern": Support für Echtzeitbetriebssysteme, mehr Flexibilität in der Speicheradressierung und direkte Unterstützung der bereits etablierten Ethos-U85-NPU sollen in der Entwicklung von Embedded-Systemen neue Möglichkeiten eröffnen.
(Bild: Arm)

ARM hat seinen ersten Prozessorkern für Edge-KI- und Embedded-Anwendungen entwickelt, der den ARMv9-Befehlssatz verwendet. Laut Paul Williamson, General Manager von Arm, habe man damit nicht nur einen inkrementellen Schritt, sondern einen „grundlegenden Wandel“ für Embedded-Entwickler vollzogen.

Bei der Umstellung auf einen Mikroprozessor anstelle eines Mikrocontrollers geht es vor allem um die Speicherverwaltung für KI-Frameworks. Bis zu vier ARM Cortex-A320-Kerne können zusammen mit einer U85 Neural Processing Unit (NPU) zu einem Embedded-Prozessor zusammengefasst werden.

„Dies ist nicht nur ein inkrementeller Schritt nach vorn, sondern ein grundlegender Wandel. Wir glauben, dass er die Edge-KI für viele Jahre vorantreiben wird“, sagte Paul Williamson, General Manager von Arm, anlässlich der Vorstellung des für den Edge-KI- und Embedded-Einsatz gedachten Arm Cortex A320. „Wir haben dies von Grund auf speziell für Edge AI entwickelt.“

RTOS-Support, mehr Speicheradressierung und stärkere Edge-KI

Der Cortex-A320 unterstützt bis zu 64 KB L1-Caches und bis zu 512 KB L2 und verfügt über eine 256-Bit AMBA5 AXI-Schnittstelle zum externen Speicher. Der L2-Cache und die L2-TLB können von den Cortex-A320-CPUs gemeinsam genutzt werden, und die Vektorverarbeitungseinheit - die die NEON- und SVE2-SIMD-Technologien (Single Instruction, Multiple Data) implementiert - kann entweder privat in einem Einzelkernkomplex oder gemeinsam von zwei Kernen in einer Dual-Core- oder Quad-Core-Implementierung genutzt werden. (Bild:  Arm)
Der Cortex-A320 unterstützt bis zu 64 KB L1-Caches und bis zu 512 KB L2 und verfügt über eine 256-Bit AMBA5 AXI-Schnittstelle zum externen Speicher. Der L2-Cache und die L2-TLB können von den Cortex-A320-CPUs gemeinsam genutzt werden, und die Vektorverarbeitungseinheit - die die NEON- und SVE2-SIMD-Technologien (Single Instruction, Multiple Data) implementiert - kann entweder privat in einem Einzelkernkomplex oder gemeinsam von zwei Kernen in einer Dual-Core- oder Quad-Core-Implementierung genutzt werden.
(Bild: Arm)

Der A320 wurde so ausgelegt, dass er bereits bestehende Echtzeit-Betriebssysteme wie FreeRTOS und Zephyr sowie High-Level-Linux- und Android-Betriebssysteme ausführen kann. Darüber hinaus ist er in der Lage, auf die ARMv9-Architektur abgestimmte KI-Modelle mit mehr als 1 Mrd. Parametern zu verarbeiten, z. B. große Sprachmodelle (LLMs) oder eine Auswahl kleinerer Modelle für agentenbasierte KI.

Dies sorgt für leistungsfähigere Embedded-Systeme, die bereits in der Lage sind, auf lokaler Ebene leistungsfähigere KI-Agenten zu nutzen, ohne dass ein Cloud-Zugang notwendig wäre. „Wir können das Potenzial der KI nur ausschöpfen, wenn wir sie auf die Geräte um uns herum übertragen“, meint Williamson. „Vor ein paar Jahren waren die KI-Workloads einfacher, mit Rauschunterdrückung oder Anomalieerkennung, aber jetzt sind sie viel komplexer, so dass wir den Bedarf an höherer Leistung sehen“, sagte Williamson. Die Kombination aus einer erhöhten Speicherflexibilität und RTOS-Unterstützung mit leistungsstarker Edge-KI eröffneten Embedded-Entwickler vollkommen neue Konfigurationen und Möglichkeiten.

Ein Einsatz von Arm-Kernen mit NPU-Unterstützung in Mikrocontrollern gibt es bereits. So wurde bereits der Ethos-M55-NPU-Coprozessor auf eine gute Zusammenarbeit und Integration mit Arm-Cortex-M55-Kernen in einem Mikrocontroller ausgelegt. Auch für die Arm-Cortex-M85-IP gibt es mit dem Ethos-U85-KErn – mittlerweilse die dritte Generation an Arm-Neuralpozessoren – eine maßgeschneiderte NPU, die beispielsweise in Vertretern der RA8E-Reihe von Renesas Einsatz findet.

Die Grenzen der M-Reihe überwinden

„Mikrocontroller sind auf Leistung optimiert, und der M85 ist noch nicht lange auf dem Markt, und wir sind sehr zufrieden mit den Plattformen, die sich entwickeln, sagte Williamson“ , kommentiert Williamson diese Entwicklungen. Allerdings geht in modernen Embedded-Systemen der Bedarf hin zu einer Adressierungen von größerem Arbeitsspeicher – vor allem, wenn es auf die Nutzung von KI-Modellen ankommt. Hier stoße die M-Reihe an ihre Grenzen.

Der Cortex-A320-Kern wurde so ausgelegt, dass er bereits direkt mit dem im Markt etablierten Ethos-U85-NPU-Coprozessor zusammenarbeiten kann.(Bild:  Arm)
Der Cortex-A320-Kern wurde so ausgelegt, dass er bereits direkt mit dem im Markt etablierten Ethos-U85-NPU-Coprozessor zusammenarbeiten kann.
(Bild: Arm)

„Die ARMv9-Verbesserungen optimieren die Leistung des maschinellen Lernens mit der 8-fachen Leistung des Cortex-M85 mit U85 für Transformer-Netzwerke“, sagte er. Arm habe den Treiber für den Ethos-U85-NPU so aktualisiert, dass er direkt vom A320 angesteuert werden könne, ohne dass hierfür ein M85-Kern enthalten sein muss.

Die ARMv9-Architektur bietet auch mehr Sicherheit mit Erweiterungen für Memory Tagging, Pointer-Authentifizierung und sichere Ausnahmen der Stufe 2 im TrustZone-Sicherheitsblock, um sicherere Container zu unterstützen, die häufig für KI-Frameworks verwendet werden.

Der A320 ist die unterste Stufe der V9-Familie, die sich über den A520 und A725 bis hin zum High-End-Kern X925 erstreckt. Williamson sieht den Kern in Chips zum Einsatz kommen, die von Wearables für Verbraucher über Präzisionslandwirtschaft und intelligente Fertigung bis hin zu autonomen Fahrzeugen reichen, sowie im Baseboard-Management von Servern und Infrastruktur

Der ARM Cortex-A320 befindet sich bei Partnern in der Entwicklung und wird im voraussichtlich im Laufe des Jahres 2026 auf dem Markt erscheinen. Ein Vorab-Modell des Cortex-A320 steht Partnern derzeit für die ARMv9-Softwareentwicklung zur Verfügung. Eine zyklusgetreue feste virtuelle Plattform (FVP) des kombinierten Cortex-A320 und Ethos-U85 soll voraussichtlich später in diesem Jahr verfügbar sein.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Dieser Artikel stammt von unserem Partnerportal ELEKTRONIKPRAXIS.

(ID:50338294)