Nachricht senden
Kontaktieren Sie uns
LEO

Telefonnummer : 13486085502

Eine enorme Woche für Arm – in Data Center auch

June 29, 2020

Es ist eine enorme Woche für Arm gewesen und nicht nur weil Apple den Anfang des Schalters von Prozessoren Intels x86 zu seinen eigenen Arm-ansässigen Chips in seinen Maccomputern ankündigte. Die gemeinnützige Hochleistungs-EDV-Klassifizierungsorganisation Top500 kündigte auch diese Woche an, dass zum ersten Mal in der Geschichte, die schnellste Supercomputer der Welt durch Armchips angetrieben wird.

Fügen Sie zwei größere Entwicklungen für Arm im Rechenzentrum hinzu, das diese Woche angekündigt wird. Wie Sie vermutlich jetzt wissen, hat das Rennen, zum der Kühlvorrichtung zu produzieren, leistungsfähigere Server eine Wendung weg von Intel-Mitbegründer Gordon Moores Gesetz und in Richtung zu Sophie Wilsons Traum genommen. Clara-ansässiges Ampere Sankt rechnend, der Armserver-Chipstart, der von ExIntel-Präsidenten Renee James gebildet wurde, der gerade im März seine 80 Kern Altra-Arm CPU startete, kündigte an, dass Probenahme eines maximalen Prozessors 128 Kern Altra im vierten Quartal beginnt. Quadratisch konzentriert auf hyperscale Wolkenanbieter, entwarf Ampere das Teil, um mit Intels Xeon-Platin 8160 ($9.899 vorgeschlagene Liste) und AMDs Epyc 7742 ($6.950) auf Leistung zu konkurrieren.

Auch diese Woche, sagte das Cambridge, Unternehmen das mit Sitz in Großbritannien, das oben bis letztes Jahr als Kaleao bekannt und vergangenen Dezember als Bambussysteme umstrukturiert ist, dass es seinen ersten Server des Armes 1U, die B1000N-Reihe, im dritten Trimester freigeben würde. Der Server ist für Niederleistungsumwelt, wie RandRechenzentren bestimmt.

Plötzlich der Leistungs-Führer

Das „Auftauchen“ der Armprozessorarchitektur in den Rechenzentren durch unsere eigene Zählung ist bereits gut in sein fünftes Jahr. Soviel über die Architektur und den Bau von modernen Rechenzentren hat direkt, oder indirekt abgeleitet von der Architektur des Prozessors x86 schuf ursprünglich für PC. Aber die Entwicklung des Armes in diesem Raum ist langsam aber stabil gewesen.

Die Leistung des neuen 128 Kernes des Amperes maximales Altra strebt Supercomputergebiet an. Dort Intels Xeon-Platin 8160 Energien neun Systeme im spätesten Top500.

„An einer hohen Stufe, liefern wir soviel mehr Leistung, als Intel auf einer Basis ProcPU ist,“ sagte Jeff Wittich, das ältere VP des Amperes für Produkte. Die rohen Zahlen sind nicht heraus noch, aber Wittich behauptet Gewinn der Leistung 2.2x gegen ähnliche Prozessoren x86, und Intel-Chip des Amperes der Wahl, zum seines neuen Teils gegen zu vergleichen ist die 8160 gewesen.

Altra, das maximal ist, ist mit dem 80 Kern Altra Sockel-kompatibel, der die höchste Armkernzählung behauptete. Wittich erklärte, dass der Prozessor mit 128 Kernen die lineare Ersteigbarkeit beibehält und bedeutet, dass Leistung-prokern allmählich nicht als Kernzählungszunahmen absetzt.

Ampere-DatenverarbeitungAmpere altra Arm chip.jpg

Wenn sein Anspruch wahr hält, der eine willkommene Entwicklung seit Mai 2019 sein würde. In einer Studie veröffentlichte, dass Monat [pdf], eine Universität von Bristol-Team Leistung von, was dann die erste Arm-ansässige Supercomputer war, ein Pfadfinder Cray XC50, den das System Isambard betitelte und durch Armprozessoren Marvell ThunderX2 antreibt, gegen Cray-Maschinen mit ähnlichen Spezifikationen verglich, einschließlich eine auf 28 Kern Xeon-Platin 8176 Prozessoren errichtet.

Das Bristol-Team fand, dass der Marvell-Chip unter der Gradeinteilung des Leistungsfähigkeits-Abhangs litt, besonders nach einer Knotenzählung von 16. Bei 64 Serverknoten fiel die Gradeinteilung von Leistungsfähigkeit für den Arm-ansässigen Prozessor unterhalb 80 Prozent, während die Intel-Chips ganz über 100 Prozent blieben.

Die Tests des Amperes demgegenüber basieren auf Kern und Fadenzahlen, nicht Knotenzählungen. Noch wenn, welcher Wittich sagte, wahres prüften, würde es bedeuten, bewaffnen dass das, haben Prozessoringenieure einen ernsten Störschub überwunden, der ihre Produkte nicht konkurrierend gemacht haben könnte im HPC-Raum.

„Unser Fokus ist Wolke gewesen, also optimieren wir alles für unsere Wolkenumwelt,“ sagte Wittich DCK. „Aber viele Sachen, die wir dort tun, würden auf eine in hohem Grade ersteigbare Supercomputer gleichmäßig anwendbar sein. So sehen wir Interesse dort sicher. Es gibt nichts, das ausschließt es.“

Ampere zielt darauf ab, Altra zu holen, das in allgemeine Massenproduktion bis Mitte 2021 maximal ist.

Heimlichkeits-Panda

„Viele Firmen dort draussen setzen bereits Armprozessoren in ihre Server. HPE, Supermicro, Lenovo haben alles erhaltenes,“ Tony Craythorne, CEO von Bambussystemen, erwähnte. „Aber allem, das sie getan haben, wird buchstäblich ein Armchip in die Architektur x86 verstopft. Das kann Ihnen einigen des Nutzens des Armes geben — es verringert die Energie und das Abkühlen — aber es gibt Sie irgendeinen nicht des Nutzens der Verarbeitung, des Inputs/Output und der Durchsatzfähigkeit, in der Arm hat einen enormen Vorteil.“

Sein Punkt war, dass Bambus nicht gerade einen Server mit Intel oder EINEM AMD-Prozessor einführte, die mit dem Arm ersetzt wurden, aber eine vollständig neue Architektur errichtet um diese Art des Prozessors. Etwas von der Bemühung zeigend, mit der sein Name in Handarbeit gemacht wurde, nennt er ihn paralleler Arm-Knoten entworfene Architektur oder PANDA.

„Unser Produkt kann einen Kunden bis zu 50 Prozent ihrer Anschaffungskosten an einem minimalen (und an ihm heute retten könnte sogar höher gehen), 75 Prozent ihres Energieverbrauchs, und ungefähr 80 Prozent ihres Gestellraumes wegen der Dichte, dass wir in einen sehr kleinen Formfaktor kommen können,“ sagte Craythorne DCK.

Obgleich die Bambusarchitektur bestimmt wird für, was er „Minisupercomputer“ Ersteigbarkeit nannte, mindestens an diesem Anfangsstadium, das oben Anfänge von der unteren Stufe einstuft. Jeder Bambusserverknoten enthält möglicherweise ein oder zwei Blätter, wenn jedes Blatt vier komplette Verarbeitungseinheiten enthält. Ein Kasten 1U enthält acht Linux-Server, jeden mit engagiertem Gedächtnis und Lagerung. Bambuspläne, zum eines Produktes 4U im Laufe des Jahres zu produzieren.

„Teil des Grundes starten wir ihn als 1U [ist], das wir verstehen, dass diese Technologie neu ist,“ sagte Craythorne. „Jeder hat ein Intel-Vermächtnissystem. Niemanden, das gerade geht, das heraus zu werfen und zu gehen, $150-200,000 auf einem System 4U aufzuwenden. Sie sollten es gerade versuchen. Sie wünschen etwas, das einfach zu kaufen ist, einfach zu verkaufen, preiswert auszuprobieren, also können sie dann sehen, wenn es für sie arbeiten wird.“

Durch „niedrige Kosten“ bedeutete Craythorne $9.995. Während ein typischer Server 1U Niederleistungs-x86 für darunter $1.500 verkaufen kann, enthält möglicherweise jeder „Knoten“ nur eine einzelne Viererkabelkern CPU. Der Bambus-CEO sagte uns, dass sein Team Gesamtkosten AWSS des Besitztaschenrechners verwendete, um die dreijährigen Kosten des Betreibens eines Gestells von acht Servern 2U Dell PowerEdge R740XD zu schätzen, die auf 16kW der Kapazität sich belaufen. War dreijährige TCO-Schätzung AWSS ungefähr $560.000.

Obgleich Bambus, einen wirklichen dreijährigen Probelauf schon zu stützen hat, behauptet die Firma ein ähnlich Ausführungsgestell von B1008N-Servern würde sich zuziehen ungefähr $200.000 über den gleichen Zeitraum.

Es gibt wenige TCO-Studien für Armserver, mit denen die Projektionen des Bambusses vergleichen. Eine Analyse 2014 Hewlett-Packards (jetzt HPE) der ersten 64-Bit--Patrone Servers ARMv8, das ProLiant M400, durch Analytiker Patrick Moorhead [pdf] möglicherweise eingestellt mindestens irgendeinen Präzedenzfall. Obgleich das M400 eine „Patrone“ eher als ein 1U war, als verwendet in einem web- serverszenario, projektierte Moorhead, dass dreijährige TCO des M400 35 Prozent niedriger als TCO eines ähnlich Ausführungsservers 1U x86 sein würde. Moorheads Forschung umfasste Input von nationalen Labors Sandia.

Craythorne erklärte, dass ein B1008N Kunden bis 50 Prozent in den Anschaffungskosten retten könnte, mindestens 75 Prozent im Energieverbrauch und 80 Prozent Gestellraum wegen der höheren Serverdichte. Obgleich er sagte, hatte seine Firma die interne Prüfung durchgeführt und die produzierten Diagramme, zum jener Tests anzuzeigen bezogen öffentlich bekannte Festpunkte mit ein, hat Bambus, harte Zahlen schon freizugeben, aber Craythorne sagte, dass er so in naher Zukunft tun würde.

Er ließ auch zu, dass dieses Teil von Bambus-TCO für recompiling einige Anwendungen ausgegeben werden könnte, die ursprünglich damit x86 auf Arm bestimmt waren, läuft.

Jeder Armprozessor ist eine Durchführung der Verarbeitung der Architektur, die das geistige Eigentum enthält, das von den Gruppe-eigenen Arm-Holdings Softbank genehmigt wird und normalerweise durch einen Fremdhersteller fabriziert ist. Infolgedessen kann fast jeder Armprozessor gesagt werden, um seine eigene Architektur zu haben, mindestens insofern als das nicht-genehmigte Teil betroffen ist. Bambus nennt seinen eigenen Version Panda. Natürlich er ein PC nicht in seiner entfernten Vergangenheit er gewesen, lässt er die häufig erforderlichen Expansionshäfen aus und verlässt hinter zwei Paaren QSFP-Ethernet-Anschlüssen (einer für jedes Blatt).

BambussystemeBambuspandaserver inside.jpg

„Dieses ist die Schlüsselkomponente, die viele Leute kämpfen, um über unser Produkt zu verstehen,“ zuließ Craythorne. Im Panda ist die CPU auf die Leitung und die Durchführung der Anwendung, mit Zugang zum D-RAM und zum Permanentspeicher (NVMe) begrenzt. Aber Vernetzungs- und Speicheraufgaben werden ausschließlich durch einen Mitprozessor behandelt, und der eingebaute Netzschalter ersetzt einen Höchst-vongestellschalter.

„Wir haben einen nichtblockierenden Schalter L3 innerhalb jedes einzelnen Blattes mit einem Klumpen der Vernetzung innerhalb des Blattes, „merkten Siobhan Ellis, den Direktor des Bambusses des Produktmanagements. So bis zu einem gewissen Grad brauchen wir nicht, Netzwerkverkehr außerhalb des Blattes zu senden.“ Beliebig beide QSFP-Häfen möglicherweise auf einem Blatt werden angeschlossen an einen Schalter, oder ein Hafen möglicherweise wird angeschlossen an einen Schalter und den anderen zum Blatt nebenan. „Das auf der Anzahl von Fernschaltern verringern, die Sie benötigen im Gestell.“