Vraag:
Grootste aantal kernen op het kleinste bord
iXCray
2016-07-11 13:08:14 UTC
view on stackexchange narkive permalink

Ik ben op zoek naar parallel computergebruik in de kleinst mogelijke vorm. Het zou bijvoorbeeld een ideale oplossing zijn om twee Intel Xeon-cores met 18 kernen aan beide zijden van het moederbord te hebben geparkeerd met een creditcardformaat.

Kon geen moederborden vinden (compatibel met CPU's met 10+ cores) zonder USB's, Wifi, PCIe en andere poorten, dat maakt ze alleen maar groter.

Meer specifiek heb ik de beste cores per vierkante meter verhouding nodig: CPU en moederbord modellen.

  • 1,5-2 GHz is ok. Meer = beter, maar niet kritisch
  • ja, het is om een ​​CPU-farm met een hoge dichtheid te bouwen
  • nee, het is niet voor mijnbouw, het is voor wiskundige, niet-GPU-berekeningen
  • ja, het aantal cores (multithreading) is kritiek
  • ja, enorme 4x "Intel Broadwell-EP CPU" server-moederborden zijn oké totdat ze de beste cores / kwadraatverhouding hebben

Bijgewerkt (12.07):

Gezien de antwoorden die ik op dit moment heb:

  • Helemaal geen AMD, Xeon-processors wel, E5 of E7 moet worden geëvalueerd op basis van kosten / dichtheid / arbeidsfactor, wordt later bijgewerkt met berekeningen.
  • Ik zit ook in bladeservers met extreme dichtheid MET ondersteuning van Xeon Phi - sommige applicaties werken op het mooi met hergebruik van code en data, heb een dag besteed aan het zoeken naar specificaties en kosten, zal updaten zodra het een mooie configuratie bij de hand heeft
  • met betrekking tot CUDA en Nvidia Tesla, dat is een aparte vraag en het is is al opgelost, zal later specificaties met u delen, bedankt, SEJPM!

Wat al is besloten dat de configuratie zowel Xeon E5 / E7 als Xeon Phi op dezelfde kaarten zal hebben (niet op alle). Cray-supercomputers gebruiken het al

Bijgewerkt (12.07) [2]:

Voor de duidelijkheid: ik heb veel kleine binaire bestanden (platformonafhankelijk, C ++ en Java) die allemaal seconden werken met volledige ondersteuning voor parallel computergebruik. Als het gaat om situaties waarin er aanzienlijk minder cores zijn dan het aantal gestarte threads / processen, neemt de algehele efficiëntie af door veel contextwisseling tussen processen. En er is geen manier om taken in de wachtrij te plaatsen, laten we zeggen dat ze in realtime moeten worden gedaan.

De beste manier is om ze te verdelen onder Xeon Phi (winkelcode en vooraf ingesteld met gegevens) + anderen uit te voeren als een tiny-services (probleem met binaire laadoverhead oplossen) wachtend op banen.

Daarom zoek ik naar een relatief goedkope oplossing met een hoge cores-dichtheid om geen groot aantal eenheden te behouden en meer problemen met data op te lossen -logistiek.

Vier antwoorden:
#1
+4
JBiggs
2016-09-09 00:05:17 UTC
view on stackexchange narkive permalink

Als je bereid bent om wat meer werk te doen aan integratie met wat je maar wilt, kun je een Parallella-bord proberen. Dat geeft je een 16-core RISC-co-processor plus een dual-core hoofdprocessor op een bord ter grootte van een creditcard. Ze verbruiken heel weinig energie en zijn specifiek ontworpen om te worden gebruikt in clusters of in parallelle (vandaar de naam) toepassingen. Als bonus beginnen ze bij ongeveer $ 100 per stuk en draaien ze Linux. https://www.parallella.org/

enter image description here

Dit is iets waar ik misschien in geïnteresseerd ben, hoewel ik waarschijnlijk een op maat gemaakte koffer van hout zou maken of zoiets. Ik kan ze niet allemaal onbeschermd laten liggen.
#2
+2
Adam Wykes
2016-07-11 19:03:29 UTC
view on stackexchange narkive permalink

Ik ga ervan uit dat je x86-compatibele cores / threads nodig hebt, en ik ga ervan uit dat je om de een of andere reden niet zoiets als de Xeon Phi-rekenkaart wilt gebruiken. Ik ga er ook vanuit dat, omdat u het niet hebt gespecificeerd, u zich geen zorgen maakt over stroomvereisten en warmteverspreiding, aangezien het niet werd genoemd.

Dat gezegd hebbende, er zijn sommige absolute monsters die er zijn, kun je in vrij kleine builds passen.

Aan de AMD-kant zit je vast in 2012, tenzij je zin hebt in ARM, maar je kunt nog steeds zeer krachtige 64 real-core systemen krijgen die zijn gebouwd op quad-socket G34-serverborden die op de een of andere manier vol zitten in 1U-chassis door Supermicro en andere bedrijven.

Aan de Intel-kant, waar ik vermoed dat je zult eindigen, kun je de formidabele Intel Xeon E5-2699 V4 krijgen, met 22 cores en 44 threads PER PROCESSOR , op grote multi-CPU-kaarten, of op dunne ITX-kaarten zoals deze: http://www.anandtech.com/show/9221/asrock-rack-announces-epc612d4i, of deze http://www.asrockrack.com/general/productdetail.asp?Model=EP2C612D8HM#Specifications - welke manier je ook de meeste dichtheid geeft. Ik beveel AsRock ook niet per se als merk aan, ik laat je alleen zien wat er mogelijk is met het gebruik van hun site.

Als dat allemaal niet zal volstaan, zul je dingen als Xeon Phi, IBM Power8 of ARM-architecturen. Hoewel ze exotischer zijn en daarom moeilijker om mee te werken, hebben deze typen CPU's een zeer hoge computerdichtheid, met elk verschillende benaderingen. Er is meer informatie / onderzoek nodig voordat iets op dit gebied kan worden aanbevolen.

AsRock met twee 2011-R3-sockets is tot nu toe het beste. Zal Xeon Phi controleren en daarna meer opmerkingen toevoegen, bedankt! Als er in de komende dagen geen betere zal worden gevonden, markeert u uw antwoord.
@iXCray merk op dat Xeon E7s soms meer cores hebben (tenminste voor Broadwells) en dat je die in configuraties met 4 en 8 sockets kunt gebruiken in plaats van 2 sockets met E5s. Ze zijn echter super duur (net als de 4/8 socketboards)
Bedankt SEJPM - ik dacht dat ik iets miste met betrekking tot de E7-opstelling, maar bij mijn korte zoektocht kon ik geen sites vinden die deze verkopen met voldoende informatie om een ​​weloverwogen aanbeveling te doen. geen object. Zelfs als u naar Broadwell zou moeten "terugtrekken", zouden de IPC-verschillen die worden overwogen niet opwegen tegen bijna elke toevoeging van threads.
#3
+2
Mark Booth
2016-07-13 20:24:56 UTC
view on stackexchange narkive permalink

Een andere optie die je misschien wilt bekijken, zijn industriële computers met één bord, gebaseerd op de PICMG 1.3-specificatie.

De ROBO-8122VG2R SBC ondersteunt bijvoorbeeld een paar E5- 2600-serie CPU's:

ROBO-8122VG2R Dual Xeon SBC

Er is ook de Advantech PCE-9228, die aangeeft dat deze v3 CPU's.

Combineer deze met een quad-split chassis-backplane en je zou potentieel 8 Xeons en 4 Xeon Phi's kunnen hebben in een enkel 4U 19-inch rackchassis.

Quad split chassis backplane

Ik weet niet zeker of dit compacter zou zijn dan een cluster van 1U-rackservers, maar ik vermoed dat ze misschien gemakkelijker zijn om aan te werken.

Nou, ze zijn geweldig, maar het is waarschijnlijker dat ik Knights Landing (Xeon Phi) zal gebruiken, dat al niet alleen in de vorm van een co-processor is, maar ook in de vorm van een CPU. 60+ cores, 240+ hardware-threads.
#4
+1
SEJPM
2016-07-12 00:48:57 UTC
view on stackexchange narkive permalink

In mijn antwoord zal ik een beetje ingaan op Adams antwoord. Ik zal me ook beperken tot Intel-processors en alle merkaanbevelingen moeten met een korreltje zout worden genomen, gezien het feit dat ik geen werkelijke / praktische ervaring heb met dit soort hardware.

Dus uw doel is maximale dichtheid van kernen / ruimte. Dit betekent dat u zoveel mogelijk processors in zo kleine ruimtes wilt passen.

Als u niet echt geeft om de verdeling van CPU's over moederborden, dan zijn 1U-servers met volledige 2- socket Xeon E5 v4s is de juiste keuze. Of als je bereid bent wat tijd te besteden aan het zoeken naar en het vragen van hardwareproviders, dan kun je waarschijnlijk ook een 4-socket Xeon E7 v4s 1U-configuratie krijgen (of als je echt mooi een 8-socket moederbord kan ook passen, merk op dat 4XXX CPU's voor 4-socket configuraties zijn en 8XXX CPU's voor 8-socket configuraties). Dit zou de meeste cores per ruimte-eenheid moeten hebben als het je niet uitmaakt om groeperen.

Als je zoveel mogelijk cores op een enkel bord wilt hebben, dan is een 8-socket Xeon E7 v4s de weg te gaan. Hoewel de kans groot is dat het minder optimaal zal zijn op de afdeling cores / space.

Bovendien zou je moeten overwegen om Xeon Phi en / of Nvidia Tesla te gebruiken. accelerator kaarten. De Nvidia-kaarten gaan goed samen met zeer parallelliseerbare (kleine) werkbelastingen, terwijl de Phis in feite worden gedumpt Intel-processors gegroepeerd op een PCIe-kaart en dus lineaire werkbelasting veel beter ondersteunen.

Een laatste opmerking: afhankelijk van wat u van plan bent te doen, kan een goede RISC-architectuur zoals PowerPC, ARM en SPARC het bekijken waard zijn, aangezien veel van de huidige Top500-supercomputers deze architecturen gebruiken.

Voorbeelden van leveranciers van Xeon E7-apparatuur zijn Delta Computers (alleen in het Duits?), Lenovo en Supermicro.
Wat betreft de CPU's, de Intel Xeon E5 2699v4 is de dual-socket CPU met de meeste cores. De Intel Xeon E5 4669 v4 voor 4-sockets (elk slechts 16 cores) en de Intel Xeon E7 8890 v4 voor 8-sockets (elk 24 fysieke cores). De Nvidia Tesla P100 is de beste huidige supercomputerkaart van Nvidia en de Intel Xeon Phi 7290F is de beste huidige Xeon Phi-kaart.

Ik heb de Tesla's niet opgenomen omdat AFAIK het in wezen GPU's zijn zonder de RAMDAC's en andere grafische specifieke onderdelen erop, en DP-precisie is ingeschakeld in de firmware. Als je het bericht van OP bekijkt, lijken ze geen GPGPU-berekening te willen.
@AdamWykes, Ik heb ze als een optie toegevoegd, omdat ik de exacte werklast die hij heeft niet weet en om de positie van de Xeon Phis duidelijker en gemakkelijker te begrijpen te maken.


Deze Q&A is automatisch vertaald vanuit de Engelse taal.De originele inhoud is beschikbaar op stackexchange, waarvoor we bedanken voor de cc by-sa 3.0-licentie waaronder het wordt gedistribueerd.
Loading...