Vad är AVX-512 och varför dödar Intel det?

Vad är AVX-512 och varför dödar Intel det?

CPU:n på din enhet utför miljontals beräkningar varje sekund och är ansvarig för hur din dator fungerar. Arbetet med processorn är den aritmetiska bearbetningsenheten (ALU), som ansvarar för matematiska uppgifter och drivs av processorns mikrokod.



Nu är den CPU-mikrokoden inte statisk och kan förbättras, och en sådan förbättring var Intels AVX-512-instruktionsuppsättning. Intel är dock inställd på att döda AVX-512 och ta bort dess funktionalitet från sina processorer för gott. Men varför? Varför dödar Intel AVX-512?





MAKEUSE AV DAGENS VIDEO

Hur fungerar en ALU?

Innan du lär känna AVX-512-instruktionsuppsättningen är det viktigt att förstå hur en ALU fungerar.





Som namnet antyder används den aritmetiska bearbetningsenheten för att utföra matematiska uppgifter. Dessa uppgifter inkluderar operationer som addition, multiplikation och flyttalsberäkningar. För att utföra dessa uppgifter använder ALU:n applikationsspecifika digitala kretsar, som drivs av CPU:ns klocksignal.

Därför definierar klockhastigheten för en CPU hastigheten med vilken instruktioner bearbetas i ALU. Så om din CPU körs på en 5GHz klockfrekvens kan ALU bearbeta 5 miljarder instruktioner på en sekund. På grund av denna anledning förbättras CPU-prestandan när klockhastigheten ökar.



  Chipset på ett moderkort

Som sagt, när CPU-klockhastigheten ökar, ökar mängden värme som genereras av CPU:n. På grund av denna anledning använder avancerade användare flytande kväve när de överklockar sina system. Tyvärr hindrar denna temperaturökning vid höga frekvenser CPU-tillverkare från att öka klockfrekvensen över en viss tröskel.

en eller flera videor har tagits bort från spellistan eftersom de har tagits bort från youtube.

Så hur erbjuder en ny generations processor bättre prestanda jämfört med äldre iterationer? Tja, CPU-tillverkare använder konceptet parallellism för att öka prestanda. Denna parallellitet kan uppnås genom att använda en flerkärnig arkitektur där flera olika bearbetningskärnor används för att förbättra processorns beräkningskraft.





Ett annat sätt att förbättra prestandan är att använda en SIMD-instruktionsuppsättning. Enkelt uttryckt möjliggör en enkel instruktions multipeldatainstruktion ALU:n att exekvera samma instruktion över olika datapunkter. Denna typ av parallellitet förbättrar prestandan hos en CPU, och AVX-512 är en SIMD-instruktion som används för att öka en CPU:s prestanda när man utför specifika uppgifter.

Hur når data ALU?

Nu när vi har en grundläggande förståelse för hur en ALU fungerar måste vi förstå hur data når ALU.





  hårddisk med tom bakgrund

För att nå ALU måste data flyttas genom olika lagringssystem. Denna dataresa är baserad på ett datorsystems minneshierarki. En kort översikt över denna hierarki ges nedan:

  • Sekundärt minne: Det sekundära minnet på en datorenhet består av en permanent lagringsenhet. Den här enheten kan lagra data permanent men är inte lika snabb som processorn. På grund av detta kan processorn inte komma åt data direkt från det sekundära lagringssystemet.
  • Primärt minne: Det primära lagringssystemet består av RAM (Random Access Memory). Detta lagringssystem är snabbare än det sekundära lagringssystemet men kan inte lagra data permanent. Därför, när du öppnar en fil på ditt system, flyttas den från hårddisken till RAM-minnet. Som sagt, inte ens RAM-minnet är tillräckligt snabbt för processorn.
  • Cacheminne: Cacheminnet är inbäddat i CPU:n och är det snabbaste minnessystemet på en dator. Detta minnessystem är uppdelat i tre delar, nämligen L1, L2 och L3 cache . Alla data som behöver bearbetas av ALU:n flyttas från hårddisken till RAM-minnet och sedan till cacheminnet. Som sagt, ALU kan inte komma åt data direkt från cachen.
  • CPU-register: CPU-registret på en datorenhet är mycket liten i storlek, och baserat på datorarkitekturen kan dessa register innehålla 32 eller 64 bitar av data. När data väl har flyttats in i dessa register kan ALU komma åt den och utföra uppgiften.

Vad är AVX-512 och hur fungerar det?

AVX 512-instruktionsuppsättningen är den andra iterationen av AVX och tog sig till Intel-processorer 2013. Förkortning för Advanced Vector Extensions, AVX-instruktionsuppsättningen introducerades först i Intels Xeon Phi (Knights Landing)-arkitektur och kom senare till Intels server processorer i Skylake-X-processorerna.

Dessutom tog instruktionsuppsättningen AVX-512 sin väg till de konsumentbaserade systemen med Cannon Lake-arkitekturen och stöddes senare av Ice Lake- och Tiger Lake-arkitekturen.

Huvudmålet med denna instruktionsuppsättning var att påskynda uppgifter som involverade datakomprimering, bildbehandling och kryptografiska beräkningar. Med dubbel beräkningskraft jämfört med äldre iterationer, erbjuder AVX-512 instruktionsuppsättningen betydande prestandavinster.

Så, hur fördubblade Intel prestanda för sina processorer med AVX-512-arkitekturen?

Tja, som förklarats tidigare kan ALU endast komma åt data som finns i en CPU:s register. Instruktionsuppsättningen Advanced Vector Extensions ökar storleken på dessa register.

Tyvärr har processen android.process.acore slutat

På grund av denna ökning i storlek kan ALU bearbeta flera datapunkter i en enda instruktion, vilket ökar systemets prestanda.

När det gäller registerstorlek erbjuder AVX-512-instruktionsuppsättningen trettiotvå 512-bitarsregister, vilket är dubbelt jämfört med den äldre AVX-instruktionsuppsättningen.

Varför slutar Intel AVX-512?

Som förklarats tidigare erbjuder instruktionsuppsättningen AVX-512 flera beräkningsfördelar. Faktum är att populära bibliotek som TensorFlow använder instruktionsuppsättningen för att ge snabbare beräkningar på processorerna som stöder instruktionsuppsättningen.

Så varför inaktiverar Intel AVX-512 på sina senaste Alder Lake-processorer?

Tja, Alder Lake-processorerna skiljer sig från de äldre som tillverkas av Intel. Medan de äldre systemen använde kärnor som kördes på samma arkitektur, använder Alder Lake-processorerna två olika kärnor. Dessa kärnor i Alder lake processorer är kända som P och E-kärnor och drivs av olika arkitekturer.

hur man använder ps3 spara data från en annan användare

Medan P-kärnorna använder Golden Cove-mikroarkitekturen, använder E-kärnorna Gracemont-mikroarkitekturen. Denna skillnad i arkitekturer hindrar schemaläggaren från att fungera korrekt när särskilda instruktioner kan köras på en arkitektur men inte på den andra.

När det gäller Alder Lake-processorerna är AVX-512-instruktionsuppsättningen ett sådant exempel, eftersom P-kärnorna har hårdvaran för att bearbeta instruktionen, men E-kärnorna inte har det.

På grund av denna anledning stöder inte Alder Lake-processorerna AVX-512-instruktionsuppsättningen.

Som sagt, AVX-512-instruktioner kan köras på vissa Alder Lake-processorer där Intel inte fysiskt har kopplat bort dem. För att göra detsamma måste användarna inaktivera E-kärnorna under BIOS.

Behövs AVX-512 på konsumentchipset?

AVX-512-instruktionsuppsättningen ökar storleken på en CPU:s register för att förbättra dess prestanda. Denna ökning av prestanda gör det möjligt för processorer att knäppa siffror snabbare, vilket gör att användare kan köra video-/ljudkomprimeringsalgoritmer med högre hastigheter.

Som sagt, denna ökning av prestanda kan endast observeras när instruktionen som definieras i ett program är optimerad för att köras på AVX-512 instruktionsuppsättningen.

Av denna anledning är instruktionsuppsättningsarkitekturer som AVX-512 mer lämpade för serverarbetsbelastningar, och chipset av konsumentklass kan fungera utan komplexa instruktionsuppsättningar som AVX-512.