Nehalem è il nome in codice con la quale le nuove CPU quad core Intel, hanno fatto il loro debutto sul mercato dei microprocessori.
I nuovi processori di casa Intel, meglio conosciuti con il nome commerciale Intel Core i7, presentano molte innovazioni dal punto di vista architetturale e prestazionale, battendo di fatto i "vecchi" Core 2 duo e Quad in tutti i test effettuati.
Prima di approfondire quelle che sono le caratteristiche della nuova architettura, ecco un articolo, che traccia una linea (molto) generica sulla nuova famiglia di processori Intel.
Aggiornamento: Nuovi modelli 975 Extreme e 950.
Gli appassionati del settore sapranno sicuramente che il produttore americano adotta, da sempre, una "filosofia" di costruzione nota con i termini di tick tock. Ogni anno, il colosso californiano presenta una nuova generazione di CPU, che implementano una nuova architettura (tick) oppure, una nuova tecnologia produttiva (tock).
La nuova architettura (Nehalem) si "trova" nella fase di tock perché, adotta un'architettura, nuova e completamente diversa, da quella della precedente generazione (Core 2 duo - Quad).
I nuovi Core i7 sono stati sviluppati adottando la stessa tecnologia costruttiva della famiglia Penryn. Congiuntamente però, sono state introdotte numerose funzionalità del tutto assenti nella precedente architettura.
Nello specifico il debutto dei nuovi processori Intel, porta con se l'introduzione del Memory controller all'interno del processore, le istruzioni SSE4.1, la modalità turbo mode e l'adozione del bus QPI in sostituzione al classico bus FSB.
Come già citato in precedenza, la nuova famiglia di CPU Nehalem presenta importanti novità. Il progetto di ingegnerizzazione Intel, mira ad ottenere il massimo delle prestazioni, in tutti i settori: Server, desktop e notebook.
Di fatto, l'adattamento alle varie categorie, è stato reso possibile grazie alla flessibilità di questa nuova architettura. Intel ha lavorato e lavorerà su tutti quegli elementi specifici che, accomunano tutte le categorie sopra menzionate, tese a migliorare le prestazioni, l'affidabilità e i consumi.
Per meglio chiarire i vari concetti, riportiamo alcuni esempi.
L'implementazione dei nuovi Core i7 all'interno dei sistemi notebook, mira decisamente al contenimento dei consumi, mentre per i processori destinati all'utilizzo nei server, saranno implementati quantitativi maggiori di cache L3.
Dopo aver chiarito i concetti base della nuova architettura, ecco un elenco delle novità introdotte.
Architettura quad core unificata: Intel per la nuova famiglia di processori quad core ha adottato un design di tipo monolitico, posizionando tutti e quattro i core su un unico die, da alloggiare successivamente all'interno del processore.
Memory controller DDR3 integrato: Novità assoluta per i processori Intel. AMD introdusse questa tecnologia sin dal lontano 2003 con la famiglia Opteron, con tutti i benefici che ne conseguirono.
Ritorno alla tecnologia Hyper threading: Soluzione adottata da Intel nel lontano 2004 sui processori Pentium 4 della serie extreme edition, poi abbandonata con l'arrivo delle più performanti CPU Core 2 duo.
Introduzione del bus QPI: acronimo di Quick Path Interconnect, in sostituzione al classico front side bus o FSB. Questa tecnologia sarà adottata già, nelle prime versioni dei processori Core i7.
Istruzioni SSE4.1: Introdotte per la prima volta nella famiglia Penryn, queste istruzioni sono la diretta evoluzione delle precedenti SSE4.0.
Un'altra interessante soluzione adottata da Intel con le nuove CPU e, l'introduzione di un design modulare. Cosa significa?
I primi Core i7 integrano 731 milioni di transistor, costruiti su un processo produttivo di 45 nanomentri. Le successive evoluzioni, fermo restando che vanga sfruttato il design modulare, integreranno nuove funzionalità, tese ad aumentare le performance generali dell'architettura Nehalem.
Intel dal canto suo, ha già presentato, al IDF fall 2008, la serie Nehalem EX, CPU specificatamente dedicate ai sistemi server. Questa serie che, non vedrà la luce, prima dalla fine del 2009, integrarà al suo interno 8 core fisici.
Sempre all'IDF 2008 è stata presentata l'architettura che, dovrebbe concorrere direttamente con le soluzioni AMD Fusion. Vale a dire l'integrazione in alcune soluzioni Nehalem, di una GPU, che occuperebbe la fascia bassa del mercato. Questa soluzione vadrà la luce non prima del 2010.
Dopo aver descritto in generale la nuova architettura Nehalem, vediamo ora nel dettaglio le varie caratteristiche di quest'ultima.
Ci preme sottolineare che Intel ha lavorato molto, al fine di ottimizzare quanto già fatto di buono con i processori Core 2, cercando di eliminare quei colli di bottiglia che ne affliggevano le prestazioni.
Prima di tutto gli ingegneri hanno aggiunto il supporto Macro-ops in modalità 64 bit. Scelta giustificata per questa architettura che, non nasconde le sue ambizioni per il mercato server. L'utilizzo continuo delle Macro-ops è reso possibile grazie al maggior numero di istruzioni che l'architettura Nehalem è in grado di eseguire
Le CPU della famiglia Nehalem integrano un Execution Unit a 4 vie, capace, di eseguire 4 operazioni di Decode, Rename e Retire in un singolo ciclo di clock. Questa tecnologia, già presente nella precedente generazione Core 2, non è mai stata sfruttata a fondo a per via dal codice disponibile sul mercato. Per questo motivo Intel è intervenuta in Nehalam espandendo il più possibile i Buffers interni, allo scopo di incrementare i benefici di un'architettura basata sul parallelismo.
Un'altra interessante soluzione introdotta dalla precedente architettura (Conroe) e qui - in Nehalem - migliorata, è LSD acronimo di Loop Stream Director.
LSD non è altro che un buffer che immagazzina istruzioni, prossime all'esecuzione. Quando la CPU rileva un Loop (stessa istruzione ripetuta più volte), grazie al Loop stream Director, non è necessario effettuare un branch prediction o recuperare i dati dalla cache L1. In questo senso, possiamo dire che, LSD funge da memoria cache.
I guadagni che ne conseguono dall'utilizzo dell'LSD sono doppi: Da una parte troviamo un minor consumo energetico, in quanto non vengono eseguite operazioni inutili, dall'altra avremo un incremento prestazionale grazie alla riduzione della pressione, sulla cache L1.
Ulteriori miglioramenti sono stati apportati al Brench prediction (predizione di diramazioni - in italiano - compito svolto dalla CPU che, cerca di prevedere l'esito di un'operazione, basandosi sull'accettazione di un'istruzione).
Questi algoritmi sono di vitale importanza in architetture che necessitano di un alto livello di parallelismo.
Intel non fornisce molti dati riguardanti i nuovi predictor, ma si sa che sono composti da due livelli. Il primo è identico a quello utilizzato nei processori Core 2, mentre il secondo, con un accesso più lento, è ingrado di immagazzinare più informazioni storiche.
Intel tende a sottolineare come questa soluzione porti ad un incremento prestazionale con alcune applicazioni, che utilizzano un grosso volume di codice, come i database.
Il debutto delle CPU Core i7, vede il ritorno della tecnologia Simultaneous multi Threading, o meglio conosciuta come Hyper Threading. Questa soluzione introdotta nella serie Intel Pentium 4 - D Extreme edition di cui qui, trovate una descrizione dettagliata, è stata abbandonata con l'arrivo sul mercato delle più performanti CPU Core 2 duo e Quad.
Per quale motivo Intel ha reintrodotto questa tecnologia solamente ora, con l'arrivo dell'architettura Nehalem?
I motivi sono sostanzialmente due: In primis i nuovi processori Core i7 presentano per loro natura un'architettura molto ampia. Questa tecnologia trae beneficio direttamente dal Memory controller integrato. E come seconda cosa, i bassi costi di produzione che ne conseguono dall'adozione di questa soluzione.
La tecnologia Hyper Threading permette di avere a disposizione un numero doppio di core logici, rispetto a quelli presenti realmente all'interno del processore. Nel caso dei nuovi Core i7, con l'Hyper Threading attivato avremo a disposizione del sistema operativo ben otto core logici.
I benefici offerti da questa soluzione sono notevoli, soprattutto se utilizzata con applicazioni che operano su più core contemporaneamente.
Intel ha fornito solamente i dati di quelle applicazioni che, per loro natura sfruttano tutti i core presenti all'interno della CPU.
Come già scritto in precedenza, la tecnologià SMT trae beneficio direttamente dal Memory controller integrato. Cerchiamo di capire il perché...
Il controllo della memoria integrato all'interno del processore, soprattutto nell'implementazione triple channel, delle prime versioni delle CPU core i7, permette di avere a disposizione quel quantitativo di banda passante (bandwidth) delle memoria, di cui la tecnologia hyper-threding ha bisogno per operare al meglio.
È importante sottolineare come l'implementazione di più core fisici all'interno di un processore, comporti prestazioni nettamente superiori rispetto a soluzioni con SMT ingrato. In altre parole, CPU che adottano la tecnologia Hyper Threading non raggiungeranno mai le prestazioni di un processore con otto core nativi. Verò è però, che l'implementazione dell SMT per Intel risulta essere un'operazione abbastanza semplice e sopratutto "economica". Il numero ridotto di transistor utilizzato, uniti alla flessibilità di questa architettura, creano il connubio ideale tra prestazioni e costi di produzione.
Intel ha introdotto importanti novità per quanto riguarda la struttura della cache. Se per la generazione precedente, Penryn, veniva utilizzata una cache L1 per ciascun core e, una cache L2 suddivisa fra tutti i core, ora, con i nuovi Core i7 troviamo un cache L3, ovvero un terzo livello unificato fra i quattro core.
La cache L1 con una grandezza di 64kbytes, suddivisa in due blocchi da 32bytes, presenta tempi di latenza superiori rispetto a quanto accadeva nelle CPU Core 2, essendo passati da tre a quattro cicli di clock.
La cache L2 invece, differisce in modo sensibile da quella implementata nelle precedenti soluzioni. Non più unificata fra tutti i core, ma specifica per ognuno di essi. Nel specifico, troviamo una quantitativo pari a 256kbytes, con una latenza pari a 10 cicli di clock dal load, alla fuori uscita dei dati dalla cache.
La cache L3 introdotta per la prima volta su processori Intel, è di tipo unificato; Il suo quantitativo è pari a 8mbytes. Tutta via, la cache L3 potrebbe assomigliare alla cache L2 utilizzata nelle CPU Core 2 Quad. Analisi più approfondite però fanno sorgere una sostanziale differenza: nell'architettura Nehalem troviamo una cache L3 unificata tra tutti e quattro i core, mentre nei processori Core 2 quad la cache L2 era suddivisa in due blocchi da 6mbytes ciascuno, i quali venivano associati a una singola coppia di core.
Non a caso, nelle schede, che identificano le caratteristiche del processore (in questo caso CPU Core 2 Quad) è possibile trovare la quantità di cache L2 divisa per due (cache L2 = 6x2mbytes).
L'architettura della cache integrata in Nehalem, è di tipo inclusivo: Cosa significa? chiariamo questo concetto con un semplice esempio.
Nel momento in cui un dato, non è presente nella cache L3, l'architettura inclusiva, fa si che, il suddetto dato non risieda ne nella cache L1 ne tanto meno in quella L2. Di conseguenza la CPU andrà a recuperare quel dato mancante direttamente nel memory controller, evitando passaggi inutili (attraverso le varie cache) che, rallenterebbero il sistema.
L'ennesimo aspetto interessante, introdotto da Intel nella nuova architettura Nehalem, è senz'altro l'implementazione del memory controller all'interno delle CPU Core i7.
Dal canto suo, Intel segue quanto già effettuato dall'acerrimo rivale AMD. Questa soluzione infatti, fu per la prima volta adottata dalla multinazionale con sede a Sunnyvale, introducendo il memory controller all'interno delle CPU destinate al mercato Server.
Il memory controller scelto da Intel e, introdotto all'interno delle proprie CPU, è di tipo DDR3 a triplo canale, compatibile con i moduli DDR3 a 1066 MHz e DDR3 a 1333 MHz. Bandwidth massima teorica: 32 GB/s (gigabyte per secondo).
Le successive versioni dei processori Core i7, integreranno un memory controller a doppio canale (dual-channel). Scelta giustificata, al fine di ridurre i costi, considerando che questa architettura sarà destinata anche ai segmenti value del mercato informatico.
I vantaggi del memory controller integrato non si fermano di certo qui. Intel ha lavorato a finchè le prestazioni migliorassero anche in ambito server.
NUMA acronimo di non unifor memory acces, permetterà di accedere al memory controller di altri processori montati sulla stessa scheda madre. Ci riferiamo ovviamente a piattaforme di tipo multi - socket. L'accesso ai dati nel memory controller di un altro processore, avverà con un impatto prestazionale in termini di bandwidth e latenza. Il trade off potrà però, essere ridotto, grazie a future applicazioni specificatamente sviluppate per l'architettura NUMA.
Con la nuova architettura Nehalem, Intel introduce un nuovo bus di collegamento tra processore, chipset e memory controller. Stiamo parlando del nuovo QuickPath Interconnect, il sostituto della oramai vecchia architettura Front Side Bus, meglio conosciuta come FSB.
Con il nuovo bus di connessione, di tipo point to point si raggiungono velocità teoriche di 12.5 gbps. Il limite, sempre teorico, di trasferimento sui link bidirezionali è attestato intorno ai 25 gbps. In futuro Intel potrebbe incrementare la velocità di trasferimento dati tramite QPI, alzando le frequenze di trasmissione di quest'ultimo.
Come accaduto per i memory controller integrato, Intel segue un approccio molto simile a quello adottato da AMD con il suo bus di connessione denominato HyperTransport.
Data quindi la somiglianza fra le due tipologie di connessione, il bus QPI, rappresenterà per Intel un indubbio vantaggio unito alla nuova architettura Nehalem, soprattutto in ottica server.
All'interno dei nuovi processori Core i7, Intel ha introdotto un nuovo set di istruzioni appartenenti alla famiglia SSE. In Nehalem, queste istruzioni giungono alla versione 4.2..
Attualmente, non esistono applicazioni in grado di sfruttare le potenzialità offerte dalle nuove istruzioni.
Turbo Mode, questo è il nome scelto da Intel, per identificare quello che è di fatto un overclock dinamico della CPU.
Se con le precedenti architetture, bisognava agire da BIOS, per alzare le frequenze operative del processore, ora, con la nuova modalità, non sarà più necessario. Scopriamo perché.
Una simile tecnologià è già stata introdotta da Intel nelle CPU Core 2 Duo, per sistemi notebook. Sussistono però, alcune importanti differenze.
Nei processori Core 2 Duo, la tecnologià Turbo Mode interviene solamente quando, uno dei due core entra in modalità idle (carico minimo), mantenendo un TDP massimo, entro i limiti previsti di default. In questo caso, il processore può entrare nella modalità turbo mode solamente quando, uno dei due core si trova in modalità risparmio energetico.
Abbiamo visto come una "rudimentale" tecnologià turbo mode sia già presente all'interno della precedente architettura. In Nehalem la suddetta tecnologià è stata rivisitata totalmente: se un core risulta essere inattivo, viene attivata immediatamente la funzione di risparmio energetico, incrementando la frequenza di clock dei restanti core attivi. L'incremento della frequenza di clock avviene a seconda del carico di lavoro richiesto e delle condizioni di funzionamento della CPU. Se il valore TDP di un dato istante, è tale da permettere un incremento delle frequenze di clock, automaticamente il processore opererà in questa direzione.
Analizzando quindi, quanto scritto sopra, è possibile definire la tecnologia Turbo mode come una sorta di overclock in tempo reale.
La modalità Turbo Mode, può intervenire anche quando tutti i core presenti all'interno della CPU, sono utilizzati al 100%, sfruttando margini residui di dissipazione termica e contando su un TDP, che in quel particolare istante è inferiore al valore massimo definito di default, dalla casa produttrice.
Appare evidente, che utilizzare un ottimo sistema di dissipazione, non può che giovare, incrementando sempre più i margini d'intervento della tecnologià Turbo Mode.
Allo stato attuale, considerando i sistemi di raffreddamento odierni, la modalità Turbo Mode, può alzare le frequenze dei singoli core di una o due volte la frequenza di clock base del processore. Vale a dire che l'incremento delle frequenze operative della CPU, possono essere di 133mhz o 266mhz.
La modalità Turbo Mode, è comunque disattivabile tramite BIOS.
Intel ha introdotto una gestione del risparmio energetico molto sofisticata, per certi aspetti simile a quella adottata da AMD nelle proprie CPU Phenom.
PCU
Pcu acronimo di Power Controll Unit, è un sofisticato sistema di controllo, integrato all'interno delle CPU Nehalem, composto da circa un milione di transistor. Pcu integra al proprio interno un firmware, che monitorizza in tempo reale le temperature, i voltaggi e le frequenze di clock dei vari core, presenti all'interno del processore. Inoltre questo sistema di controllo, qualora fosse necessario, attiva o disattiva la funzione turbo memory, analizzata nella pagina precedente.
Intel ha dotato ogni core presente all'interno della CPU, di un proprio PLL. Questa soluzione permette un incremento della frequenza di clock individuale per ciascun core.
Questa tecnologia fu utilizzata per la prima volta da AMD con i processori della famiglia Phenom. Al pari della soluzione AMD, Intel ha deciso di far operare tutti i core allo stesso voltaggio di alimentazione, indipendentemente dalla potenza di calcolo richiesta ad ogni core. Per sopperire a questa mancanza, il colosso di Santa Clara, ha utilizzato un approccio differente da quello adottato da AMD e sulle sue stesse CPU Core 2 duo.
In Nehalem, ogni core può passare allo stato C6 (ovvero, quando il voltaggio di alimentazione viene ridotto al minimo), in modo indipendente, pur avendo un power plain condiviso. Inoltre quando il sistema operativo, esegue l'istruzione C6 per un core che ha ultimato il suo processo, interviene immediatamente la fase di risparmio energetico (idle), portando il voltaggio del core interessato, prossimo allo zero, esattamente come se ci fosse un power plain specifico per ogni core.
I benefici resi possibili grazie a questa tecnologia, saranno importanti per le prime CPU Nehalem per notebook, attese al debutto nel corso del 2009, insieme alla nuova piattaforma Centrino.
Le prime tre versioni dei processori Nehalem, hanno fatto il loro debutto, lunedì 17 novembre 2008. Le nuove CPU, come anticipato nelle pagine precedenti, saranno supportate da schede madri, con socket LGA 1366, alle quali andranno aggiunti moduli di memoria DDR3 di tipo triple channel.
I primi modelli presentati dal produttore californiano, occuperanno la fascia medio - alta del mercato delle CPU, spodestando dal trono le attuali soluzioni Core 2 duo Quad Q9550/9770, anche se non si prevede per quest'ultimi, una rapida uscita di scena, per via dei prezzi elevati, che presentano le nuove soluzioni Core i7.
I modelli attualmente disponibili presentano tutte le caratteristiche analizzate, fatta eccezione per alcuni modelli destinati al mercato server. Stiamo parlando ovviamente dei processori della famiglia Xeon.
Processori destinati al segmento desktop:
I modelli 920 e 940 presentano le stesse caratteristiche tecniche, fatta eccezione per la frequenza di clock. Differenze sostanziali si notano invece con il modello top di gamma della famiglia Nehalem, ovvero il Core i7 945 Extreme. Quest'ultimo vede incrementata la frequenza di clok fino a 3.2 GHz, mentre il bus QPI raggiunge i 6.4 gigatransfert/secondo. Ultimo elemento di rielievo per il 965 Extreme, è sicuramente l'Overspeed protection disabilitata.
A partire dal secondo trimestre 2009, i modelli 965 Extreme e 940, saranno sostituiti dai nuovi 975 Extreme e 950.
Il primo sarà caratterizzato da una frequnza di clock pari a 3.33 GHz, contro i 3.2 GHz del modello attuale. Il secondo presenterà una frequenza operativa di circa 3.06 GHz, contro i 2.83 GHz del modello 940. Il più piccolo della famiglia, 920, non verrà per ora sostituito.
I modelli della nuova serie, compreso il 920, saranno accomunati dell'utilizzo dello stepping D0. Questa ottimizzazione dovrebbe consentire margini di overclok più elevati, oltre a una probabile diminuzione delle temperature.
Per quanto riguarda i processori Xeon basati su architettura nehalem, trovate l'elenco completo in questo articolo redatto da X-bit Labs.
L'attenta analisi delle nuova architettura Nehalem, trascritta in questo articolo, evidenza come Intel sia riuscita ancora una volta a stupire il grande pubblico, con le prestazioni strabilianti dei sui processori.
Anche se il divario con la precedente generazione di processori non è così netto, Intel conserva il vantaggio acquisito sulla concorrenza nel lontano 2006, anno in cui fecero il loro debutto le prime CPU Core 2, all'epoca chiamate a raccogliere una pesante eredità lasciata dai processori della famiglia Pentium 4.
L'architettura Nehalem, non può essere considerata come rivoluzionaria, in quanto molte delle tecnologie sviluppate in passato da Intel sono state implementate nei nuovi processori Core i7. Inoltre il processo produttivo utilizzato per la costruzione di CPU della famiglia Penryn, è lo stesso utilizzato dei processori basati su architettura Nehalem. Quest'ultimo fattore la dice lunga sulla filosofia di costruzione del colosso di Santa Clara.
Un altro aspetto molto interessante alla quale Intel tiene molto, per la progettazione di future architetture, riguarda il rapporto prestazioni - consumi.
Durante la fase di progettazione della nuova architettura, il team di sviluppo, poteva implementare nuove funzionalità a patto che queste ultime, mantenessero un rapporto consumi-prestazioni di 1: 2.
Nel corso dei prossimi mesi Intel presenterà nuove soluzioni basate sull'architettura analizzata nelle pagine precedenti, a partire dalle CPU destinate al segmento notebook. Per tanto questo articolo sarà con tutta probabilità soggetto ad aggiornamenti, qualora fossero necessari.
MegaLab.it rispetta la tua privacy. Per esercitare i tuoi diritti scrivi a: privacy@megalab.it .
Copyright 2008 MegaLab.it - Tutti i diritti sono riservati