Procesory Intel Core trzeciej generacji – co wnoszą?

Strona głównaProcesory Intel Core trzeciej generacji – co wnoszą?
27.04.2012 23:59
Ivy Bridge, czyli Intel Core 3. generacji
Ivy Bridge, czyli Intel Core 3. generacji
Jacek Klimkowicz
Jacek Klimkowicz

Na kolejny "tick" w technologicznym zegarku Intela trzeba było poczekać dłużej niż zwykle. Tym razem jednak zmiany nie ograniczają się do niższego procesu litograficznego, jak miało to miejsce w ubiegłych latach. Co wnoszą nowe jednostki centralne i jakie to ma znaczenie dla użytkowników PC?

Tranzystory i litografia, zarządzanie energią, zmiany w mikroarchitekturze rdzeni22 nm i tranzystory 3-D Tri-Gate – wyższa wydajność, lepsza efektywność

Tranzystory 3-D - rewolucja nadejdzie wraz z Ivy Bridge! (fot. MaximumPC.com)
Tranzystory 3-D - rewolucja nadejdzie wraz z Ivy Bridge! (fot. MaximumPC.com)

Otóż tranzystor to podstawowy element budulcowy każdego współczesnego procesora. Wpływa on zarówno na ilość energii pobieraną przez CPU, jak i na jego wydajność. Generalnie, w dużym uproszczeniu, dąży się do tego, by tranzystor przewodził jak najwięcej prądu gdy jest w stanie aktywnym (przewodzenia), jak najmniej w pasywnym (blokady) i jak najszybciej przełączał się między tymi dwoma stanami.

Inżynierowie zatem dwoją się i troją by poprawić te trzy parametry tranzystorów. Niestety, zmniejszenie procesu litograficznego ma dobre i złe strony. Niższy wymiar pozwala na upakowanie większej liczby tranzystorów na jednostce powierzchni i ograniczenie generowanych przez nie strat energii (upływności) w stanie nieaktywnym, dzięki czemu układ, przynajmniej w teorii, powinien być bardziej energooszczędny.

Ivy Bridge - organizacja chipu
Ivy Bridge - organizacja chipu

Jednocześnie węższy kanał przewodzenia ma niższą przepustowość i aby przetransportować taki sam ładunek w jednostce czasu trzeba podnieść napięcie. Wraz z pogorszeniem przewodności wydłuża się czas przełączania tranzystora między stanami. W rezultacie mniej taktów zegara może następować po sobie, przez co maksymalna, stabilna częstotliwość pracy procesora najzwyczajniej w świecie jest niższa.

Do czego zmierzam? Otóż przejście z 32-nm do 22-nm procesu litograficznego na tranzystorach planarnych nie przyniosłoby zbyt wielu korzyści. Niezbędne zatem było opracowanie nowych tranzystorów, które zachowałyby swoją przepustowość i szybkość reakcji mimo niższego wymiaru technologicznego. Intel stanął na wysokości zadania i wdrożył na masową skalę tranzystory 3-D Tri-Gate, realizując koncepcję FinFET.

Transistor Gate Delay
Transistor Gate Delay

Dzięki pionowym, otoczonym z trzech stron bramkami "żebrom" zwiększyła się wydajność prądowa tranzystora w trakcie pracy, zmniejszyła się upływność prądu do podłoża w stanie nieaktywnym, a szybkość przełączania wzrosła, i to znacznie. Przy niskich napięciach 22-nm tranzystory 3-D Tri-Gate są nawet o 37% szybsze niż 32-nm planarne (taka sama prędkość jest osiągana przy napięciu o 0,2 V niższym!).

Poprawiono więc wszystkie kluczowe charakterystyki tranzystorów i jednocześnie zyskano możliwość większego ich upakowania oraz obniżenia napięcia zasilającego. Przełożyło się to na zmniejszenie powierzchni rdzenia z 216 mm[sup]2[/sup] do 160 mm[sup]2[/sup], czyli o ponad 25% i jednoczesne zwiększenie liczby tranzystorów o ponad 20%, z 1,16 mld do 1,4 mld.

W rezultacie procesory Intel Core 3. generacji mogą pracować z wyższymi częstotliwościami (w przypadku mobilnych CPU faktycznie zegary poszły w górę), pobierać mniej energii (testy dowiodły, iż rzeczywiście są bardziej energooszczędne) i być bardziej rozbudowane (nowy rdzeń graficzny jest dużo większy, a i tak powierzchnia chipu jest mniejsza).

Konfigurowalne TDP, PAIR, LPM i inne, czyli o zarządzaniu energią…

Energooszczędność procesorów Intel Core 3. generacji bierze się nie tylko z zastosowania 22-nm tranzystorów 3-D Tri-Gate, ale i licznych usprawnień. Na przykład, zaimplementowano technologię PAIR (Power Aware Interrupt Routing). W zależności od aktualnych priorytetów (wydajność lub energooszczędność) wybierany jest najlepszy rdzeń do obsługi danego przerwania.

Gdy preferowana jest wysoka wydajność (np. poprzez wybranie stosownego schematu zasilania) ważne przerwania (np. karty dźwiękowej) są obsługiwane przez najmniej zajęty rdzeń, np. będący w stanie uśpienia, co wiąże się ze wzrostem zapotrzebowania na energię. Natomiast gdy kluczowy jest jak najniższy pobór energii, przerwania kierowane są do jednego z aktywnych rdzeni, aby nie wybudzać tych będących w stanie uśpienia (np. C6).

cTDP i LPM
cTDP i LPM

Oczywiście mechanizm PAIR realizowany w całości na poziomie sprzętowym. Innymi funkcjami obsługiwanymi przez procesory Intel Core 3. generacji są konfigurowalne TDP i tryb Low Power Mode. Ten ostatni odpowiada za określenie najniższego, aktywnego stanu energetycznego dla elementu. Konfigurowalne TDP pozwala natomiast, w zależności od potrzeb, na ustalenie różnych poziomów TDP dla chipu.

Ma to duże znaczenie w przypadku komputerów przenośnych. Gdy zapotrzebowanie na moc obliczeniową jest duże, a układ chłodzenia dysponuje rezerwą cieplną, TDP może wzrosnąć powyżej nominalnego (np. z 17 W do 25 W w przypadku chipów ULV), a wraz z nim wydajność. Natomiast gdy priorytetem jest długi czas pracy na akumulatorze, może ono zostać obniżone (np. z 17 W do 14 W), kosztem wydajności.

Procesory Intel Core 3. generacji mają także więcej stref, którym w razie potrzeby można odciąć zasilanie (dodano m.in. jednostki wykonawcze GPU). Wzrosła też liczba poziomów napięć dla poszczególnych stanów energetycznych do kilkunastu z 2-3. Dodano też obsługę niskonapięciowych (1,35 V) modułów DDR3L i wbudowane bramkowanie zasilania (EPG – Embedded Power Gating) dla pamięci, co powinno dodatkowo obniżyć pobór energii.

Zmiany w mikroarchitekturze rdzeni – taki "tick" z elementami "tocka"

Sporo poprawek Intel poczynił także w mikroarchitekturze rdzeni x86. Zmienił się zestaw instrukcji ISA (Instruction Set Architecture), a struktury, takie jak np. kolejki DSB czy bufory mogą być dynamicznie współdzielone przez wątki – nie obowiązuje już statyczny podział, jak to ma miejsce w Sandy Bridge, gdzie część zasobów była nieużywana podczas przetwarzania jednowątkowego.

Optymalizacje przyczyniły się też do dwukrotnego przyspieszenia operacji dzielenia, zarówno liczb stało- jak i zmiennoprzecinkowych. Będąc przy tych ostatnich warto wspomnieć, że zaimplementowano nowe rozkazy przyspieszające proces konwersji 16-bitowych liczb zmiennoprzecinkowych na 32-bitowe pojedynczej precyzji i odwrotnie. Dodano 4 nowe instrukcje związane z lokalną pamięcią wątków, pozwalające na szybki odczyt i zapis do rejestrów FS i GS z poziomu kodu użytkownika.

Poprawiono także szybkość operowania na ciągach danych i wykonywania instrukcji wektorowych AVX. Dorzucono też strukturę, która zajmuje się procesem kopiowania danych między rejestrami procesora, odciążając w ten sposób jednostki wykonawcze, co w skrajnych przypadkach może zaowocować nawet 5% wzrostem wydajności.

Secure Key i OS Guard, nowe IGP, inne usprawnienia i podsumowanieIntel Secure Key i OS Guard – wyższy poziom bezpieczeństwa

DRNG
DRNG

Dostęp do DRNG daje instrukcja RDRAND, która jest dostępna bez względu na wszystko i zwraca losową liczbę (16-, 32- lub 64-bitową) do stosownego rejestru. Intel OS Guard to nazwa dla trybu SMEP (Supervisory Mode Execute Prevention), który ma zapobiegać atakom polegającym eskalacji przywilejów.

SMEP
SMEP

Programy uruchomione przez użytkownika mają stosowną flagę. Tym samym strony pamięci oznaczone jako należące do użytkownika nie mogą zostać wykonane z najwyższymi dostępnymi uprawnieniami, co utrudnia przejęcie kontroli nad systemem przez złośliwe oprogramowanie lub atakujących.

Intel HD Graphics 4000 i 2500 – nowe GPU

Jak nietrudno się domyślić trzecia generacja procesorów Intel Core debiutuje wraz z nowymi układami graficznymi. Nowe, zintegrowane GPU obsługują API DirectX 11 i OpenGL 3.1, a także OpenCL 1.1 (GPGPU). W związku z tym jednostki uległy gruntownej przebudowie i zostały poddane licznym optymalizacjom. Poprawiono wydajność geometryczną, dorzucono 2 programowalne etapy cieniowania (Hull Shader oraz Domain Shader).

Doszedł teselator o stałej funkcji i pojawiła się obsługa nowego formatu skompresowanych tekstur (BC6H7). Wzrosła jakość i szybkość filtrowania anizotropowego, poprawiono także osiągi i zwiększono funkcjonalność jednostek wykonawczych, dodając m.in. obsługę instrukcji UAV i atomowych, operacji barierowych czy równoległości danych. Wzrosła też przepustowość samplerów mediów i szybkość działania kodera multimediów.

Porównanie GPU z Ivy Bridge i Sandy Bridge
Porównanie GPU z Ivy Bridge i Sandy Bridge

Operacje Scatter & Gather są wykonywane nawet 32-krotnie szybciej niż w Sandy Bridge, a do niewielkiej, specyficznej części pamięci L3 IGP może uzyskać dostęp bez potrzeby angażowania magistrali pierścieniowej.

W związku z tym układ HD Graphics 2500, montowany w słabszych procesorach desktopowych, mimo takiej samej liczby jednostek wykonawczych jak w przypadku HD 2000, oferuje ok. 10-20% wyższą wydajność i większą funkcjonalność. Zintegrowany HD Graphics 4000 z 16 jednostkami wykonawczymi jest natomiast średnio o 50-60%, a niekiedy nawet 100% wydajniejszy niż HD Graphics 3000 z 12 EU.

Lepszy IGP mają desktopowe Core i7 oraz chipy z serii "K" oraz wszystkie układy mobilne. W przeciwieństwie do HD Graphicsa 2500 obsługuje sprzętowe przyspieszanie odtwarzania multimediów w rozdzielczościach 4K HD (4096 x 2304) oraz Quad HD (3840 x 2160). Nowe integry potrafią także wyświetlać obraz na 3 ekranach, ale to raczej ciekawostka, gdyż wykorzystanie tej funkcjonalności jest problematyczne.

Intel Wireless Display 3.0
Intel Wireless Display 3.0

Jako, że obsługiwane są tak naprawdę tylko 2 współdzielone strumienie wideo, nie ma mowy o dowolności w doborze złącz i rozdzielczości. Problemów nie sprawia natomiast technologia Wireless Display 3.0, która teraz korzysta z dwóch anten i strumieni, dzięki czemu możliwa jest transmisja multimediów w 1080p w lepszej jakości i z mniejszymi opóźnieniami niż w przypadku WiDi 2.1 implementowanym w Sandy Bridge.

Wraz z 3. generacją procesorów Intel Core zadebiutowała też technologia Intel Quick Sync 2.0. Nowa wersja pozwala na jeszcze szybszą konwersję multimediów (nawet 2-krotnie), a do tego jakość obrazu w plikach wynikowych jest zauważalnie wyższa. Krótko mówiąc nowe IGP są znacznie lepsze od poprzedników i w zasadzie stawiają pod znakiem zapytania sens inwestowania w dedykowaną kartę graficzną z przedziału do 300 zł.

Inne usprawnienia w procesorach Intel Core 3. generacji

Oczywiście w procesorach Ivy Bridge pojawiły się jeszcze inne udoskonalenia. W chipach przeznaczonych dla overclockerów podniesiono maksymalne mnożniki z 57x do 63x dla procesora i z 57x do 60x dla GPU. Dodano też obsługę profili XMP (Extreme Memory Profile) w najnowszej wersji (1.3), a maksymalna częstotliwość taktowania pamięci RAM wzrosła do 2800 MHz. Pojawił się także nowy krok 200 MHz obok znanego z Sandy Bridge 266 MHz.

Zintegrowany, dwukanałowy kontroler pamięci obsługuje w standardzie moduły DDR3 taktowane zegarem 1600 MHz. Doszła też natywna obsługa magistrali PCI-Express 3.0. Optymalizacjom zostały poddane również magistrala pierścieniowa (ang. Ring Bus), zapewniająca komunikację między poszczególnymi składowymi procesora i pamięć podręczna 3. poziomu (L3 cache).

Podsumowanie

Jak widać procesory Intel Core 3. generacji to nie tylko nowy proces litograficzny, ale i szereg usprawnień poczynionych w ramach zaprezentowanej rok temu mikroarchitektury Sandy Bridge. Doszły nowe funkcje, poczyniono wiele usprawnień i dorzucono nowe GPU, wychodząc poza klasyczny "tick". W rezultacie wzrosła wydajność (do ~15% w przypadku CPU i nawet 100% dla GPU), znacząco spadł pobór energii i została poszerzona funkcjonalność.

Oceń jakość naszego artykułuTwoja opinia pozwala nam tworzyć lepsze treści.
Udostępnij:
Wybrane dla Ciebie
Komentarze (0)