Intel Quick Sync - ile daje w praktyce? Porównanie z Nvidia CUDA

Strona głównaIntel Quick Sync - ile daje w praktyce? Porównanie z Nvidia CUDA
01.07.2011 20:00
Intel Quick Sync vs CUDA vs CPU - co najlepsze? (fot. Intel, Nvidia, DreamPearl)
Intel Quick Sync vs CUDA vs CPU - co najlepsze? (fot. Intel, Nvidia, DreamPearl)
Jacek Klimkowicz
Jacek Klimkowicz

Quick Sync - według specjalistów od marketingu technologia dająca niesamowite przyspieszenie podczas konwersji wideo, zdaniem sceptyków chwyt marketingowy mający zwiększyć popyt na nowe CPU. Jak jest naprawdę? Czas się przekonać. Do akcji wkraczają procesory Intel Core dwóch generacji, karty graficzne GeForce i darmowy, ogólnodostępny soft.

Quick Sync - według specjalistów od marketingu technologia dająca niesamowite przyspieszenie podczas konwersji wideo, zdaniem sceptyków chwyt marketingowy mający zwiększyć popyt na nowe CPU. Jak jest naprawdę? Czas się przekonać. Do akcji wkraczają procesory Intel Core dwóch generacji, karty graficzne GeForce i darmowy, ogólnodostępny soft.

Ludzie bawią się multimediami - przyspieszmy to!

Intel, jako lider w wielu dziedzinach bacznie obserwuje rynkowe trendy. Gdy zlecone przez Chipzillę badania wykazały, że statystyczny użytkownik PC coraz więcej czasu spędza na edycji filmów, którymi później dzieli się ze znajomymi, inżynierowie natychmiast podjęli stosowne kroki w celu przyspieszenia tej jakże czasochłonnej, obciążającej komputer czynności.

Implementacja Quick Sync w Intel Core drugiej generacji
Implementacja Quick Sync w Intel Core drugiej generacji

W jednostkach opartych na mikroarchitekturze Sandy Bridge zaimplementowano obsługę instrukcji wektorowych (AVX) oraz dedykowany, sprzętowy układ wspomagający konwersję multimediów. Dotychczas aby skorzystać z akceleracji przy transkodowaniu wideo trzeba było posiadać kartę graficzną obsługującą technologię CUDA (Nvidia) lub APP/Stream (AMD).

Teraz (przynajmniej w teorii) wystarczy mieć procesor Intel Core drugiej generacji z na pozór słabowitym, zintegrowanym GPU Intel HD Graphics. Jak wypada rozwiązanie Intela na tle rynkowej konkurencji? Czas to sprawdzić.

Bohaterowie testu - konfiguracje i oprogramowanie

W celu zweryfikowania obietnic giganta z Santa Clara zaopatrzyłem się w darmowego MediaCodera 2011 R6 (0.8.1 build 5166) w wersji 64-bitowej, umożliwiającego konwersję multimediów z użyciem wielu rdzeni procesora, technologii Nvidia CUDA i Quick Synca oraz syntetyczny benchmark SiSoftware Sandra 2011 Lite SP3. Test przeprowadziłem na laptopach:

  • Intel Core i7-720QM (4C/8T, 1,60 GHz, do 2,8 GHz z TB, HT, 6 MB L3C);
  • 8 GB DDR3-1066 CL7;
  • Nvidia GeForce GT 330M (1 GB GDDR3, rdzeń 500 MHz, shadery 1210 MHz, pamięć 790 MHz; ForceWare 275.33);
  • Seagate Momentus XT 500 GB (4 GB SSD SLC + 500 GB HDD 7200 RPM);
  • Windows 7 Professional 64-bit.

[/list]

  • Intel Core i5-2410M (2C/4T, 2,3 GHz, do 2,9 GHz z TB 2.0, HT, 3 MB L3C);
  • 4 GB DDR3-1333 CL9;
  • Intel HD Graphics 3000 (sterowniki 8.15.10.2291)
  • Nvidia GeForce GT 540M (1 GB GDDR3, rdzeń 672 MHz, shadery 1344 MHz, pamięć 900 MHz; ForceWare 267.44)
  • Seagate Momentus XT 500 GB (4 GB SSD SLC + 500 GB HDD 7200 RPM);
  • Windows 7 Home Premium 64-bit.

[/list]

W teście praktycznym użyłem pliku wejściowego w postaci filmu Big Buck Bunny (720p@24p, MPEG2@4 Mbps, AAC@144 kbps).

Gotowi, do startu, start!

SiSoftware Sandra 2011 Lite SP3 - Media Transcode (HD TV)

Na pierwszy ogień poszedł syntetyk. Rezultaty uzyskane w teście Media Transcode (HD TV) przez procesor Intel Core i5-2410M wspomagany HD Graphicsem 3000 zwalają z nóg - jest blisko 9-krotnie szybciej niż w przypadku samego procesora! Jednocześnie Nvidia CUDA wypada tutaj blado. Nie dość, że nie przyspiesza, to jeszcze spowalnia.

W
W

Przewaga iście miażdżąca, ale uzyskana w benchmarku. A jak wiemy testy syntetyczne mają to do siebie, że wcale nie muszą przystawać do rzeczywistości. W związku z tym przeprowadziłem testy rzeczywiste - w ruch poszedł MediaCoder.

MediaCoder 2011 R6 x64 - runda 1: MPEG2 + AAC -> H.264 + MP3

W pierwszym podejściu sprawdziłem jak testowane konfiguracje radzą sobie z konwersją wejściowego wideo (o którym mowa w 2. akapicie) na plik w formacie MP4 o rozdzielczości 800 x 480 pikseli (framerate 24p, H.264@1 Mbps, MP3@128 kbps). Czasy (w sekundach) potrzebne na przekonwertowanie klipu o długości 9 minut i 56 sekund są następujące:

W2
W2

Jak widać całkiem mocne, dedykowane karty graficzne Nvidia GeForce, ze znacznie większą liczbą rdzeni i własną pamięcią musiały uznać wyższość zaszytego w CPU Intel Core i5 drugiej generacji układu. Oczywiście ogólny wzrost wydajności przetwarzania względem samego procesora nie jest tak spektakularny jak w benchmarku, ale i tak jest ogromny.

Bez akceleracji sprzętowej z każdego CPU wyciskane są siódme poty...
Bez akceleracji sprzętowej z każdego CPU wyciskane są siódme poty...

Ciekawie prezentuje się również użycie procesora podczas korzystania z akceleracji sprzętowej i bez niej. Przy konwersji realizowanej programowo zajętość rdzeni w obu przypadkach jest bliska 100%, co uniemożliwia wykonywanie innych zadań. Gdy do akcji wkraczają GPU, robi się zdecydowanie szybciej, a obciążenie CPU zauważalnie spada. Quick Sync nieco lepiej radzi sobie z odciążeniem jednostki centralnej.

CUDA i Quick Sync zauważalnie zmniejszają obciążenie CPU
CUDA i Quick Sync zauważalnie zmniejszają obciążenie CPU

Test dowiódł również, że postęp między kolejnymi generacjami procesorów Intela jest ogromny. Oto dwurdzeniowy, najsłabszy Intel Core i5 wyprzedza 4-rdzeniowego Intela Core i7. Jak widać tempo rozwoju jest coraz większe i coraz taniej możemy kupić sprzęt o zadowalających nas osiągach.

MediaCoder 2011 R6 x64 - runda 2: MPEG2 + AAC -> WMV + WMA

W drugiej rundzie zmieniłem format pliku na lansowany niegdyś przez Microsoft. Tym razem nie skalowałem klipu w dół. W rezultacie miał powstać plik WMV (WMV@ 1 Mbps, WMA@ 128 kbps, framerate 24p). Tym razem wszystkie próby zajęły zdecydowanie więcej czasu.

W3
W3

Jak widać tu również góruje Quick Sync, choć jego przewaga nad CUDA nie jest tak duża, jak by się chciało. Mimo wszystko boost względem samego CPU jest bardzo duży. Procesor bez wsparcia potrzebuje na wykonanie tego samego zadania ponad dwukrotnie więcej czasu. Jest to zysk wydajności, obok którego nie można przejść obojętnie.

Zajętość rdzeni w tej próbie przedstawiała się podobnie. Bez akceleracji sprzętowej użycie było bliskie 100%, z akceleracją znacznie niższe. Tym razem również (w mojej subiektywnej ocenie) Quick Sync nieco lepiej odciążał jednostkę centralną. Tak jak poprzednio dwurdzeniowy Intel Core i5 drugiej generacji okazał się nieco szybszy niż czterordzeniowy Intel Core i7 z pierwszej serii Core.

Quick Sync daje radę, ale...

Owszem, Quick Sync to zdaje się udana technologia. Przy pracy z popularnymi formatami wideo daje znakomite rezultaty. Podczas konwersji spokojnie można pracować na komputerze, a jej czas jest zauważalnie krótszy. Co ważne ten "ficzer" mają wszystkie procesory Intel Core drugiej generacji,więc nawet na tanich laptopach z Core i3-2310M bez dedykowanej karty graficznej można cieszyć się świetną wydajnością.

Darmowy MediaCoder potrafi sporo wykrzesać ze sprzętu
Darmowy MediaCoder potrafi sporo wykrzesać ze sprzętu

Do tego Intel aktywnie wspiera twórców oprogramowania, więc dynamicznie rośnie liczba aplikacji potrafiących wykorzystać potencjał procesorów opartych na mikroarchitekturze Sandy Bridge. Jest więc mnóstwo programów, zarówno płatnych, jak i bezpłatnych. Jeden z nich wykorzystałem do testów i muszę przyznać, że daje radę.

...nie ma róży bez kolców.

Aby móc korzystać z Quick Synca trzeba mieć laptop z samą integrą, bądź z systemem umożliwiającym przełączenie między grafiką dedykowaną i zintegrowaną (czyli z Optimusem Nvidii lub Switchable Graphicsem AMD). Gdy HD Graphics jest trwale deaktywowany można zapomnieć o turbo przy zabawie z wideo. Można więc powiedzieć, że problem dotyczy nielicznych modeli, ale jednak jest.

Podobnie rzecz się ma w przypadku desktopów z chipsetami P67 - na nich Quick Sync nie działa. Z układami logiki H67/61 też są problemy, gdy korzysta się z dedykowanej karty i do niej podłącza monitor. Wtedy również technologia Intela nie działa. Do tego wydajność Quick Synca jest mocno uzależniona od wsparcia dla formatu wejściowego i wyjściowego.

Obecnie w pełni wspierane są MPEG2, VC1 i AVC. Chyba, że coś pominąłem, za co z góry przepraszam. Ten zestaw wystarcza to do przekonwertowania wideo z DVD do formatu wymaganego przez iPada czy Youtube'a. Cóż, nie można mieć wszystkiego. Na szczęście instrukcje wektorowe AVX dają solidny zastrzyk mocy i nawet bez Quick Synca znacznie przyspieszają proces transkodowania.

Co na to konkurencja?

Jak na razie nie ma żadnych sygnałów, aby konkurent Intela (AMD) pracował nad alternatywną technologią. A przydałaby się, bo nowe APU Llano mają co prawda wydajne GPU, ale we wszelkich testach CPU wypadają słabo. Nvidia również zajmuje się promocją technologii CUDA i nie kwapi się do implementacji w swoich kartach czegokolwiek, co mogłoby dodatkowo usprawnić transkodowanie wideo. W przypadku grafik AMD jest podobnie.

Wygląda na to, że Quick Sync na razie nie ma konkurencji. A technologia w sama w sobie jest ciekawa i użyteczna. Gdyby tylko jej wykorzystanie było mniej kłopotliwe od strony sprzętowej, a liczba wspieranych formatów większa, to byłby prawdziwy hit. Jednak mimo tych niedociągnięć Intelowi należy się duży plus za dobrą koncepcję. Warto mieć CPU z Quick Sync.

Zobacz także:

The best of Adrian Chmielarz [wideo i galeria]
The best of Adrian Chmielarz [wideo i galeria]
Udostępnij:
Komentarze (0)