Skocz do zawartości
Atak_Snajpera

FlopsCPU - klasyczny benchmark z 1992 roku w nowej oprawie

Rekomendowane odpowiedzi

Napisano (edytowane)

eHvjYY.pngTv6Kbs.png

 

Trochę z nudów postanowiłem odkopać zapomniany przez chyba wszystkich pewien klasyczny benchmark zwący się flops.c. W związku z tym że benchmark jest programem konsolowym dla wygody użytkownika całość opakowałem w prosty graficzny interface. Wyniki w GUI pochodzą z sekcji MFLOPS(4) czyli z tych gdzie nie ma żadnych dzieleń. Flops.c skompilowałem w Visual Studio przy pomocy Intel Compiler XE v15.0 w trzech wersjach. Każda z trzech wersji używa innych instrukcji. Od zwykłych rozkazów x87 po jednostki typu SIMD.

 

Benchmark potrafi bardzo dobrze pokazać różnice w efektywności danej architektury. Dobrze to widać na powyższych wynikach gdzie Core 2 Quad podkręcony do 2,8 Ghz jest wyraźnie wolniejszy w pojedynczym wątku od architektury Sandy Bridge przy rzeczywistym taktowaniu 3,3 GHz (efekt działania Turbo Boost). W przypadku Sandy Bridge i instrukcji x87 możemy mówić o 1 Flop/Hz podczas gdy w Core 2 Quad jest to tylko ~0,77 Flop/Hz.

 

[DOWNLOAD]

 

Uwagi:

1) Częstotliwość CPU może nie być poprawnie wykrywana w przypadku podkręconych CPU.

2) Podczas testu Multi core nie będzie można nic robić ponieważ benchmark jest ustawiony na wysoki priorytet.

3) Niektóre AntiVirki mogą fałszywie się pluć na .exe'ki skompresowane UPX'em. https://www.virustotal.com/en/file/c7e593000974813945b32330f599172259fbfdf350920b3833b15015ae0e3e82/analysis/

 

Flops-CPUv2.png

Edytowane przez Atak_Snajpera

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
Napisano (edytowane)

3UyYWs8.jpg

 

btw. Microsoft poprosił mnie bym przesłał plik z benchmarkiem do nich.

Keylogger. Lost my virginity.

 

edit: Proc stock (3,2). Toteż boost @ 3,5GHz.

Edytowane przez smilehunter

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
Napisano (edytowane)

Kręciłeś procek? Jeśli tak to proszę również podać rzeczywistą częstotliwość ponieważ wykrywanie MHz po podkręceniu to jest koszmar.

Edytowane przez Atak_Snajpera

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
Napisano (edytowane)
edit: Proc stock (3,2). Toteż boost @ 3,5GHz.

No to widzę że nowa architektura SkyLake jednak daje rade :) Widać że inżynierowie z Intela jednak nie próżnowali. ;)

 

btw. Microsoft poprosił mnie bym przesłał plik z benchmarkiem do nich.

Keylogger. Lost my virginity.

To jest standard że jak kompresuje .exeki UPX'em to zawsze się jakiś fałszywy alarm pojawia. Szkoda gadać...

 

https://www.virustotal.com/en/file/c7e593000974813945b32330f599172259fbfdf350920b3833b15015ae0e3e82/analysis/

Edytowane przez Atak_Snajpera

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

;)

Przesiadłem się z i5-3340 (ivy) - W benchmarkach różnica jest, a w codziennym użytkowaniu jakoś ich nie widać.

 

Czekam na wynik i5tek hasawella 4460. Ivy & Sandy @ 3,2GHz również.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
Napisano (edytowane)

Przydałyby się również wyniki AMD FX'ów.

Edytowane przez Atak_Snajpera

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Planujesz w przyszłości dodać pozostałe rodzaje testów (z FDIV), czy na tym jednym planujesz zakończyć ?

Jak wygląda sprawa na prockach FX od AMD (nie potrzebują one własnej ścieżki z skompilowanej pod AMD) ?

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
Napisano (edytowane)

Planujesz w przyszłości dodać pozostałe rodzaje testów (z FDIV), czy na tym jednym planujesz zakończyć ?

Jak wygląda sprawa na prockach FX od AMD (nie potrzebują one własnej ścieżki z skompilowanej pod AMD) ?

 

Generalnie FDIV'ów się unika w obliczeniach jak ognia ze względu na znaczne spowolnienie w kodzie. Kompilatory jeśli to możliwe automatycznie zmieniają dzielenie na mnożenie np. a = b / 2 zmienione jest z automatu na a = b * 0.5.

 

Benchmark został skompilowany pod architekturę a nie pod specyficzny procesor Intela. Ta opcja jest ustawiona na NONE

aXOBFr.png

 

Sądzę że FX'y mogą słabo tu wypaść ze względu na to że mają 2 jednostki AVX-128 na moduł zaś intel o ile dobrze pamiętam ma 2 jednostki AVX-256 na rdzeń z czego jedna odpowiada za FADD o druga za FMUL.

Edytowane przez Atak_Snajpera

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
Napisano (edytowane)

Dzięki za wynik! Niestety jest tak jak podejrzewałem. 2xAVX128 w FX'ach nie ma startu do 2xAVX256 u Intela. Może to po części tłumaczyć dlaczego FX'y gorzej wypadają w grach. ~0.82 Flop/Hz w zwykłym x87 to jest prawie poziom architektury Core 2 Quad (~0,78 Flop/Hz). No cóż trzymam kciuki za ZEN'a!

Edytowane przez Atak_Snajpera

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

bugreport: program nie działa poprawnie jeżeli w ścieżce jest polski znak (win8/win10 przy kontach podpiętych do konta live często tworzą w users folder z imieniem)

 

Wyniki paru moich złomków:

atom.pngwindsor.png3227u.pngxeon.png

 

A teraz bonus, który kompletnie pogrąża FX'y [:|]

x6stock.pngx6_4ghz.png

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Trzeba było Thubana/Deneba przenieść w 32nm, zaktualizować instrukcje i dokręcić zegar.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Tyle że na FX we wszystko spokojnie pograsz, na denebach i innych już niekoniecznie. To tylko smark jakich wiele.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
Napisano (edytowane)

Tyle że na FX we wszystko spokojnie pograsz, na denebach i innych już niekoniecznie. To tylko smark jakich wiele.

 

No ale widzisz jakimś "dziwnym" trafem Intele mają więcej FPS w grach. Teraz widać skąd to się bierze. Niestety ale przypominają mi się czasy Pentium I/Pentium II vs AMD K-5/K6-2. Wtedy również intele gniotły w obliczeniach na liczbach zmiennoprzecinkowych konkurencje. Efekt to więcej FPS w Quake I/II.

 

Jednostka AVX w FX'ach zachowuję się bardziej jak taki ulepszony SSE 2 niż prawdziwy AVX-256.

Edytowane przez Atak_Snajpera

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

flopscpu1h5bwo.png

 

Jest Moc :D

 

Edit:

Popołudniem postaram się o test i5-4460 i reszty co pod ręką się znajdzie ;)

Edytowane przez RemiKo

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Bez edycji, żeby się dla wszystkich odświeżyło.

 

i7-4770K@4.5GHz:

4500n2uv0.png

 

i7-3930K@4.2GHz:

4200squax.png

 

i5-4460@Stock:

4460pvu7m.png

 

2x E5-2620v3@Stock:

serv7nu35.png

 

Serwer był w ciągłym użytku. Parę maszyn wirtualnych w tle. Może kiedyś go jeszcze dorwę na spokojnie :)

 

Edit:

C2D T7700@Stock

lapvqk2z.png

Edytowane przez RemiKo

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Porównanie efektywności architektur

ysrz9c.png

Edytowane przez Atak_Snajpera

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Jeśli chcesz dodać odpowiedź, zaloguj się lub zarejestruj nowe konto

Jedynie zarejestrowani użytkownicy mogą komentować zawartość tej strony.

Zarejestruj nowe konto

Załóż nowe konto. To bardzo proste!

Zarejestruj się

Zaloguj się

Posiadasz już konto? Zaloguj się poniżej.

Zaloguj się

  • Ostatnio przeglądający   0 użytkowników

    Brak zarejestrowanych użytkowników przeglądających tę stronę.

×
×
  • Dodaj nową pozycję...