Skocz do zawartości
Tombycz

Intel Alder Lake/ Raptor Lake/ Meteor Lake/ Arrow Lake/ Lunar Lake/ Panther Lake/ Nova Lake - 14 generacja

Rekomendowane odpowiedzi

Napisano (edytowane)

Tak z ciekawości nigdy nie sprawdzałem wpływu SMT na wydajność na wat, ale po włączeniu SMT wydajność na wat spada ;)

Przykładowo kodowanie video x265 wzrost wydajności o 15% przełożył się na przyrost poboru mocy o 21% ;)

A E-core w przeciwieństwie do SMT podnosi wydajność na wat.

W Crysisie 3 jest na odwrót :szczerbaty:

1.44x wydajność, a pobór mocy tylko 1.12x do góry po włączeniu SMT.

8P+8E w porównaniu do gołych 8P bez SMT 1.52x wydajność, a pobór mocy 1.5x.

Oczywiście jak soft nie kłamie bo to różnie może z tym być ;)

Edytowane przez sideband
  • Upvote 1

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
Napisano (edytowane)

@Assassin, ja nie napisałem nic co jest mitem, podałem same fakty więc nie wymyślaj. A jak się z czymś nie zgadzasz to napisz dokładnie o co ci chodzi. To o poborze prądu nie dotyczy tylko OC tak jak twierdzisz, na standardowej częstotliwości włączenie HT zwiększa znacznie pobór mocy i to bardziej niż wydajność. @sideband to sprawdził, ja też.

i9-13900KF z wyłączonymi rdzeniami E, standardowa częstotliwość 5500 MHz rdzeni P.
8P bez HT, Vcore offset -0,09 V.
Cinebench 2024: 993 punktów przy średnim poborze mocy 148 W.
8P z HT, Vcore offset -0,04 V.
Cinebench 2024: 1273 punktów przy średnim poborze mocy 199 W.
Wyższa wydajność o 28% przy wyższym poborze mocy o 34%.

1 godzinę temu, Assassin napisał:

Serio, to była decyzja księgowych i/lub marketingowców, nie inżynierów. Zapewne uznali, że nowe rdzenie mają być na tyle dobre, że nie opłaca się tracić roboczogodzin na ich ulepszanie technologią, która i tak niedługo odejdzie do lamusa. Może się to na nich ostatecznie marketingowo zemścić jeśli w benchmarkach wielowątkowych nowe Core będą obrywały od podobnie wycenianego Zen 5...

Skąd ty możesz to wiedzieć? Nic o tym nie świadczy. Intel od pierwszej generacji z hybrydową architekturą twierdził, że rdzenie E są lepsze pod względem wydajności niż HT. Nikt w ogóle o tym nie wspominał, żeby rdzenie E miały mieć HT.

Kto ma jakąś informację jaką część rdzenia zajmuje logika odpowiedzialna za HT?

Edytowane przez SebastianFM

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
Napisano (edytowane)
14 godzin temu, sideband napisał:

Tak z ciekawości nigdy nie sprawdzałem wpływu SMT na wydajność na wat, ale po włączeniu SMT wydajność na wat spada ;)

Przykładowo kodowanie video x265 wzrost wydajności o 15% przełożył się na przyrost poboru mocy o 21% ;)

A E-core w przeciwieństwie do SMT podnosi wydajność na wat.

W Crysisie 3 jest na odwrót :szczerbaty:

1.44x wydajność, a pobór mocy tylko 1.12x do góry po włączeniu SMT.

8P+8E w porównaniu do gołych 8P bez SMT 1.52x wydajność, a pobór mocy 1.5x.

Tak, bardzo dużo zależy od softu. Przykładowo, w takim LinX HT nie daje zupełnie nic, bo zasoby rdzenia i bez HT są optymalnie wykorzystywane. Niemniej, zazwyczaj jednak HT podnosi ogólna efektywność w MT, zarówno na wat jak i (przede wszystkim) na mm2.

Przykładowo u mnie: V-Ray - wzrost wydajności z HT o 40%, wzrost poboru o 25%; Cb R20 - wzrost wydajności o 35%, wzrost poboru 20%.

Że 8 gołych ale b. mocnych rdzeni rdzeni nie daje rady w Crysisie 3 to mnie w sumie bardzo mocno zaskoczyło. Podejrzewam, że albo jakieś procesy w tle "kradły" zasoby /do pary z narzutem sterownika GPU/ (procesory bez smt są na to bardzo wrażliwe), albo to jakieś "ujemne optymalizacje" które w czasie premiery Crysisa miały podkreślać przewagę i7 nad i5 ;-) , względnie - jakiś niezamierzony bubel optymalizacyjny.

13 godzin temu, SebastianFM napisał:

Skąd ty możesz to wiedzieć? Nic o tym nie świadczy. Intel od pierwszej generacji z hybrydową architekturą twierdził, że rdzenie E są lepsze pod względem wydajności niż HT. Nikt w ogóle o tym nie wspominał, żeby rdzenie E miały mieć HT.

Kto ma jakąś informację jaką część rdzenia zajmuje logika odpowiedzialna za HT?

Wszystko na to wskazuje; nikt ot tak lekką ręką nie oddaje 20-30% dodatkowej wydajności. A o tych tranzystorach to mówił sam Intel. Teraz już pewnie nie znajdę, ale zapamiętałem to, bo mnie zaciekawiło. AMD zresztą podobnie zachwalało swoje SMT vs CMT z Bulldozera, choć ta ostatnia technologia też nie zwiększała wielkości rdzenia jakoś drastycznie (ok. 20% o ile dobrze pamiętam, ale tu mogę się mylić) przy wyraźnie lepszym skalowaniu mt od HT (zwłaszcza w operacjach INT).

Edytowane przez Assassin

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

@Assassin, u ciebie ta różnica w wydajności między wyłączonym i włączonym HT jest dużo wyższa niż u mnie, na jakim procesorze to sprawdzałeś?

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
Napisano (edytowane)

No tak mniej-więcej można powiedzieć, że HT zwiększa wydajność proporcjonalnie do wzrostu zapotrzebowania na energię.

9 godzin temu, Assassin napisał:

Wszystko na to wskazuje; nikt ot tak lekką ręką nie oddaje 20-30% dodatkowej wydajności.

To, że SMT w ogóle coś daje, wynika z nieoptymalnej budowy rdzenia/działania danego programu.

SMT po prostu pozwala ładować w procesor więcej poleceń (tak to wygląda praktycznie, także proszę o nie mądrzenie się rejestrami i innymi pierdołami jak na pewnym innym forum przez pewnego użyszkodnika) dzięki czemu jeśli przy jednym "strumieniu rozkazów" (jeden wątek na rdzeń) rdzeń obciążony jest np. w 75%, to dołożenie drugiego "strumienia rozkazów" (druki równoległy wątek na rdzeń dzięki SMT=HT) pozwala po prostu wykorzystać pozostałe 25% ("dociążyć" rdzeń/część obliczeniową).

Także SMT byłby totalnym picem na wodę, gdyby procesor jako całość, działał bardziej optymalnie (pełne obciążenie części obliczeniowej pojedynczym wątkiem).

Edytowane przez Kyle_PL
  • Like 1

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
10 godzin temu, SebastianFM napisał:

Kto ma jakąś informację jaką część rdzenia zajmuje logika odpowiedzialna za HT?

Jeśli mnie pamięć nie myli to chyba 5%.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

@Kyle_PL, to może właśnie w Lion Cove na tyle zostało to usprawnione, że HT straciło sens?

  • Upvote 1

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
Napisano (edytowane)

Nie mogę pobrać dokumentacji technicznej dla procesorów 13 i 14 generacji - Datasheet vol 1:

https://www.intel.com/content/www/us/en/products/docs/processors/core/core-technical-resources.html

W tym dokumencie minimum są podawane limity CPU PL1, PL2, ICCMax, maks. VCore itd. Niestety ostatni mam ze stycznia.

Sprawdzałem wczoraj i też nie działało. Dziwne bo, większość dokumentacji pobiera się poprawnie (natrafiłem na dwie inne niedziałające). Przypadek?

intel-cpu-doc-404.jpg

Edytowane przez pawciog

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
Napisano (edytowane)
3 godziny temu, SebastianFM napisał:

@Assassin, u ciebie ta różnica w wydajności między wyłączonym i włączonym HT jest dużo wyższa niż u mnie, na jakim procesorze to sprawdzałeś?

14700K. Też wyłączyłem rdzenie E żeby było porównywalnie (wcześniej sprawdzałem z tymi rdzeniami i wychodziło podobnie, choć różnice procentowe oczywiście mniejsze).

3 godziny temu, Kyle_PL napisał:

SMT po prostu pozwala ładować w procesor więcej poleceń (tak to wygląda praktycznie, także proszę o nie mądrzenie się rejestrami i innymi pierdołami jak na pewnym innym forum przez pewnego użyszkodnika) dzięki czemu jeśli przy jednym "strumieniu rozkazów" (jeden wątek na rdzeń) rdzeń obciążony jest np. w 75%, to dołożenie drugiego "strumienia rozkazów" (druki równoległy wątek na rdzeń dzięki SMT=HT) pozwala po prostu wykorzystać pozostałe 25% ("dociążyć" rdzeń/część obliczeniową).

Także SMT byłby totalnym picem na wodę, gdyby procesor jako całość, działał bardziej optymalnie (pełne obciążenie części obliczeniowej pojedynczym wątkiem).

Mniej więcej, generalnie zgoda. Tylko nigdy nie będzie tak, że każdy program będzie w stanie optymalnie wykorzystywać zasoby każdego procesora, stąd smt jeszcze długo będzie przydatne. Albo innymi słowy: nie ma i jeszcze długo nie będzie optymalnej budowy rdzenia pod każdy program i optymalnego działania programu pod każdy procesor ;-) Dochodzi jeszcze specyfika współczesnych systemów operacyjnych, do ich obsługi przy mniejszej ilości rdzeni SMT to "must have".

Oczywiście, SMT to nie jest żaden Święty Graal i na pewno dałoby się tak zrobić, żeby pojedynczy rdzeń dobrze radził sobie z równoległym wykonywaniem zadań i dobrym wykorzystywaniem dostępnych zasobów nie będąc jednocześnie widzianym przez OS jako 2 procesory logiczne. Obecne przecieki wskazują jednak, że najbliższa generacja nic innego w zamian za HT nie dostanie, podobnie jak nic nie dostały rdzenie E w obecnej generacji.

Rentable units wydaje się na papierze bardziej wysublimowanym rozwiązaniem podobnego problemu i krokiem w dobra stronę, ale za mało wiem żeby wyrobić sobie zdanie, czy tak rzeczywiście będzie.

Edytowane przez Assassin

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
Napisano (edytowane)
16 minut temu, Assassin napisał:

na pewno dałoby się tak zrobić, żeby pojedynczy rdzeń dobrze radził sobie z równoległym wykonywaniem zadań i dobrym wykorzystywaniem dostępnych zasobów nie będąc jednocześnie widzianym przez OS jako 2 procesory logiczne.

W tym całym SMT chodzi przede wszystkim o wykorzystanie jednostek obliczeniowych w 100% w dzisiejszych CPU (bo w takim Cinebench R23 się one nudzą przy jednym wątku na rdzeń - co udowadnia wzrost wydajności po włączeniu SMT), a nie o wykonywanie wielu zadań równolegle na pojedynczym rdzeniu. Dzisiejsze CPU spokojnie obsługują na pojedynczym rdzeniu, nierównolegle, nawet bez SMT, wszystkie wątki "IDLE'owe" Windows'a.

ps. osobiście jestem zwolennikiem unifikacji - czyli brak SMT i brak różnych rdzeni w konsumenckim procesorze. Zunifikowana budowa pozwala uniknąć dziwnych problemów w choćby grach. Natomiast przy SMT już bywało, że były problemy, jak też przy dodanych E-cores, obok zwykłych rdzeni

Edytowane przez Kyle_PL

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Najbardziej podstawowe procesy zapewne tak, ale jak dojdzie jakaś indeksacja czy uaktywni się Defender to już mam wątpliwości. Tzn. procesor daje radę, ale ten rdzeń już wiele więcej nie da rady zrobić; jeśli jest jednym z 2 czy 4 dostępnych to nie jest kolorowo. W każdym razie moje prywatne doświadczenia pracy z Windowsem 10+ na 2-4 gołych rdzeniach nie należą do najprzyjemniejszych (choć to tez pewnie kwestia przyzwyczajeń i oczekiwań - kiedyś człowiek miał HDD i nie narzekał za bardzo, no chyba że na Viście :E )

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

@Kyle_PL, żeby działało SMT/HT to właśnie program/gra musi tworzyć i uruchamiać większą ilość wątków tak, żeby 2 mogły być wykonywane równocześnie na jednym rdzeniu.

  • Upvote 1

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
Napisano (edytowane)

@SebastianFM dokładnie tak. To utrudnia też pisanie programów. Za czasów jedno-rdzeniowych, jedno wątkowych CPU było prościej zobaczyć wykorzystanie w 100% CPU przy dowolnej operacji.

10 minut temu, Assassin napisał:

W każdym razie moje prywatne doświadczenia pracy z Windowsem 10+ na 2-4 gołych rdzeniach nie należą do najprzyjemniejszych

Ja tam mam w pracy i3 8100 (4 fizyczne rdzenie bez SMT) i nie narzekam jak to działa. Faktycznie jedno-rdzeniowe i jedno wątkowe CPU łatwo było zamulić (właśnie dla tego, że bardzo łatwo można go było zająć w 100%) ... jednak przy 4 rdzeniowych, nawet bez SMT już nie ma problemów z "zatykaniem" jak w tle jakieś aktualizacje jadą.

Edytowane przez Kyle_PL

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
Napisano (edytowane)

@Kyle_PL, trzeba w tej dyskusji rozgraniczać wykorzystanie procesora w programach i grach.

W programach np. przy renderowaniu, kompresji, kompilowaniu, kodowaniu nie ma najmniejszego problemu, żeby rozdzielić obliczenia na odpowiednią ilość wątków i obciążyć wszystkie rdzenie w 100%.

W grach po pierwsze nie wszystkie obliczenia da się zrównoleglić a po drugie dochodzi jeszcze synchronizacja między wątkami, obliczenia są zależne od wyniku poprzednich więc część wątków musi czekać.

Edytowane przez SebastianFM

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Jak najbardziej - w takim Cinebench to nie ma problemu zrobić zylion wątków i obciążyć w 100%. Jednak w typowych aplikacjach (typowa gra, albo Microsoft Word) to już nie jest tak prosto obciążyć efektywnie np. 16 wątków.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
Napisano (edytowane)

Zdecydowanie tak, dlatego moje "ubolewania" odnośnie braku HT dotyczą głównie wydajności wielowątkowej (rendering etc), a także procesorów z lowendu z ogólnie małą ilością rdzeni. Choć jak pokazał przykład @sideband, nawet w grach bywa to problemem, zwłaszcza przy starych API (DX11 i starsze + OpenGL).

W ekstremalnych sytuacjach bywało nawet tak, że dwurdzeniowiec z HT był wielokrotnie szybszy od tego samego dwurdzeniowca bez HT, bo ten ostatni się po prostu zatykał i generował slideshow ;-)

Edytowane przez Assassin

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

No zdaje się w GTA V tak było, że na dwóch rdzeniach (bez SMT) gra cięła, a na 2 rdzeniach z SMT lub 4 gołych rdzeniach już było OK, bo gra została napisana na minimum 4 wątki. Także tak - jak napiszemy aplikację typu gra, na ściśle określoną ilość wątków, a nasz CPU nie jest w stanie obsłużyć równolegle tyle wątków, no to mamy problem z płynnością.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
13 godzin temu, Assassin napisał:

Że 8 gołych ale b. mocnych rdzeni rdzeni nie daje rady w Crysisie 3 to mnie w sumie bardzo mocno zaskoczyło. Podejrzewam, że albo jakieś procesy w tle "kradły" zasoby /do pary z narzutem sterownika GPU/ (procesory bez smt są na to bardzo wrażliwe), albo to jakieś "ujemne optymalizacje" które w czasie premiery Crysisa miały podkreślać przewagę i7 nad i5 ;-) , względnie - jakiś niezamierzony bubel optymalizacyjny.

Crysis 3 w levelu trawkowym dobrze skaluje się z dużą liczbą wątków ;) Tutaj narzut sterownika i inne kwestie nie mają znaczenia. Fizyka trawy jest liczona na CPU do tego dorzuć cienie od trawki, które ładnie podbijają draw calls. Silnik od fizyki w CE ma wsparcie dla MT. Kończy się trawka to kończy się obciążenie wielu wątków ;)

WD1 byłaby jeszcze większą różnica, ale musiałbym przechodzić grę do miejsca testowego to już mi się nie chce :E

  • Like 1

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

@Kyle_PL, generalnie gry przy uruchomieniu sprawdzają ilość rdzeni fizycznych i logicznych procesora i do tego dostosowują ilość uruchamianych równocześnie wątków. Nie trafiłem do tej pory na grę, w której byłaby wyższa wydajność powyżej 16 wątków. Sprawdzałem oczywiście w najniższej rozdzielczości, żeby karta graficzna nie ograniczała FPS. Przy włączonym HT rdzenie E nic nie dawały a przy wyłączonym HT wystarczyło 8 rdzeni E. W niektórych grach jest ustalony limit, np. Assassin's Creed Mirrage korzysta równocześnie z nie więcej niż 10 wątków nawet jeżeli CPU ma więcej rdzeni.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
Napisano (edytowane)
9 godzin temu, Kyle_PL napisał:

@SebastianFM dokładnie tak. To utrudnia też pisanie programów.

Teraz leci jakas adoracja kasacji HT że niby bez HT świat będzie teraz lepszy bo intel tak będzie robił? Możę lepiej żeby napchali jakiegoś kesza L4 czy coś innego innnowacyjnego. Bo upośledzanie proca upośledzonymi rdzeniami na pewno wyjdzie na dobre. 

Jeśli HT utrudnia komuś pisanie programów to powinien dalej zbierać szparagi.

Edytowane przez Minciu

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
Napisano (edytowane)

@Minciu, czyli według tego co piszesz to twój procesor jest upośledzony? Bardzo mi przykro. 😁

A cache ma być zwiększony o 50% więc o to się nie martw.

Edytowane przez SebastianFM
  • Upvote 1

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
Napisano (edytowane)
3 godziny temu, Minciu napisał:

Jeśli HT utrudnia komuś pisanie programów to powinien dalej zbierać szparagi.

W takim razie napisz program, który dodaje dwie liczby w taki sposób, by efektywnie wykorzystać moc obliczeniową ... no bez szaleństw, czyli powiedzmy 8 wątków :]  ... a jak nie potrafisz, to zajmij się sprzedażą buraków.

Edytowane przez Kyle_PL

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
4 godziny temu, Minciu napisał:

Teraz leci jakas adoracja kasacji HT że niby bez HT świat będzie teraz lepszy bo intel tak będzie robił? Możę lepiej żeby napchali jakiegoś kesza L4 czy coś innego innnowacyjnego. Bo upośledzanie proca upośledzonymi rdzeniami na pewno wyjdzie na dobre. 

Jeśli HT utrudnia komuś pisanie programów to powinien dalej zbierać szparagi.

Hyperthreading jest ogromną luką w zabezpieczeniach procesora, którą można załatać tylko... wyłączając HT. I dotyczy to zarówno procesorów Intela jak i AMD.

https://www.techtarget.com/searchsecurity/news/252452053/PortSmash-side-channel-attack-targets-Intel-Hyper-Threading

https://www.tomshardware.com/news/new-vulnerability-affects-all-amd-zen-cpus

Ponadto zyski z HT są niewielkie, co prawda ma się dwa razy tyle wątków ale działają one znacznie wolniej niż na procesorze wyposażonym w dwa razy tyle identycznych rdzeni bez włączonego HT.

  • Like 1
  • Upvote 1

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
9 godzin temu, Kyle_PL napisał:

W takim razie napisz program, który dodaje dwie liczby w taki sposób, by efektywnie wykorzystać moc obliczeniową ... no bez szaleństw, czyli powiedzmy 8 wątków :]  ... a jak nie potrafisz, to zajmij się sprzedażą buraków.

Dziwna odpowiedź na cytowany post.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
Napisano (edytowane)
W dniu 25.05.2024 o 02:09, Andree napisał:

Hyperthreading jest ogromną luką w zabezpieczeniach procesora, którą można załatać tylko... wyłączając HT. I dotyczy to zarówno procesorów Intela jak i AMD.

https://www.techtarget.com/searchsecurity/news/252452053/PortSmash-side-channel-attack-targets-Intel-Hyper-Threading

https://www.tomshardware.com/news/new-vulnerability-affects-all-amd-zen-cpus

Ponadto zyski z HT są niewielkie, co prawda ma się dwa razy tyle wątków ale działają one znacznie wolniej niż na procesorze wyposażonym w dwa razy tyle identycznych rdzeni bez włączonego HT.

Zadaniem HT(SMT) jest w jak najwyższym stopniu nasycić rdzeń instrukcjami/danymi dwoma wątkami ponieważ pojedynczy wątek w przeważającej większości softu nie jest w stanie w pełni nasycić zasobów rdzenia. 

 

Pozostaje otwarta kwestia czy rdzeń LionCove faktycznie ma implementacje SMT która została wyłączona w ArrowLake. Póki co nie ma na to jednoznacznej odpowiedzi ponieważ logika podpowiada że LionCove dla DiamondRapids(Xeon) powinien mieć SMT. Osobiście uważam że LionCove ma fizycznie zaimplementowane SMT mimo iż dla ArrowLake może być nieaktywny.

Edytowane przez AMDK11

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Jeśli chcesz dodać odpowiedź, zaloguj się lub zarejestruj nowe konto

Jedynie zarejestrowani użytkownicy mogą komentować zawartość tej strony.

Zarejestruj nowe konto

Załóż nowe konto. To bardzo proste!

Zarejestruj się

Zaloguj się

Posiadasz już konto? Zaloguj się poniżej.

Zaloguj się

  • Ostatnio przeglądający   0 użytkowników

    Brak zarejestrowanych użytkowników przeglądających tę stronę.

×
×
  • Dodaj nową pozycję...