Skocz do zawartości
Tombycz

NVIDIA RTX 50x0

Rekomendowane odpowiedzi

Teraz, SebastianFM napisał:

GPC to bez sensu. Masz GPC z różną ilością jednostek w ramach jednej architektury a nawet jednego GPU.

Prawda, ale w procesorach też możesz mieć różną ilość pamięci w obrębie tej samej architektury (mobilne vs desktopowe).

IPC z tego co wiem nie mierzy się dla konkretnej jednej instrukcji (nie wiem, przykładowo dodawanie) a po prostu jako liczbę instrukcji w czasie potrzebną do wykonania konkretnego fragmentu kodu więc jest to złożony test i na pomiar wpływają nie tylko zmiany w najniższym poziome w układach arytmetyki itd tylko też poprawa branch predictora będzie mieć wpływ.

Ja wiem że się nie znam, ale mimo wszystko nie ma obecnie układu zbudowanego z samych cuda cores tylko i wyłącznie, więc w praktyce najniższą jednostką którą można eksperymentalnie przetestować w realnym zastosowaniu to pojedynczy GPC. A to już ile on ma w sobie konkretnych komponentów, czy szerokość szyny już bym zrzucił właśnie na karb samej różnicy w architekturze i wydajność.

Można owszem policzyć ile operacji dodawania jest w stanie wykonać dana jednostka, ale w praktyce nigdy tyle nie osiągnie bo musi działać w otoczeniu całej reszty, choćby faktu że inna część układu ukradnie jej kawałek budżetu energetycznego bo gorzej radzi sobie z wyłączaniem/spowalnianiem nieaktywnych obszarów "rdzenia".

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
Napisano (edytowane)

@cichy45, dla CPU można uruchomić określony kod i na tej podstawie określić IPC.

W GPU jednostki obliczeniowe większość instrukcji wykonują w jednym cyklu zegara nie ma więc sensu określać IPC. Zamiast tego podaje się wydajność całego układu w TFLOPS. Jest to ilość operacji zmiennoprzecinkowych na sekundę. Instrukcja FMA, mnożenie z dodawaniem, jest wykonywana przez jednostki FP32 w jednym cyklu. Jest to njczęściej używana instrukcja podczas obliczeń na GPU. TFLOPS = częstotliwość x ilość jednostek FP32 x 2.

Edytowane przez SebastianFM

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Ok, ale ciągle - wcześnie było wspominane że chyba SM w Turingu miał podwójne FP32 - jak byś to zinterpretował? Dwie operacje na cykl w SM czy jedna? Bo one chyba mogły działać równolegle.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Ciekawe co na to żona :E 

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Ale micha mu się cieszy :E Cycki mają władzę :]

  • Like 3

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

WTF, a mina tamtego kolesia w tle :E

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

No właśnie to jej chłopak/ mąż i ryczy :)

  • Haha 2

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Myślę, że faktycznie przy RTX5000 nvidia mogłaby poprawić wydajność framegena.

https://imgur.com/a/ucSiAs6

Bo tak - pierwsza karta zareklamowana jako GPU dla 8K czy też BFGPU :E to była 3090. Wyszło średnio, przy premierze 4090 nie pamiętam już czy 8K było jednym z ich punktów marketingowych.

Ale tak, Ghost of Tsushima przy 8K maksymalne ustawienia daje w tej konkretnej scenie 30 fps.

DLSS Performance upscaluje 4K do 8K i daje 58 FPS, no jest to już próg zadowolenia dla gracza konsolowego i poziom od którego można się zastanowić nad aktywacją framegena według nvidii. Aktywujemy i co? Marne 76 FPS. Jak wspominał @SebastianFM dlss fg bierze motion vectory już po skalowaniu klatki więc przetwarza więcej danych niż FSR-FG które bierze to przed skalowaniem klatki. O ile może ma to sens przy niskich rozdzielczościach to w samym 4K już jest raczej sporo informacji więc pytanie czy nvidia nie mogłaby się pokusić o pójście ścieżką AMD i zmniejszenia ilości obliczeń przy framegenie w takiej sytuacji?

Alternatywnie, po prostu znacznie musi zwiększyć te etapy FG które są najwolniejsze @SebastianFM pewnie jest w stanie powiedzieć który etap framegenu zajmuje najwięcej czasu / jest najbardziej intensywny obliczeniowo bo w tym siedzi.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

@cichy45, ty już trochę wymyślasz. 8K to jest 4 razy więcej obliczeń niż w 4K więc chyba logiczne, że generowanie klatki pośredniej w tak wysokiej rozdzielczości będzie trwało proporcjonalnie dłużej. NVIDIA od pierwszej wersji FG poprawiła wydajność już o ponad 10%. Rozwiązanie AMD jest wydajniejsze jednak jakość generowanych klatek pośrednich jest na innym poziomie. A ty jak chcesz używać FG w 8K to chyba musisz poczekać na RTX 5090. Jeżeli byłby np. o 50% wydajniejszy w obliczeniach od RTX 4090 to w 8K przy 58 FPS po włączeniu FG miałbyś 86 FPS.

  • Upvote 1

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
4 minuty temu, SebastianFM napisał:

A ty jak chcesz używać FG w 8K to chyba musisz poczekać na RTX 5090

Po prostu siedzę na urlopie i wymyślam głupoty w wolnym czasie :E 

  • Haha 6

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

W RTXach 5000 nVidia wykorzysta wolniejszą pamięć GDDR7 - 28Gb/s co oznacza mniej niż 20% wzrostu względem RTXów 4000 (24Gb/s dla GDDR6X).

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

32 będą pewnie w 5090 Ti / Super czy jak tam się będzie nazywać. 

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

The Soon You Die The More You Save :E

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

 

 

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Że nie będzie tanio to wiadomo. Najwyżej jakiś fan AI się nacieszy... Pytanie czy wzrost wydajności skłoni do zdarcia kolejnej warstwy skóry gaming community :E

Tanio już było :E

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
Napisano (edytowane)

Obstawiałbym, że krzykną 1999 zielonych za 5090. Kurs dolca powiedzmy 4zł do tego vat i pod 10k za najtańsze wersje może być. Strix pewnie ze 12 klocków:-P. Mnie bardziej interesuje średnia, średnio-wyższa półka i teoretyczna nowa 70ti, max 80. Póki co plotki raczej szału nie zapowiadają (ostatnio o downgrade specki 5080, ale to plotki ofc)

Edytowane przez Kelam
  • Upvote 1

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Jak TSMC podniesie ceny dla Nvidii, to zieloni podniosą ceny dla nas :E W kość zawsze dostaje użytkownik końcowy psio krew :goryl:

  • Upvote 2

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Jeśli chcesz dodać odpowiedź, zaloguj się lub zarejestruj nowe konto

Jedynie zarejestrowani użytkownicy mogą komentować zawartość tej strony.

Zarejestruj nowe konto

Załóż nowe konto. To bardzo proste!

Zarejestruj się

Zaloguj się

Posiadasz już konto? Zaloguj się poniżej.

Zaloguj się

  • Ostatnio przeglądający   0 użytkowników

    Brak zarejestrowanych użytkowników przeglądających tę stronę.

×
×
  • Dodaj nową pozycję...