Sprawdziłem i mogę wyjaśnić z czego wynika różnica w wydajności pomiędzy DLSS FG a FSR 3 FG jeżeli dodatkowo jest użyte skalowanie. Np. na RTX 4070 Ti w rozdzielczości 4K ze skalowaniem Quality, czyli z 2560x1440 do 3840x2160, przy użyciu DLSS FG jest 110 FPS a przy użyciu FSR 3 FG jest 130 FPS.
Normalnie generowanie klatki pośredniej przez DLSS FG i FSR 3 FG zajmuje podobną ilość czasu na GPU. Jednak jeżeli dodatkowo jest użyte skalowanie to w przypadku rozwiązania AMD część danych, np. wektory ruchu, jest przetwarzanych w rozdzielczości renderowania a nie wyświetlania co zmniejsza ilość obliczeń i wpływa na wydajność. Sprawdziłem to za pomocą profilera Microsoft PIX. Nie mam informacji czy ta optymalizacja dotyczy tylko tej gry czy jest standardowo w FSR 3.