Noobmaster69
2025-09-16T08:01:10+00:00
AMD 在 GitHub 上更新 FidelityFX SDK 代码库时,意外推送了一些不该推送的文件。这其中包括编译 FSR 4 DLL 所需的文件,当然也少不了 FSR 4 Int8 文件。Int8 比 FP8 更适合许多 GPU 运行。随着时间的推移,人们设法在从 RDNA 2 和 3 到 RTX 3060ti 的各种 GPU 上编译并运行了这个 Int8 FSR 4。
此 Int8 版本的图像质量明显优于 FSR 3.1,并且比 XeSS(也是 Int8 模型)更好地解析头发和远处的细节。
唯一的缺点是运行成本较高,占用 RDNA 3 上 FSR 3.1 处理能力的近三倍(0.6ms 对 1.9ms),以及 RTX 3060ti 上 Transformer DLSS 处理能力的四倍。
令人惊讶的是,该型号设计为在 RDNA 4 上运行,尽管他们后来决定采用 FP8,这虽然降低了处理能力要求,但使其仅与 RDNA 4 兼容。
我估计,针对 RDNA 3 完全优化的 FSR 4 速度可能比 XeSS 更快,同时还能提供更出色的图像质量。即使是泄露的版本,如果编译时支持 WMMA,也能达到同样的速度。至于不支持 WMMA 指令的 RDNA 2,要么会选择更小、图像质量更差、处理能力占用更低的型号,要么选择与 RDNA 3 相同的型号,在 NativeAA 等模式下会大幅降低 FPS。而且 NVIDIA GPU 支持可能根本不会考虑。
[url=https://www.reddit.com/r/radeon/comments/1nhkkr8/fsr_sdk_leak_contained_fsr_4_files_that_work_on/]原帖:reddit [/url]
[img]https://img.nga.178.com/attachments/mon_202509/16/9aQ2w-ce0gZxT3cS1u0-188.webp[/img]
[img]https://img.nga.178.com/attachments/mon_202509/16/9aQ2w-dc4bZ15T3cS1ty-185.webp[/img]
[img]https://img.nga.178.com/attachments/mon_202509/16/9aQ2w-guhyZ15T3cS1ty-189.webp[/img]
此 Int8 版本的图像质量明显优于 FSR 3.1,并且比 XeSS(也是 Int8 模型)更好地解析头发和远处的细节。
唯一的缺点是运行成本较高,占用 RDNA 3 上 FSR 3.1 处理能力的近三倍(0.6ms 对 1.9ms),以及 RTX 3060ti 上 Transformer DLSS 处理能力的四倍。
令人惊讶的是,该型号设计为在 RDNA 4 上运行,尽管他们后来决定采用 FP8,这虽然降低了处理能力要求,但使其仅与 RDNA 4 兼容。
我估计,针对 RDNA 3 完全优化的 FSR 4 速度可能比 XeSS 更快,同时还能提供更出色的图像质量。即使是泄露的版本,如果编译时支持 WMMA,也能达到同样的速度。至于不支持 WMMA 指令的 RDNA 2,要么会选择更小、图像质量更差、处理能力占用更低的型号,要么选择与 RDNA 3 相同的型号,在 NativeAA 等模式下会大幅降低 FPS。而且 NVIDIA GPU 支持可能根本不会考虑。
[url=https://www.reddit.com/r/radeon/comments/1nhkkr8/fsr_sdk_leak_contained_fsr_4_files_that_work_on/]原帖:reddit [/url]
[img]https://img.nga.178.com/attachments/mon_202509/16/9aQ2w-ce0gZxT3cS1u0-188.webp[/img]
[img]https://img.nga.178.com/attachments/mon_202509/16/9aQ2w-dc4bZ15T3cS1ty-185.webp[/img]
[img]https://img.nga.178.com/attachments/mon_202509/16/9aQ2w-guhyZ15T3cS1ty-189.webp[/img]