common, xe: fix missing -cl-intel-greater-than-4GB-buffer-required OpenCL flag #2718

rjoursler · 2025-02-18T18:42:52Z

When offset0 is set, the maximum offset addressed by an OpenCL kernel is offset0 + buffer_size. If this value exceeds a 4GB offset, stateless addressing must be used, which requires setting the -cl-intel-greater-than-4GB-buffer-required flag. This PR adds the missing checks against offset0. This required modifying memory_desc_wrapper::size() to return an appropriate size when offset0 is set.

Fixes MFDNN-13205.

rjoursler · 2025-02-25T12:27:01Z

make test
enable test_device_cpu
enable test_device_gpu

src/common/memory_desc_wrapper.hpp

The behavior of returning 0 when offset0 is set is not aligned with how primitives check for large buffer support.

Stateful loads cannot address buffers that exceed 4GB in offset from the base pointer.

rjoursler · 2025-02-27T21:01:31Z

make test
enable test_device_cpu
enable test_device_gpu

rjoursler requested review from a team as code owners February 18, 2025 18:42

github-actions bot added the platform:gpu-intel Codeowner: @oneapi-src/onednn-gpu-intel label Feb 18, 2025

rjoursler force-pushed the rjoursle/fix_concat branch 3 times, most recently from 1005547 to bfaf989 Compare February 18, 2025 18:56

echeresh approved these changes Feb 18, 2025

View reviewed changes

rjoursler force-pushed the rjoursle/fix_concat branch 2 times, most recently from 707336e to 13a3261 Compare February 25, 2025 12:23

mgouicem reviewed Feb 26, 2025

View reviewed changes

src/common/memory_desc_wrapper.hpp Outdated Show resolved Hide resolved

rjoursler force-pushed the rjoursle/fix_concat branch from 13a3261 to 71de94e Compare February 27, 2025 16:32

rjoursler added 2 commits February 27, 2025 08:43

common: return described memory size when offset0 is set

dbe0929

The behavior of returning 0 when offset0 is set is not aligned with how primitives check for large buffer support.

xe: add missing offset0 when determining if large buffers are required

19ab2ca

Stateful loads cannot address buffers that exceed 4GB in offset from the base pointer.

rjoursler force-pushed the rjoursle/fix_concat branch from 71de94e to 19ab2ca Compare February 27, 2025 16:43

mgouicem approved these changes Feb 27, 2025

View reviewed changes

rjoursler merged commit 20bd7b5 into main Feb 28, 2025
22 of 23 checks passed

rjoursler deleted the rjoursle/fix_concat branch February 28, 2025 17:22

rjoursler mentioned this pull request Feb 28, 2025

[rls-v3.8-pc] common, xe: fix missing -cl-intel-greater-than-4GB-buffer-required OpenCL flag #2780

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

common, xe: fix missing -cl-intel-greater-than-4GB-buffer-required OpenCL flag #2718

common, xe: fix missing -cl-intel-greater-than-4GB-buffer-required OpenCL flag #2718

rjoursler commented Feb 18, 2025

rjoursler commented Feb 25, 2025

rjoursler commented Feb 27, 2025

common, xe: fix missing -cl-intel-greater-than-4GB-buffer-required OpenCL flag #2718

common, xe: fix missing -cl-intel-greater-than-4GB-buffer-required OpenCL flag #2718

Conversation

rjoursler commented Feb 18, 2025

rjoursler commented Feb 25, 2025

rjoursler commented Feb 27, 2025