源文雨
|
e2d90690bf
|
fix(ci): oneAPI enabling
|
2025-10-13 15:49:18 +08:00 |
|
源文雨
|
7bbaa213b4
|
feat: add -DBUILD=test & test CI
|
2025-10-13 13:54:20 +08:00 |
|
源文雨
|
eb8131173e
|
feat(test): add result comparison to basic
Run on i7-14700K:
```
> .\tests\basic.exe
执行设备: Intel(R) UHD Graphics 770
设备类型: GPU
Intel GPU 特性:
XeCore 数量: 4
每个 XeCore 的向量引擎数: 8
向量引擎总数: 32
每个 XeCore 的硬件线程数: 56
每个向量引擎的硬件线程数: 7
硬件线程总数: 224
GPU 内存大小: 31712935936 B (29.53 GB)
每个工作组的共享本地内存: 65536 B
最大工作组大小: 512
支持的子组大小: 8 16 32
推荐选择子组大小: 8
100% 占用率工作组大小: 256
CPU (2944.7 ms): 54 85 110 101 0 102 101 101 85 86 85 86 110 110 110 206 94 110 104 198 110 102 102 206 94 110 110 94 104 94 206 102 101 102 94 54 101 110 254 86 86 104 102 198 104 110 0 104 110 86 0 110 110 198 110 110 94 85 110 0 254 101 101 101...
GPU 基本并行 (471.7 ms): 54 85 110 101 0 102 101 101 85 86 85 86 110 110 110 206 94 110 104 198 110 102 102 206 94 110 110 94 104 94 206 102 101 102 94 54 101 110 254 86 86 104 102 198 104 110 0 104 110 86 0 110 110 198 110 110 94 85 110 0 254 101 101 101...
GPU 高级并行 (448.2 ms): 54 85 110 101 0 102 101 101 85 86 85 86 110 110 110 206 94 110 104 198 110 102 102 206 94 110 110 94 104 94 206 102 101 102 94 54 101 110 254 86 86 104 102 198 104 110 0 104 110 86 0 110 110 198 110 110 94 85 110 0 254 101 101 101...
```
|
2025-10-09 16:18:54 +08:00 |
|
源文雨
|
24ea4ca7bd
|
optimize(test): move test kernels into test class
|
2025-10-09 16:08:09 +08:00 |
|
源文雨
|
cbe9cda397
|
optimize: add xeinfo class & more compl. kernel
|
2025-09-29 17:01:27 +08:00 |
|
源文雨
|
a9268fc3ce
|
doc: add README&LICENSE
|
2025-09-28 17:19:23 +08:00 |
|
源文雨
|
ad1df2bb98
|
optimize: project structure
|
2025-09-28 16:12:45 +08:00 |
|