Talk:AMD Radeon Instinct MI25

From ArchWiki

Installing Arch Linux packages from the archive will not work with the rest of the Arch Linux system

Is this inevitable when installing packages from the Arch Linux Archive?

What would need to be done as to have these warnings removed or modified? Would AUR packages need to be created and maintained for the ROCm 5.x framework and the corresponding ollama? Hunter (talk) 17:26, 29 June 2024 (UTC)Reply

Yes, packages in the archive depend on the ABI of their dependencies at the time of the snapshot. When you downgrade a bunch of packages, you essentially did a partial upgrade with time travel. Indeed, the solution is to maintain ROCm 5 packages in the AUR such that they are compiled against new versions of their dependencies. — Lahwaacz (talk) 18:57, 29 June 2024 (UTC)Reply
Its unnecessary anyhow, upstream still maintains support for mi25 in the latest version of rocm. arch linux packaging has some issues breaking it, but that should result in changes to those packages not in adding a rocm5 variant to the repo. Uvos (talk) 17:28, 16 August 2024 (UTC)Reply

Request ctranslate2/whisperx for gfx803/900

I need some help as I'm new to all the messing about for polaris


I just completed my own attempt at amdgpu-pro-installer upgrade to 24.10_60103

pkgbase=amdgpu-pro-installer

pkgname=(

   amf-amdgpu-pro

   amdgpu-pro-oglp

   lib32-amdgpu-pro-oglp

   vulkan-amdgpu-pro

   lib32-vulkan-amdgpu-pro

   amdgpu-pro-common

)


This successfully installed but eg now I can't run any games lol (probably all the messing around I did beforehand and timeshift got disabled at some point whoops.. at least nothing important on here)


Somehow still get clinfo

Segmentation fault (core dumped)


but there used to be a line break between fault and ( ...


python -c 'import torch; print(torch.cuda.is_available())'

True

rocm-smi

======================================= ROCm System Management Interface =======================================

================================================= Concise Info =================================================

Device  [Model : Revision]    Temp    Power     Partitions      SCLK    MCLK    Fan  Perf  PwrCap  VRAM%  GPU%  

       Name (20 chars)       (Edge)  (Socket)  (Mem, Compute)                                                  

================================================================================================================

0       [0x0519 : 0xe7]       41.0°C  6.241W    N/A, N/A        751Mhz  300Mhz  0%   auto  180.0W   22%   0%    

       Ellesmere [Radeon RX                                                                                    

================================================================================================================

============================================= End of ROCm SMI Log ==============================================



rocminfo

ROCk module is loaded

=====================    

HSA System Attributes    

=====================    

Runtime Version:         1.1

System Timestamp Freq.:  1000.000000MHz

Sig. Max Wait Duration:  18446744073709551615 (0xFFFFFFFFFFFFFFFF) (timestamp count)

Machine Model:           LARGE                              

System Endianness:       LITTLE                             

Mwaitx:                  DISABLED

DMAbuf Support:          YES

==========               

HSA Agents               

==========               

*******                  

Agent 1                  

*******                  

  Name:                    Intel(R) Core(TM) i7-7700K CPU @ 4.20GHz

  Uuid:                    CPU-XX                             

  Marketing Name:          Intel(R) Core(TM) i7-7700K CPU @ 4.20GHz

  Vendor Name:             CPU                                

  Feature:                 None specified                     

  Profile:                 FULL_PROFILE                       

  Float Round Mode:        NEAR                               

  Max Queue Number:        0(0x0)                             

  Queue Min Size:          0(0x0)                             

  Queue Max Size:          0(0x0)                             

  Queue Type:              MULTI                              

  Node:                    0                                  

  Device Type:             CPU                                

  Cache Info:              

   L1:                      32768(0x8000) KB                   

  Chip ID:                 0(0x0)                             

  ASIC Revision:           0(0x0)                             

  Cacheline Size:          64(0x40)                           

  Max Clock Freq. (MHz):   4500                               

  BDFID:                   0                                  

  Internal Node ID:        0                                  

  Compute Unit:            8                                  

  SIMDs per CU:            0                                  

  Shader Engines:          0                                  

  Shader Arrs. per Eng.:   0                                  

  WatchPts on Addr. Ranges:1                                  

  Features:                None

  Pool Info:               

   Pool 1                   

     Segment:                 GLOBAL; FLAGS: FINE GRAINED        

     Size:                    32831480(0x1f4f7f8) KB             

     Allocatable:             TRUE                               

     Alloc Granule:           4KB                                

     Alloc Alignment:         4KB                                

     Accessible by all:       TRUE                               

   Pool 2                   

     Segment:                 GLOBAL; FLAGS: KERNARG, FINE GRAINED

     Size:                    32831480(0x1f4f7f8) KB             

     Allocatable:             TRUE                               

     Alloc Granule:           4KB                                

     Alloc Alignment:         4KB                                

     Accessible by all:       TRUE                               

   Pool 3                   

     Segment:                 GLOBAL; FLAGS: COARSE GRAINED      

     Size:                    32831480(0x1f4f7f8) KB             

     Allocatable:             TRUE                               

     Alloc Granule:           4KB                                

     Alloc Alignment:         4KB                                

     Accessible by all:       TRUE                               

  ISA Info:                

*******                  

Agent 2                  

*******                  

  Name:                    gfx803                             

  Uuid:                    GPU-XX                             

  Marketing Name:          AMD Radeon RX 580 Series           

  Vendor Name:             AMD                                

  Feature:                 KERNEL_DISPATCH                    

  Profile:                 BASE_PROFILE                       

  Float Round Mode:        NEAR                               

  Max Queue Number:        128(0x80)                          

  Queue Min Size:          64(0x40)                           

  Queue Max Size:          131072(0x20000)                    

  Queue Type:              MULTI                              

  Node:                    1                                  

  Device Type:             GPU                                

  Cache Info:              

   L1:                      16(0x10) KB                        

  Chip ID:                 26591(0x67df)                      

  ASIC Revision:           1(0x1)                             

  Cacheline Size:          64(0x40)                           

  Max Clock Freq. (MHz):   1411                               

  BDFID:                   256                                

  Internal Node ID:        1                                  

  Compute Unit:            36                                 

  SIMDs per CU:            4                                  

  Shader Engines:          4                                  

  Shader Arrs. per Eng.:   1                                  

  WatchPts on Addr. Ranges:4                                  

  Coherent Host Access:    FALSE                              

  Features:                KERNEL_DISPATCH

  Fast F16 Operation:      TRUE                               

  Wavefront Size:          64(0x40)                           

  Workgroup Max Size:      1024(0x400)                        

  Workgroup Max Size per Dimension:

   x                        1024(0x400)                        

   y                        1024(0x400)                        

   z                        1024(0x400)                        

  Max Waves Per CU:        40(0x28)                           

  Max Work-item Per CU:    2560(0xa00)                        

  Grid Max Size:           4294967295(0xffffffff)             

  Grid Max Size per Dimension:

   x                        4294967295(0xffffffff)             

   y                        4294967295(0xffffffff)             

   z                        4294967295(0xffffffff)             

  Max fbarriers/Workgrp:   32                                 

  Packet Processor uCode:: 730                                

  SDMA engine uCode::      58                                 

  IOMMU Support::          None                               

  Pool Info:               

   Pool 1                   

     Segment:                 GLOBAL; FLAGS: COARSE GRAINED      

     Size:                    8388608(0x800000) KB               

     Allocatable:             TRUE                               

     Alloc Granule:           4KB                                

     Alloc Alignment:         4KB                                

     Accessible by all:       FALSE                              

   Pool 2                   

     Segment:                 GLOBAL; FLAGS: EXTENDED FINE GRAINED

     Size:                    8388608(0x800000) KB               

     Allocatable:             TRUE                               

     Alloc Granule:           4KB                                

     Alloc Alignment:         4KB                                

     Accessible by all:       FALSE                              

   Pool 3                   

     Segment:                 GROUP                              

     Size:                    64(0x40) KB                        

     Allocatable:             FALSE                              

     Alloc Granule:           0KB                                

     Alloc Alignment:         0KB                                

     Accessible by all:       FALSE                              

  ISA Info:                

   ISA 1                    

     Name:                    amdgcn-amd-amdhsa--gfx803          

     Machine Models:          HSA_MACHINE_MODEL_LARGE            

     Profiles:                HSA_PROFILE_BASE                   

     Default Rounding Mode:   NEAR                               

     Default Rounding Mode:   NEAR                               

     Fast f16:                TRUE                               

     Workgroup Max Size:      1024(0x400)                        

     Workgroup Max Size per Dimension:

       x                        1024(0x400)                        

       y                        1024(0x400)                        

       z                        1024(0x400)                        

     Grid Max Size:           4294967295(0xffffffff)             

     Grid Max Size per Dimension:

       x                        4294967295(0xffffffff)             

       y                        4294967295(0xffffffff)             

       z                        4294967295(0xffffffff)             

     FBarrier Max Size:       32                                 

*** Done ***             Asdfchb (talk) 07:36, 1 July 2024 (UTC)Reply

You need to ask elsewhere for help, the wiki is not a support forum. — Lahwaacz (talk) 10:30, 1 July 2024 (UTC)Reply

whisper

for some reason I have been able to run whisper GPU on gfx803 using ulyssesrr/rocm-gfx803-pytorch:latest but not whisperx i believe due to ctranslate Asdfchb (talk) 09:00, 1 July 2024 (UTC)Reply

gfx900 support in rocm 6.0+

i can confirm that amd still builds all rocm packages besides composable kernel for gfx900 as of rocm 6.1 and i can also confirm that it works fine at least as of 6.0. Arch linux dose not build pytorch for gfx900 since 6.0 but this has nothing to do with rocm support.

—This unsigned comment is by Uvos (talk) 15:22, 15 August 2024. Please sign your posts with ~~~~!

gfx900 has a ❌ in https://rocm.docs.amd.com/projects/install-on-linux/en/latest/reference/system-requirements.htmlLahwaacz (talk) 16:40, 15 August 2024 (UTC)Reply
Thats true, however this simply means that amd no longer officaly supports this architecture, they still build for, it see for instance the default targets for rocblas: https://github.com/ROCm/rocBLAS/blob/49636cf4444ffcabb7501034f25080276b21ca37/CMakeLists.txt#L114 note that even in 6.3 gfx900 is still supported
"They were officially supported under ROCm 4, unofficially supported under ROCm 5, and unsupported under ROCm 6" is thus plain wrong. GFX900 was officially supported in ROCm 4 and has been unofficially supported ever since.
I can also confirm it works. Makeing people install rocm5.7 is damaging as rocm6+ includes many fixes and improvements that apply to gfx900.
It should also be noted that while amd still builds for and supports gfx900, arch linux maintainers appear to not do so any longer, for instance in pytorch gfx900 is disabled by the package maintainer, for reasons unkown: https://gitlab.archlinux.org/archlinux/packaging/packages/python-pytorch/-/blob/main/PKGBUILD?ref_type=heads#L296
i can confirm that private builds of pytorch also still work. Uvos (talk) 17:19, 16 August 2024 (UTC)Reply