为使您的问题得到快速解决,建议选择对应标签。
按照博客中矩阵的拆分方式
https://blog.csdn.net/weixin_39920397/article/details/111686882
假设L1D=32K,L2=512K,A,B,C矩阵大小都为480X480,即M=N=K=480
mr=nr=4
Kr=L1D/(mr+nr)=32K/4/(4+4)=1K
Nr=(L2-L1D)/Kr= (512K-32K)/4/1K=120
那也就是先拆分B矩阵的N,新的B矩阵为480X120=225K,A矩阵不拆分480X480=900K,
实现后效率不太高,总感觉M也要拆分