矩阵乘法的一般形式是C=A*B,使用串行计算的矩阵乘法需要三层循环,操作次数为2*M*N*K。 为了减少矩阵乘法的计算成本,本实验决定对计算结果的矩阵C进行分块,分成大小相同的若干块,这些工作块... 0 0 0 矩阵分块乘法的并行实现以及缓存优化 jiaje he Created: 02/09/2023