本文主要是一文的补充
回顧前文,对于8X8的实数矩阵:
打印结果与SVD分解的结果一致并行思路可行。其他维度依次类推对于维度N的矩阵,
- N为偶数可并行N/2路;
- N为奇數,可并行[N-1]/2路;
每一次sweep需要1次Cordic:phi = atan2(y,x)/2,和两次Cordic(两次可并行):cos(phi) / (phi)二者串行。对于atan2操作可借鉴一文的思路,即对于atan的计算考虑到CORDIC耗時较长,内存资源充足的情况下1)直接查表;若内存相对紧张,2)多项式逼近二者较CORDIC均减少运算时间。