Для тех, кто ищет быструю библиотеку «BLAS» для подпрограмм базовой линейной алгебры, теперь доступна оптимизированная реализация OpenBLAS 0.3.31 с открытым исходным кодом.
В OpenBLAS 0.3.31 добавлены расширения BFloat16 для BGEMM и BGEMV (эти процедуры выполняют умножение матриц и умножение матриц на векторы), другие новые расширения BLAS, пороговое значение размера задачи для многопоточности с различными ядрами, улучшено автоматическое определение компилятора Fortran, а также внесен ряд исправлений в систему сборки CMake для различных платформ, от Windows до FreeBSD.
OpenBLAS 0.3.31, как и большинство их релизов, также содержит ряд новых оптимизаций производительности, специфичных для процессоров. Появились новые оптимизации производительности RISC-V для целевых платформ ZVL128B и ZVL256B, а также улучшено определение RISC-V RVV 1.0. Для ARM64 также были внесены улучшения в производительность многопоточности. Кроме того, теперь доступно автоматическое определение SoC Apple M на Linux, а также процессоров AmpereOne.>>> Исходный код OpenBLAS на GitHub
OpenBLAS 0.3.31



