numpy на одинаковых данных даёт немного разный результат

2

4

Заметил странную особенность numpy - разный результат на одних и тех же данных.

import numpy as np

A = np.random.normal(size=(100, 10000))
B = np.random.normal(size=(10000, 100))

Z1 = np.dot(A, B)
Z2 = np.dot(A, B)

print("A.dtype: %s\nB.dtype: %s" % (A.dtype, B.dtype))
np.testing.assert_almost_equal(Z1, Z2, 13)

output:

A.dtype: float64
B.dtype: float64
..................
AssertionError:
Arrays are not almost equal to 13 decimals

(mismatch 0.02%)
 x: array([[  57.7906116662244,  -23.0575175462736, -199.5869048134938, ...,
         -60.9155744929318,   81.7378975172054,  -29.3638802800916],
       [  90.6673561120846,   75.8409703042503,   81.313634897308 , ...,...
 y: array([[  57.7906116662244,  -23.0575175462736, -199.5869048134938, ...,
         -60.9155744929318,   81.7378975172054,  -29.3638802800916],
       [  90.6673561120846,   75.8409703042503,   81.313634897308 , ...,...

Почему так? Может дело в особенностях параллельного BLAS или Lapack? Неопределенная последовательность суммирования элементов при вычислении матричного произведения?

Такой вариант дает еще больше отличий

Z2 = np.dot(B.T, A.T).T

Ссылка

←	QT печать размер страницы

не собирается media-gfx/openvdb

→

Хм, проверил на двух интеловых тачках, у меня всё нормально. Какой дистр, какой проц?

Но да, если там всякие паралельные оптимизации то могут быть проблемы. Я внутрях BLAS не копался, может, там можно его настраивать через переменные окружения или флаги сборки.

true_admin ★★★★★
(15.04.15 19:38:29 MSK)

Ответ на: комментарий от true_admin 15.04.15 19:38:29 MSK

Хм, не подумал, что дистр влияет. Заметил это под XP. Под убунту все ок на том же самом компе. Python 2.7, но BLAS/Lapack скорее всего разные.

А вот с транспонированными все равно не совпадает. Но там трудно ждать другого.

Bell
(15.04.15 19:56:28 MSK) автор топика

Ссылка

Проверил - все нормально. Совет, как и в другом треде на днях - хватит использовать дистрибутивные говносборки для научных вычислений. Есть EPD и бесплатная Anaconda, где все собрано правильно.

ptarh ★★★★★
(15.04.15 20:05:55 MSK)

Ответ на: комментарий от ptarh 15.04.15 20:05:55 MSK

Совет-то наверное в принципе правильный, но эта фигня как раз под Анакондой, а под дистрибутивной - ок :)

Bell
(15.04.15 20:10:25 MSK) автор топика

Ответ на: комментарий от Bell 15.04.15 20:10:25 MSK

Проверено под анакондой, правда, на py3-ветке. Все тихо.

ptarh ★★★★★
(15.04.15 20:11:46 MSK)

Ответ на: комментарий от ptarh 15.04.15 20:11:46 MSK

Я припоминаю, что мог отдельно проапгрейдить numpy, так что у меня может быть не чисто анакондная сборка.

Bell
(15.04.15 20:15:24 MSK) автор топика

Ответ на: комментарий от Bell 15.04.15 20:15:24 MSK

Ммм, а что говорит conda search numpy?

ptarh ★★★★★
(15.04.15 20:18:51 MSK)

Ответ на: комментарий от ptarh 15.04.15 20:18:51 MSK

numpy (1.9.2)

а дефолтный для py2.7 кажется был 1.8

Bell
(15.04.15 20:24:39 MSK) автор топика

Ответ на: комментарий от Bell 15.04.15 20:24:39 MSK

conda update conda

conda update anaconda

Проведи ка эти операции. В принципе, он лихо даунгрейдит все, что ему не подходит.

ptarh ★★★★★
(15.04.15 20:26:04 MSK)
Последнее исправление: ptarh 15.04.15 20:29:56 MSK (всего исправлений: 1)

Ответ на: комментарий от ptarh 15.04.15 20:26:04 MSK

Спасибо. Сделал так, но он наоборот проапгрейдил кучу других пакетов. Подозреваю, что из-за numpy. Наверно не надо было апгрейдить numpy через pip. Зачем-то я это сделал, но не могу вспомнить, зачем. Я лучше снесу и переставлю Анаконду, так будет проще. Скажи, а с транспонированными результат не совпадает?

Z2 = np.dot(B.T, A.T).T

Bell
(15.04.15 20:56:30 MSK) автор топика

Ответ на: комментарий от Bell 15.04.15 20:56:30 MSK

Сделал так, но он наоборот проапгрейдил кучу других пакетов.

Он апгрейдит всегда до последнего среза, последний срез с numpy 1.9.2 Но увидит ли он numpy, поставленный через pip, действительно не знаю - pip пользоваться явно не стоит. Переставлять не нужно, можно просто в virtualenv залить еще один и переключать. Хотя, переставить его с нуля может быть быстрее, чем возиться с ветками.

Скажи, а с транспонированными результат не совпадает?

Не совпадает.

ptarh ★★★★★
(15.04.15 21:02:19 MSK)
Последнее исправление: ptarh 15.04.15 21:03:11 MSK (всего исправлений: 1)

Ссылка

Может ошибка процессора? Нет отличий.

ziemin ★★
(15.04.15 21:07:26 MSK)

Ответ на: комментарий от ziemin 15.04.15 21:07:26 MSK

Под убунту у меня тоже без отличий на том же проце. Я сейчас полностью переставлю Анаконду и отпишусть.

Bell
(15.04.15 21:14:35 MSK) автор топика

Ответ на: комментарий от Bell 15.04.15 21:14:35 MSK

Проверил со свежей Анакондой. Та же фигня. Так что дело, похоже, в XP. Мне это не мешает, просто любопытно, отчего так.

Bell
(15.04.15 21:41:11 MSK) автор топика

Ссылка

numpy может использовать несколько вариантов реализаций BLAS. От это и будет зависеть результат работы. В твоём случае, вполне возможно используются параллельные алгоритмы, а результат зависит от порядка «сложения» результатов подзадач (а этот порядок близок к случайному).

В связи с чем, обновлять numpy через pip - достаточно глупая идея. Его «готовить» надо ручками, указывая (как минимум) желаемую версию BLAS.

AlexVR ★★★★★
(16.04.15 11:01:05 MSK)

Посмотри на результат при

export OMP_NUM_THREADS=1

AlexVR ★★★★★
(16.04.15 11:03:20 MSK)

Ссылка

Для понимания первоисточника проблемы: https://ru.wikipedia.org/wiki/Алгоритм_Кэхэна

AlexVR ★★★★★
(16.04.15 11:15:14 MSK)

Ссылка

Ответ на: комментарий от AlexVR 16.04.15 11:01:05 MSK

В связи с чем, обновлять numpy через pip - достаточно глупая идея. Его «готовить» надо ручками, указывая (как минимум) желаемую версию BLAS.

Как уже выяснилось, дело не в pip - на свежей Анаконде тот же эффект. Однако с OMP_NUM_THREADS=1 у меня полное совпадение. Но это тоже несколько странно - что, у всех отписавшихся здесь однопоточный BLAS? По умолчанию так не должно быть.

Bell
(16.04.15 12:40:52 MSK) автор топика

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	QT печать размер страницы

Development

не собирается media-gfx/openvdb

→

Похожие темы