Параллельные вычисления java

1

2

Кто может подсказать как в джаве потоки распределяются по ядрам?

Конкретно интересуют 2 вопроса:

1. Отчего время выполнения подсчета суммы чисел в массиве в 4 потока по сравнению с одним потоком сильно разнится (иногда быстрее в 4 раза (как и предполагается), иногда всего в 2)?

2. Какой-нибудь язык позволяет распределять вручную по ядрам потоки? Или же этим заведует ОС?

Перемещено mono из talks

Ссылка

← Посоветуйте подход/алгоритм для объединения нескольких фигур в общий контур

Установить фокус на окно (Tkinter) →

2: http://linux.die.net/man/2/sched_setaffinity

yoghurt ★★★★★
(17.12.13 07:19:31 MSK)

Java использует системные треды. В JDK нет API для прикрепления потоков к ядрам.

maxcom ★★★★★
(17.12.13 09:24:51 MSK)

Ответ на: комментарий от yoghurt 17.12.13 07:19:31 MSK

Спасибо, почитаем!

Simtik ★
(17.12.13 09:36:07 MSK) автор топика

Ссылка

Ответ на: комментарий от maxcom 17.12.13 09:24:51 MSK

Java использует системные треды. В JDK нет API для прикрепления потоков к ядрам.

Благодарю!

Simtik ★
(17.12.13 09:36:53 MSK) автор топика

Ссылка

Или же этим заведует ОС?

Через системные вызовы.

Deleted
(17.12.13 09:48:23 MSK)

Ссылка

1. Отчего время выполнения подсчета суммы чисел в массиве в 4 потока по сравнению с одним потоком сильно разнится (иногда быстрее в 4 раза (как и предполагается), иногда всего в 2)?

для «чистых» вычислений в седьмой джаве есть отличный Fork/Join Framework (http://docs.oracle.com/javase/tutorial/essential/concurrency/forkjoin.html).
Попробуй его и сравни скорость.

kovrik ★★★★★
(17.12.13 09:58:51 MSK)

Ссылка

Отчего время выполнения подсчета суммы чисел в массиве в 4 потока по сравнению с одним потоком сильно разнится (иногда быстрее в 4 раза (как и предполагается), иногда всего в 2)?

Нужно смотреть код. Например если ты разделишь элементы, на те, у которых четные и нечетные индексы, то из-за сброса кешей не получишь практически никакого прироста производительности на такой легковесной операции как сложение массива.

Если разобьешь по частям - уже лучше. Но сложение настолько быстрая операция, что можно моментально складывать сотни мегабайт чисел, потому если массив меньше, то опять можно наткнуться на больший оверхед работы с памятью чем самих вычислений.

Ну, а если массивы составляют десятки гигабайт, тогда все будет скорее всего плавно.

Какой-нибудь язык позволяет распределять вручную по ядрам потоки? Или же этим заведует ОС?

Такое редко нужно, но когда нужно, тогда придется делать нативный вызов и писать обертку самому

Java тут ни при чем если что

~~vertexua~~ ★★★★★
(17.12.13 12:13:51 MSK)

OpenMP?

Xunnu ★★
(17.12.13 12:58:45 MSK)

Ссылка

Ответ на: комментарий от vertexua 17.12.13 12:13:51 MSK

Если разобьешь по частям - уже лучше.

Где-то слышал, что на ccNUMA архитектуре таки лучше наоборот, что бы для оного потока элементы шли не последовательно. Типа излишнее использование кешей в таких процах нагружает внтренние шины процессора. Но это так, из разряда где-то слышал :)

dizza ★★★★★
(17.12.13 23:02:40 MSK)

Ссылка

https://code.google.com/p/java-affinity-binding/

nerh
(18.12.13 04:46:03 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← Посоветуйте подход/алгоритм для объединения нескольких фигур в общий контур

Development

Установить фокус на окно (Tkinter) →

Похожие темы