Что там с 128 бит?

AVX?

pekmop1024 ★★★★★
(15.06.20 16:53:23 MSK)

Ну или какие-то другие специфические SIMD инструкции

pekmop1024 ★★★★★
(15.06.20 16:53:56 MSK)

Ссылка

Ответ на: комментарий от pekmop1024 15.06.20 16:53:23 MSK

Там 256/512 бит это вектор, а не точность вычислений.

steemandlinux ★★★★★
(15.06.20 16:55:15 MSK)

Ссылка

POWER9 купи себе. Там есть.

~~hateyoufeel~~ ★★★★★
(15.06.20 17:17:42 MSK)

Ссылка

Мне вчера Густафсон рассказывал, что 128 бит float не нужно, нужно 754й формат выбросить, и тогда всем хватит 32х(или 64х, детали забываются).

DonkeyHot ★★★★★
(15.06.20 17:23:17 MSK)

для некоторых задач численного интегрирования диффуров, где даже в double постепенно копится заметная ошибка

Деды™ придумали XSC Languages ©.

quickquest ★★★★★
(15.06.20 17:26:53 MSK)

Ответ на: комментарий от DonkeyHot 15.06.20 17:23:17 MSK

Мне вчера Густафсон рассказывал

Это про Unum? Ну да, было бы круто. Осталось в процессоры это запилить.

~~hateyoufeel~~ ★★★★★
(15.06.20 17:33:41 MSK)

Ответ на: комментарий от quickquest 15.06.20 17:26:53 MSK

А как поможет XSC, если аппаратного 128 бит нет? Имитировать то float 128 бит и фортран умеет. Только скорость страдает

cvs-255 ★★★★★
(15.06.20 17:38:03 MSK) автор топика
Последнее исправление: cvs-255 15.06.20 17:39:05 MSK (всего исправлений: 2)

Ссылка

Есть отличная библиотека QD (https://github.com/scibuilder/QD) для 128 и 256-ти битной точности. Внутри использует обычные даблы из-за чего потеря в скорости всего двух-трех кратная.

YesSSS ★★★
(15.06.20 18:18:13 MSK)

Ответ на: комментарий от YesSSS 15.06.20 18:18:13 MSK

ну на фортране то я просто указать могу -fdefault-real-16 (для gfortran). Но это, естественно, даст проигрыш в скорости. Ну а для расчетов все-таки есть разница, ждать полчаса или полтора

Неплохо бы конечно еще на GPU это все запустить дополнительно

cvs-255 ★★★★★
(15.06.20 18:22:02 MSK) автор топика
Последнее исправление: cvs-255 15.06.20 18:24:59 MSK (всего исправлений: 3)

Ответ на: комментарий от cvs-255 15.06.20 18:22:02 MSK

на GPU float’ы хреновые

slapin ★★★★★
(15.06.20 18:52:16 MSK)

Ссылка

на x86(-64) это 80 битные регистры FPU

А разве не в 32-битных инструкциях 80 бит максимум? Потому что даже на армах x64 long double - 128 бит

~~SR_team~~ ★★★★★
(15.06.20 18:59:22 MSK)

Ответ на: комментарий от cvs-255 15.06.20 18:22:02 MSK

Проигрыш по скорости от перехода 64->128 даже в случае аппаратной реализации будет, хоть и меньший. Очевидно, что верторизация будет короче, меньше чисел будет влезать в кэш и т.д. Насчёт GPU - было бы отлично, но портировать qd на это дело будет не очень просто. Как я понимаю, там есть учёт неточностей и округлений для double, которые есть в CPU. Для GPU потребуется перенастройка.

YesSSS ★★★
(15.06.20 18:59:50 MSK)

Ссылка

Ответ на: комментарий от SR_team 15.06.20 18:59:22 MSK

даже на армах x64 long double - 128 бит

Про ARM не скажу, но если я не ошибаюсь, на x86-64 банально не на чем аппаратно 128 битные float считать

cvs-255 ★★★★★
(15.06.20 19:09:45 MSK) автор топика
Последнее исправление: cvs-255 15.06.20 19:09:53 MSK (всего исправлений: 1)

Ответ на: комментарий от cvs-255 15.06.20 19:09:45 MSK

существует вот такая пепяка https://www.nextplatform.com/2018/05/24/a-peek-inside-that-intel-xeon-fpga-hybrid-chip/ на ней же можно запилить нужные тебе операции для 128-битных флоатов?

cobold ★★★★★
(15.06.20 19:22:29 MSK)

Ответ на: комментарий от cobold 15.06.20 19:22:29 MSK

Подозреваю, что fpga будет тормозно. Но штука прикольная)

Ну в общем похоже, что пока что искомого решения пока что нет, видимо надо будет подумать как лучше использовать то, что есть

cvs-255 ★★★★★
(15.06.20 19:30:39 MSK) автор топика
Последнее исправление: cvs-255 15.06.20 19:31:56 MSK (всего исправлений: 2)

Ссылка

Ответ на: комментарий от cvs-255 15.06.20 19:09:45 MSK

у меня на райзене 16 байт пишет, а не 10

#include <iostream>

int main() {
	std::cout << sizeof( long double ) << std::endl;

	return 0;
}

~~SR_team~~ ★★★★★
(15.06.20 20:56:00 MSK)

Ответ на: комментарий от SR_team 15.06.20 20:56:00 MSK

Писаться оно может что угодно, а вычисляются они как?

cvs-255 ★★★★★
(15.06.20 20:59:44 MSK) автор топика

Ответ на: комментарий от cvs-255 15.06.20 20:59:44 MSK

Хз, для моих вычислений даже точности обычного float (4 байта) хватает

~~SR_team~~ ★★★★★
(15.06.20 21:02:50 MSK)

Ответ на: комментарий от SR_team 15.06.20 21:02:50 MSK

ну как получить 128 байтные программным путем - это не вопрос. Но это будет гораздо медленнее аппратных 128 бит.

Есть разница - ждать полтора часа или полчаса

cvs-255 ★★★★★
(15.06.20 21:03:58 MSK) автор топика
Последнее исправление: cvs-255 15.06.20 21:04:14 MSK (всего исправлений: 1)

Ссылка

хранение действительных чисел в каком-то ограниченном формате будет всегда чем-то не устраивать математиков
число нужно хранить как функцию, которая для любого N генерит первые N бит этого числа
арифметические операторы + - * / будут функциями, которые принимают две функции и возвращают функцию

Egor_ ★
(15.06.20 21:08:54 MSK)

Ответ на: комментарий от Egor_ 15.06.20 21:08:54 MSK

К сожалению такой подход невозможен для численных задач

cvs-255 ★★★★★
(15.06.20 21:09:51 MSK) автор топика

Ответ на: комментарий от SR_team 15.06.20 21:02:50 MSK

В обшем да, 80бит:

DB 2D 6A 0E 00 00                             fld     cs:tbyte_2020

А по поводу того, что 16 выводит - ~~там вообще видимо константа взятая с потолка~~ это из-за выравнивания:

BE 10 00 00 00                                mov     esi, 16
48 8D 3D BB 2E 00 00                          lea     rdi, _ZSt4cout@@GLIBCXX_3_4
E8 66 FE FF FF                                call    __ZNSolsEm

А вот в армах и правда 128 бит: https://en.wikipedia.org/wiki/Long_double

~~SR_team~~ ★★★★★
(15.06.20 21:13:10 MSK)
Последнее исправление: SR_team 15.06.20 21:22:35 MSK (всего исправлений: 3)

Ссылка

Ответ на: комментарий от cvs-255 15.06.20 21:09:51 MSK

вот как раз все численные задачи после этого можно будет переписать в более простом и понятном виде
сейчас вся вычислительная математика - это сборник правил игры на бубне, чтобы «текущие абстракции» не утекли слишком далеко

Egor_ ★
(15.06.20 21:14:00 MSK)

Ссылка

А что-нибудь для более точного есть или планируется?

Реализация высокоточных вычислений в базисе модулярно-интервальной арифметики (PDF) ©.

Можно попытаться реализовать вычисления в системе остаточных классов на ARM системах, или специализированных СБИС ПЛ ©.

P.S. Ещё глянь The GNU Multiple Precision Arithmetic Library (GMP) ©.

quickquest ★★★★★
(15.06.20 21:56:59 MSK)

Ответ на: комментарий от quickquest 15.06.20 21:56:59 MSK

Ну да, тред не читай. Речь то идет именно про аппаратную поддержжку. программная то понятно что есть

cvs-255 ★★★★★
(15.06.20 22:18:15 MSK) автор топика

Ответ на: комментарий от cvs-255 15.06.20 22:18:15 MSK

Речь то идет именно про аппаратную поддержжку.

Дык ссылка на ПЛИСины намекает на аппаратную поддержку, которую сам спаяй и прошей на модулярную арифметику :)

quickquest ★★★★★
(15.06.20 22:34:19 MSK)

Ссылка

Если не нравяться готовые библиотеки, технически, что мешает замутить самодельный float тип любой произвольной точности? Будет медленно, но зато точно. Все алгоритмы работы с floating point давно известны, так что учебник в зубы и вперед…

~~qrck~~ ★★
(16.06.20 03:16:05 MSK)

Ссылка

где даже в double постепенно копится заметная ошибка

Чёт с трудом верится. Сколько точных знаков после запятой тебе надо?

no-such-file ★★★★★
(16.06.20 11:57:41 MSK)

даже в double постепенно копится заметная ошибка

Ну так ошибка будет копиться, будь там хоть 128000 бит. Для решения этой проблемы предназначены совершенно иные методы.

buddhist ★★★★★
(16.06.20 15:35:17 MSK)

Ответ на: комментарий от buddhist 16.06.20 15:35:17 MSK

А что лучше использовать для этого? У меня тмм сейчас рунге кутта-4 обычная

cvs-255 ★★★★★
(16.06.20 15:39:48 MSK) автор топика

Ответ на: комментарий от cvs-255 16.06.20 15:39:48 MSK

Ты прямо упираешься в накопление ошибки?

buddhist ★★★★★
(16.06.20 15:44:25 MSK)

Ответ на: комментарий от no-such-file 16.06.20 11:57:41 MSK

Мне нужно чтобы величина угла (0-360 градусов) считалась с точностью не хуже 1 секунды дуги. У меня же в примере, где должен получаться строгий 0, т.к. в этом случае должна интегрироваться производная от 1 (т.е. 0), а получается 64 секунды дуги, причем ошибка получается именно из за погрешностей double

cvs-255 ★★★★★
(16.06.20 15:52:52 MSK) автор топика
Последнее исправление: cvs-255 16.06.20 15:54:52 MSK (всего исправлений: 2)

Ответ на: комментарий от buddhist 16.06.20 15:44:25 MSK

Да, у меня копится ошибка вычислений в double

У меня есть функция заданная на сетке, а между узлами провожу интерполяцию. И даже если я на всей сетке я задам 1, то интерполяция дает не строго 1. И эта ошибка копится

cvs-255 ★★★★★
(16.06.20 15:57:13 MSK) автор топика
Последнее исправление: cvs-255 16.06.20 15:59:17 MSK (всего исправлений: 2)

Ссылка

А задача на GPU вообще ложится? Если да, то я бы всё-таки покопал в сторону GPU с ручной реализацией арфиметики достаточной точности, ибо замедление из-за софтовой арифметики может уравновеситься параллельностью GPU.

slovazap ★★★★★
(16.06.20 18:13:27 MSK)
Последнее исправление: slovazap 16.06.20 18:13:53 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от cvs-255 16.06.20 15:52:52 MSK

Мне нужно чтобы величина угла (0-360 градусов) считалась с точностью не хуже 1 секунды дуги

Т.е. порядка 10^-6. Остаётся запаc порядка 10^9. У тебя столько операций?

У меня тмм сейчас рунге кутта-4 обычная

Так может у тебя просто шаг недостаточно мелкий?

no-such-file ★★★★★
(16.06.20 18:26:10 MSK)

Ответ на: комментарий от no-such-file 16.06.20 18:26:10 MSK

Ошибки самого рунге кутты это другая тема.

Суммарно шагов порядка 10^5 - 10^6

cvs-255 ★★★★★
(16.06.20 19:35:09 MSK) автор топика
Последнее исправление: cvs-255 16.06.20 19:36:54 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от hateyoufeel 15.06.20 17:33:41 MSK

Это про Unum?

Это что?

ls-h ★★★★★
(16.06.20 21:43:15 MSK)

Ответ на: комментарий от ls-h 16.06.20 21:43:15 MSK

https://en.m.wikipedia.org/wiki/Unum_(number_format)

~~hateyoufeel~~ ★★★★★
(17.06.20 01:05:40 MSK)

Ответ на: комментарий от SR_team 15.06.20 18:59:22 MSK

Потому что даже на армах x64 long double - 128 бит

Удивил, полез гуглить.

https://en.wikipedia.org/wiki/ARM_architecture

«Floating point: 32 × 128-bit registers[1] for scalar 32- and 64-bit FP or SIMD FP»

Т.е. там тупо нет аппаратных скалярных 80-бит => поэтому приходится long double делать софтверно => разницы перформанса между софтовым 80 бит и 128 бит наверняка нет => ну тогда пусть будет 128 бит.

Вообщем, не засчитывается.

snizovtsev ★★★★★
(17.06.20 18:34:39 MSK)

Ссылка

Ответ на: комментарий от Egor_ 15.06.20 21:08:54 MSK

И обломаться на интегралах

next_time ★★★★★
(18.06.20 12:52:26 MSK)
Последнее исправление: next_time 18.06.20 12:54:54 MSK (всего исправлений: 1)

Ответ на: комментарий от hateyoufeel 17.06.20 01:05:40 MSK

en.m.wikipedia.org

За такое нужно банить безжалостно. Ну в чём проблема убрать эту «m» когда копируешь ссылку?

eternal_sorrow ★★★★★
(20.06.20 10:35:46 MSK)
Последнее исправление: eternal_sorrow 20.06.20 10:36:03 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от Egor_ 15.06.20 21:08:54 MSK

а теперь вспоминаем, что большая часть действительных чисел транстцендентные и обламываемся

eternal_sorrow ★★★★★
(20.06.20 10:39:01 MSK)

Ответ на: комментарий от next_time 18.06.20 12:52:26 MSK

почему «обломаться»?
вычисление определённого интеграла будет такой же функцией (по заданной точности вычисляет первые биты результата)

Egor_ ★
(01.07.20 03:19:16 MSK)

Ответ на: комментарий от eternal_sorrow 20.06.20 10:39:01 MSK

большая часть действительных чисел транстцендентные и обламываемся

и что?
трансцендентные числа - это те, которые не являются корнями алгебраических уравнений
это никак не мешает их вычислять с любой заданной точностью

Egor_ ★
(01.07.20 03:22:17 MSK)

Ссылка

Ответ на: комментарий от Egor_ 01.07.20 03:19:16 MSK

по заданной точности вычисляет первые биты результата

вот поэтому - всё равно приходим к необходимости получить результат в численном виде с некоторой точностью

next_time ★★★★★
(01.07.20 13:20:21 MSK)

Ответ на: комментарий от next_time 01.07.20 13:20:21 MSK

а никто от этой необходимости и не уходил
функция - это лишь удобный промежуточный вид для работы с числами, когда ты не знаешь заранее, сколько бит числа тебе понадобятся при расчётах
и особенно это актуально для длинных алгоритмов (хороший пример: численное интегрирование)

Egor_ ★
(02.07.20 06:11:11 MSK)

Ссылка

Похожие темы