Асинхронный и синхронный i/o и планировщик ядра

1

1

Асинхронная или синхронная операция ввода/вывода приводит к вызову syscall, что всегда приводит к вызову планировщика задач ядра. Правильно? Если так, то на загруженной системе вызов что асинхронной, что синхронной операции приведёт к тому, что квант времени с большой вероятностью будет передан другому, более приоритетному процессу. Тогда в чём профит от асинхронных операций в данном случае?

UPD: Всякий ли системный вызов может привести к вытеснению планировщиком ядра текущего таска?

Ссылка

←	Вопрос по машине тьюринга

Стандарт оказался неудобным, i j

→

Это упражнение в софистике или искренний ГСМ?

tailgunner ★★★★★
(02.05.14 15:43:25 MSK)

Ответ на: комментарий от tailgunner 02.05.14 15:43:25 MSK

Странно что еще «рунет головного мозга» не стал мемом :)
Мне просто лениво копаться в исходниках ядра.

Запись на неблокирующем сокете (вызов апишной ф-ии) в половине случаев длилась 10 мс на загруженной системе, хотя на системе без загрузки всегда проходила без таких задержек. Вот откуда и возникла такая гипотеза.

nerdogeek ★
(02.05.14 15:51:38 MSK) автор топика

Ответ на: комментарий от nerdogeek 02.05.14 15:51:38 MSK

Рассказал бы что, куда и как записываешь

~~stopitplease~~
(02.05.14 15:53:05 MSK)

во-первых, не факт что в результате сисколла твой тред будет вытеснен, во-вторых, при получении нового кванта твой тред сможет выполнять другую работу. то, что тред может быть а может и не быть вытеснен никак не влияет на сравнение блокирующего и асинхронного io.

val-amart ★★★★★
(02.05.14 15:55:41 MSK)

Ответ на: комментарий от stopitplease 02.05.14 15:53:05 MSK

На самом деле это воспроизводится на большинстве вызовов posix api, кроме таких как getpid(), gettimeofday() и некоторых других, которые вообще не приводят к системному вызову (на современных линуксовых ядрах).

nerdogeek ★
(02.05.14 15:56:05 MSK) автор топика

Ответ на: комментарий от nerdogeek 02.05.14 15:51:38 MSK

Мне просто лениво копаться в исходниках ядра.

Исходники ядра не имеют никакого отношения к делу. У тебя в хедпосте логическая дыра.

tailgunner ★★★★★
(02.05.14 15:56:12 MSK)

приводит к вызову syscall, что всегда приводит к вызову планировщика задач ядра. Правильно?

Лично у меня есть сомнения по поводу верности этого утверждения.

~~nanoolinux~~ ★★★★
(02.05.14 15:59:02 MSK)

Ссылка

Ответ на: комментарий от nerdogeek 02.05.14 15:51:38 MSK

неблокирующей или асинхронной? это разные вещи. 10 мс это овер дофига, это возможно только если есть огромное количество конкурирующих потоков или если планировщик по какой-то причине отдает предпочтение не тебе.

val-amart ★★★★★
(02.05.14 15:59:21 MSK)

Ответ на: комментарий от val-amart 02.05.14 15:55:41 MSK

не факт что в результате сисколла твой тред будет вытеснен

Вот это интересно. Т.е. вероятность такая всё-таки имеется?

никак не влияет на сравнение блокирующего и асинхронного io

Согласен. Наверно лучше было мне задать вопрос про худший случай для асинхронного i/o, когда каждая операция длится как минимум квант времени.

nerdogeek ★
(02.05.14 16:01:16 MSK) автор топика

Ответ на: комментарий от nerdogeek 02.05.14 15:56:05 MSK

getpid() ... не приводят к системному вызову

4.2 getpid это 100% сисколл, процесс не может сам прочитать свой заголовок. другой вопрос, что glibc кеширует результат.

val-amart ★★★★★
(02.05.14 16:02:27 MSK)

Ответ на: комментарий от val-amart 02.05.14 15:59:21 MSK

Неблокирующей. Но воспроизводится и на других сисколлах.

nerdogeek ★
(02.05.14 16:03:25 MSK) автор топика

Ссылка

Ответ на: комментарий от nerdogeek 02.05.14 16:01:16 MSK

Вот это интересно. Т.е. вероятность такая всё-таки имеется?

насколько я помню, в линуксе имеется. в Соляре и BSD точно имеется, но вероятность зависит от того как близко ты подошел к грунице своего кванта времени. за линукс 100% не скажу, тем более что планировщиков-то много.

val-amart ★★★★★
(02.05.14 16:04:21 MSK)

Ссылка

Ответ на: комментарий от tailgunner 02.05.14 15:56:12 MSK

У тебя в хедпосте логическая дыра.

Да есть такое. Поставлю вопрос иначе:

Всякий ли системный вызов может привести к вытеснению планировщиком ядра текущего таска?

nerdogeek ★
(02.05.14 16:05:31 MSK) автор топика
Последнее исправление: nerdogeek 02.05.14 16:08:43 MSK (всего исправлений: 1)

Ответ на: комментарий от nerdogeek 02.05.14 16:05:31 MSK

Всякий ли системный вызов может привести к вытеснению планировщиком ядра текущего таска?

Да. Но это бесполезный вопрос. Полезный вопрос - а при каких условиях происходит вытеснение?

tailgunner ★★★★★
(02.05.14 16:11:15 MSK)

Ответ на: комментарий от tailgunner 02.05.14 16:11:15 MSK

http://oreilly.com/catalog/linuxkernel/chapter/ch10.html#23782

Похоже нашел ответ на свой вопрос. Получается что сисколл не особо на что влияет в случае когда появляется готовый к выполнению процесс с большим динамическим приоритетом. По крайней мере код планировщика ядра не вызывается на каждый чих.

nerdogeek ★
(02.05.14 18:27:16 MSK) автор топика

Ответ на: комментарий от nerdogeek 02.05.14 18:27:16 MSK

Не вижу там ответа на твой вопрос, но я рад, что ты его нашел.

tailgunner ★★★★★
(02.05.14 18:34:32 MSK)

Если я правильно понимаю, то асинхронность означает «не ждать завершения IO». То, что может произойти переключение на другую задачу — вроде бы другой вопрос.

intelfx ★★★★★
(02.05.14 18:36:39 MSK)

Ссылка

Ответ на: комментарий от tailgunner 02.05.14 18:34:32 MSK

Планировщик активируется если процесс истратил квант времени, либо вызвал явно блокирующую операцию, либо появился готовый процесс с более высоким приоритетом. А сисколл тоже затратная операция, но без явного форсирования перепланировщика.

Что такое kernel preemption ?

Нашел этот пост. Блин, чувак, скока ты уже под линукс девелопишь? Лет десять уже наверно? :)

nerdogeek ★
(02.05.14 19:25:44 MSK) автор топика

Ответ на: комментарий от nerdogeek 02.05.14 19:25:44 MSK

сисколл тоже затратная операция, но без явного форсирования перепланировщика.

По крайней мере раньше при выходе из сисколла проверялось, не надо ли переключиться на другой процесс, поэтому любой сисколл мог закончиться перепланированием.

Лет десять уже наверно? :)

Почти 15

tailgunner ★★★★★
(02.05.14 19:33:29 MSK)

Ссылка

Асинхронная операция записи/чтения возвращается, когда запрос ставится в очередь.
Синхронная операция записи возвращается, когда данные записаны как минимум в буфер ядра.
Синхронная операция чтения возвращается, когда данные будут прочитаны в буфер.

Планировщик CFS, например, при прочих равных может выполнить первым тот процесс, у которого меньше использованного процессорного времени на данный момент.

tuxin ★
(03.05.14 14:04:41 MSK)

Ссылка

Ответ на: комментарий от nerdogeek 02.05.14 16:01:16 MSK

Т.е. вероятность такая всё-таки имеется?

В линуксе ты вообще не можешь делать никаких допущений по поводу того когда твой код получит процессорное время. Т.е., ответ «да».

true_admin ★★★★★
(03.05.14 15:02:58 MSK)

Ссылка

Ответ на: комментарий от val-amart 02.05.14 16:02:27 MSK

4.2 getpid это 100% сисколл

Вот тут пишут что нет: http://cvs.schmorp.de/libev/ev.pod?revision=1.433&view=markup

Щас посмотрю сырцы libc....

true_admin ★★★★★
(03.05.14 15:06:19 MSK)

Ссылка

в чём профит от асинхронных операций

В том что когда у тебя 10к клиентов тебе не надо делать 10k нитей для их обслуживания.

true_admin ★★★★★
(03.05.14 15:07:37 MSK)

Ответ на: комментарий от val-amart 02.05.14 16:02:27 MSK

Из мана:

Since glibc version 2.3.4, the glibc wrapper function for getpid()
caches PIDs, so as to avoid additional system calls when a process
calls getpid() repeatedly.

true_admin ★★★★★
(03.05.14 15:13:11 MSK)

Ответ на: комментарий от true_admin 03.05.14 15:07:37 MSK

когда у тебя 10к клиентов тебе не надо делать 10k нитей для их обслуживания.

А от этого профит в чем?

tailgunner ★★★★★
(03.05.14 15:17:57 MSK)

Ответ на: комментарий от tailgunner 03.05.14 15:17:57 MSK

Так будет быстрее и меньше будет жрать ресурсов.

Как я себе это вижу:

1. Не нужно держать кучу scheduling entities, меньше нагрузка на планировщик, меньще переключений контекста (или как это для нитей называется), выше отзывчивость тачки

1. Кол-во нитей в системе раньше было существенно ограничено, сколько сейчас нитей можно создать я не знаю.

1. Не нужен отдельный стэк на каждую нить.

1. Более оптимальное использование кэшей проца.

1. Возможно, меньше проблем с синхронизацией кода.

Вот что я могу вспомнить с-ходу.

true_admin ★★★★★
(03.05.14 15:33:17 MSK)

Ответ на: комментарий от true_admin 03.05.14 15:13:11 MSK

Щас посмотрю сырцы libc....

Из мана: ... the glibc wrapper function for getpid() caches PIDs

4.2 getpid это 100% сисколл, процесс не может сам прочитать свой заголовок. другой вопрос, что glibc кеширует результат.

glibc кеширует результат.

ожидал от тебя большего ;P

val-amart ★★★★★
(03.05.14 15:48:57 MSK)

Ссылка

Ответ на: комментарий от true_admin 03.05.14 15:33:17 MSK

Не нужно держать кучу scheduling entities, меньше нагрузка на планировщик

Это всё никуда не девается. Ну, будет у тебя планировщик в сервере.

меньще переключений контекста

Ок.

Не нужен отдельный стэк на каждую нить.

Не довод. Стек можно уменьшить до 8к - будет у тебя 80М на стеки - это что, критично?

Более оптимальное использование кэшей проца.

Не вижу, за счет чего.

Возможно, меньше проблем с синхронизацией кода.

В чисто асинхронном сервере - возможно.

tailgunner ★★★★★
(03.05.14 15:52:45 MSK)

Ответ на: комментарий от tailgunner 03.05.14 15:52:45 MSK

Это всё никуда не девается. Ну, будет у тебя планировщик в сервере.

Он может быть устроен гораздо проще. Потом, можно и без планировщика (что не есть гуд, конечно).

Стек можно уменьшить до 8к - будет у тебя 80М на стеки - это что, критично?

Более оптимальное использование кэшей проца.

Не вижу, за счет чего.

Моя гипотеза в том что с каждым потоком ассоциированы какие-то данные которые активно используются (стэк, различные таблицы на стороне ядра итп). Чем больше нитей тем больше размер активно используемой памяти, что не есть гуд для кэша. На сколько это актуально для современных серверных процов я не знаю. Наверно, есть бенчмарки на эту тему. Щас погуглю, поставлю и посмотрю что будет. Вернее, вечером посмотрю, щас киношку смотрю.

Вообще, мне сама идея создать овердохрена потоком очень не нравится. Но на современном железе это работает.

true_admin ★★★★★
(03.05.14 16:08:00 MSK)

Ссылка

Ответ на: комментарий от tailgunner 03.05.14 15:17:57 MSK

man 10k problem: http://ru.wikipedia.org/wiki/Проблема_10000_соединений

DiKeert ★★
(04.05.14 14:53:04 MSK)

Ответ на: комментарий от DiKeert 04.05.14 14:53:04 MSK

Вот еще по той же проблеме: http://www.kegel.com/c10k.html

DiKeert ★★
(04.05.14 14:56:29 MSK)

Ссылка

Ответ на: комментарий от DiKeert 04.05.14 14:53:04 MSK

man 10k problem: http://ru.wikipedia.org/wiki/Проблема_10000_соединений

Ты, конечно, знаешь, сколько лет этой статье?

tailgunner ★★★★★
(04.05.14 15:03:30 MSK)

Ответ на: комментарий от tailgunner 04.05.14 15:03:30 MSK

Несмотря на количество лет, проблема до сих пор акутальна. Ну как актуальна, epoll решает, на нем работает nginx и libevent используемый в Node.js, поэтому проблема как-бэ решена, для тех кто в теме.

DiKeert ★★
(04.05.14 15:09:55 MSK)

Ссылка

Ответ на: комментарий от tailgunner 04.05.14 15:03:30 MSK

Вот еще интересные мысли на тему http://highscalability.com/blog/2013/5/13/the-secret-to-10-million-concurrent...

DiKeert ★★
(04.05.14 15:15:15 MSK)

Ответ на: комментарий от DiKeert 04.05.14 15:15:15 MSK

Несмотря на количество лет, проблема до сих пор акутальна. Ну как актуальна, epoll решает, на нем работает nginx и libevent используемый в Node.js, поэтому проблема как-бэ решена

Причем решена она уже довольно много лет назад.

Вот еще интересные мысли на тему http://highscalability.com/blog/2013/5/13/the-secret-to-10-million-concurrent...

Don’t let the kernel do all the heavy lifting. Take packet handling, memory management, and processor scheduling out of the kernel and put it into the application, where it can be done efficiently. Let Linux handle the control plane and let the the application handle the data plane.

Да, офигенно интересно.

tailgunner ★★★★★
(04.05.14 15:25:24 MSK)

Ответ на: комментарий от tailgunner 04.05.14 15:25:24 MSK

Причем решена она уже довольно много лет назад.

Тогда мне непонятен твой вопрос о профите того, что ненужно 10к тредов на 10к соединений держать.

Да, офигенно интересно.

Ну, наверное, на определенной стадии выжимания из железа всего чего возможно дойдешь и до такого. Не удивлюсь, если в гугле народ что-нибудь эдакое делает. Oracle, опять же, умеет использовать неразмеченные разделы в своих целях, что бы устранить оверхед от драйверов FS. Полно примеров. Если результатом таких хаков оказывается то, что тебе достаточно 100 серверов, там, где раньше надо было 10к серверов, имхо они вполне уместны.

DiKeert ★★
(04.05.14 15:43:53 MSK)

Ответ на: комментарий от DiKeert 04.05.14 15:43:53 MSK

Тогда мне непонятен твой вопрос о профите того, что ненужно 10к тредов на 10к соединений держать.

А мне непонятно, зачем для всего 10k соединений нужно озабочиваться асинхронностью.

Если результатом таких хаков оказывается то, что тебе достаточно 100 серверов, там, где раньше надо было 10к серверов, имхо они вполне уместны.

Если. Часто ли используются те же сырые разделы для Oracle.

tailgunner ★★★★★
(04.05.14 15:52:18 MSK)

Ответ на: комментарий от tailgunner 04.05.14 15:52:18 MSK

А мне непонятно, зачем для всего 10k соединений нужно озабочиваться асинхронностью.

Ах вон оно что =). Ну я по умолчанию считаю, что когда мы говорим о асинхронности, то мы говорим о нагрузке в 60к-80к и больше конкурентных соединений. Для 10к соединений ессно не имеет смысла заморачиваться.

Часто ли используются те же сырые разделы для Oracle.

Я за свою деятельность ни разу не видел. Это должен быть какой-то совсем лютый ынтырпрайз.

DiKeert ★★
(04.05.14 15:56:00 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Вопрос по машине тьюринга

Development

Стандарт оказался неудобным, i j

→

Похожие темы