Memory Allocator

0

0

Вообщем есть tcp server критичный очень, использует он libc-ный malloc. Суть в том что например в glibc аллокатор убогий. То есть нужен свой, по сему вопрос - я подумал и решил делать его на mmap, НО как будет с кроссплатформенностью ? Этот сервер возможно понадобится в будующем и на *bsd.

Делать на mmap ? или что посоветуете ?

PS у меня задумка следующая, выделить кусок на мелкие чанки, и кусок на большие (которые редко высвобождаются.маллочатся), для описания структуры использовать splay tree для мелких кусков, и обычный linked list для больших.

Что думает all по сабжу ?

Ссылка

← Библиотека распознавания текста

Java, вывод из созданного процесса на консоль →

длина сессии как-то ограничена?

dilmah ★★★★★
(18.04.07 16:15:53 MSK)

Ответ на: комментарий от dilmah 18.04.07 16:15:53 MSK

>длина сессии как-то ограничена?

нет

alphex_kaanoken ★★★
(18.04.07 16:17:25 MSK) автор топика

Ссылка

зачем?

есть hoard memory allocator, отлично работающий в *многопоточных* системах, т.е. для серверов идеальный вариант.

p/s

а вообще если самопалом заниматься, то нужно юзать self-balanced tree для больших кусков и двусвязный список с boundary tags для мелких, как это сделано в doug's lea malloc. (его кстати тоже можно попробовать поюзать, он меганастраиваемый, но если память будет активно выделяться/освобождаться в процессах/тредах, то луше хордовский юзать).

asgard ★
(18.04.07 16:17:38 MSK)

Кое-кто из all думает, что аллокаторов изобретено уже до фига всяких, и не стоит изобретать велосипед.

tailgunner ★★★★★
(18.04.07 16:17:45 MSK)

только лишь на bsd или же на Solaris или ещё какие нить unix`ы. просто в солярке например всё совсему убого.

luch
(18.04.07 16:19:07 MSK)

+ сплей лучше не использовать, у него баланс шаткий очень - при малейшем нарушение серьёзно пострадает производительность. имхо, лучше avl or rb

asgard ★
(18.04.07 16:19:34 MSK)

Ответ на: комментарий от asgard 18.04.07 16:17:38 MSK

>зачем?

чтобы быть уверенным ;)

>то нужно юзать self-balanced tree для больших кусков и двусвязный список с boundary tags для мелких,

еще раз - мелкие, с ними работа идет чаще - тут splay tree сам доктор прописал, больших кусков мало - соотвественно там дерево не критично.

alphex_kaanoken ★★★
(18.04.07 16:19:53 MSK) автор топика

Ответ на: комментарий от luch 18.04.07 16:19:07 MSK

> в солярке например всё совсему убого.

http://developers.sun.com/solaris/articles/multiproc/multiproc.html

asgard ★
(18.04.07 16:20:47 MSK)

Ссылка

Ответ на: комментарий от tailgunner 18.04.07 16:17:45 MSK

>Кое-кто из all думает, что аллокаторов изобретено уже до фига всяких, и не стоит изобретать велосипед.

ссылки, ссылки сестра ;) ах да их много, только большинство убогие.

alphex_kaanoken ★★★
(18.04.07 16:21:18 MSK) автор топика

Ответ на: комментарий от asgard 18.04.07 16:19:34 MSK

>+ сплей лучше не использовать, у него баланс шаткий очень - при малейшем нарушение серьёзно пострадает производительность. имхо, лучше avl or rb

есть вероятность - но при большом n

alphex_kaanoken ★★★
(18.04.07 16:22:05 MSK) автор топика

Ссылка

Ответ на: комментарий от alphex_kaanoken 18.04.07 16:19:53 MSK

> еще раз - мелкие, с ними работа идет чаще - тут splay tree сам доктор прописал

тут-то дерево как раз даст тебе производительность хуже списка. дерево удобно юзать при сплитинге и объединении кусков. мелкие куски будут выделяться чаще - да, в этом и весь подвох. при каждом выделении такого куска из дерева дерево придётся ребалансить.

asgard ★
(18.04.07 16:22:23 MSK)

Ответ на: комментарий от asgard 18.04.07 16:22:23 MSK

>да, в этом и весь подвох. при каждом выделении такого куска из дерева дерево придётся ребалансить.

представь, хорошо представь splay tree и что вверху и почему именно оно будет так работать ;) подумай ... я тоже сначала сомневался - потом провел эксперимент - на деле все не так, splay tree подходит как нельзя лучше.

alphex_kaanoken ★★★
(18.04.07 16:24:33 MSK) автор топика

Ответ на: комментарий от alphex_kaanoken 18.04.07 16:21:18 MSK

> ах да их много, только большинство убогие.

http://www.hoard.org/

http://rtportal.upv.es/rtmalloc/allocators/dlmalloc/index.shtml

asgard ★
(18.04.07 16:25:37 MSK)

Ссылка

ах да - забыл - не будет у меня тредов - у меня пул форков и сплошные select

alphex_kaanoken ★★★
(18.04.07 16:26:17 MSK) автор топика

Ответ на: комментарий от alphex_kaanoken 18.04.07 16:24:33 MSK

> представь, хорошо представь splay tree и что вверху и почему именно оно будет так работать ;) подумай ... я тоже сначала сомневался - потом провел эксперимент - на деле все не так, splay tree подходит как нельзя лучше.

1) да, наверху будут наиболее часто используемые куски, НО это улучшит только процесс поиска - не более, причём выигрыша от этого ты большого не получишь. вся суть в процессе выделения и освобождения. *каждый* раз будут производится ребалансик дерева, а поскольку splay tree не полностью self-balanced, это повышает риск того, что баланс собьётся. ne worst case issue with the basic splay tree algorithm is that of sequentially accessing all the elements of the tree in the sort order. This leaves the tree completely unbalanced (this takes n accesses- each an O(log n) operation)

http://en.wikipedia.org/wiki/Splay_tree

2) т.о. выделение куска из дерева позволит тебе только потерять но никак не выиграть в производительности, посему вариант для мелких кусков с одним листом или несколькими квик-листами гораздо быстрее

asgard ★
(18.04.07 16:32:27 MSK)

Ответ на: комментарий от alphex_kaanoken 18.04.07 16:26:17 MSK

> ах да - забыл - не будет у меня тредов - у меня пул форков и сплошные select

не суть. форки-то есть. если память будет выделяться и освобождаться во многих "клонах" - то однозначно хорд.

asgard ★
(18.04.07 16:33:21 MSK)

Ответ на: комментарий от asgard 18.04.07 16:33:21 MSK

>не суть. форки-то есть. если память будет выделяться и освобождаться во многих "клонах" - то однозначно хорд.

во многих клонах - ключевое слово - они сами по себе самостоятельны - так что тут не суть уже для "однопоточного" или для "многопоточного".

alphex_kaanoken ★★★
(18.04.07 16:41:27 MSK) автор топика

Ответ на: комментарий от asgard 18.04.07 16:32:27 MSK

>1) да, наверху будут наиболее часто используемые куски, НО это улучшит только процесс поиска - не более, причём выигрыша от этого ты большого не получишь. вся суть в процессе выделения и освобождения. *каждый* раз будут производится ребалансик дерева, а поскольку splay tree не полностью self-balanced, это повышает риск того, что баланс собьётся. ne worst case issue with the basic splay tree algorithm is that of sequentially accessing all the elements of the tree in the sort order. This leaves the tree completely unbalanced (this takes n accesses- each an O(log n) operation)

Да знаю я что тебе не нравятся сплеи ;) вот именно что суть в выделении/освобождении - это ж поиск - не так ли ? Или ты про что тут пытаешься загнать ? ;)

>2) т.о. выделение куска из дерева позволит тебе только потерять но никак не выиграть в производительности, посему вариант для мелких кусков с одним листом или несколькими квик-листами гораздо быстрее

лист - высвобождаем такой то указатель - и вперед несемся n-раз до него - очень "быстро", с учетом того что у меня вверху будут в сплее часто юзаемые чанки, сам понимаешь ... , составление динамически квик листов ~= балансировке дерева - это надеюсь более менее понятно ? ;)

alphex_kaanoken ★★★
(18.04.07 16:44:59 MSK) автор топика

Ответ на: комментарий от alphex_kaanoken 18.04.07 16:41:27 MSK

> во многих клонах - ключевое слово - они сами по себе самостоятельны - так что тут не суть уже для "однопоточного" или для "многопоточного".

да, они самостоятельны, но "канал к памяти" у них один на всех. дав каждому клону свой пул памяти алокатор хорда позволяет очень неплохо ускорить производительность.

asgard ★
(18.04.07 16:44:59 MSK)

Ссылка

Ответ на: комментарий от alphex_kaanoken 18.04.07 16:44:59 MSK

> Да знаю я что тебе не нравятся сплеи ;) вот именно что суть в выделении/освобождении - это ж поиск - не так ли ? Или ты про что тут пытаешься загнать ? ;)

у тебя есть дерево - в нём хранятся *свободные* куски памяти, при выделении куска, ты должен будешь удалить его из дерева, поместив либо в хэш таблицу, либо в дерево/список заалокейченных кусков. если ты освобождаешь кусок, то в хэш-таблице/дереве/списке заалокейченных кусков должен быть произведён поиск & удаление куска с целью помещения оного обратно в дерево свободных кусков. это приведёт к большому кл-ву операций ребалансинга, которые могут обойтись тебе дороже, нежели поиск по списку.

> лист - высвобождаем такой то указатель - и вперед несемся n-раз до него - очень "быстро"

use quick lists:

array:
[size0] (node0)->(node1)->...->(nodeN)
...
[sizeN] (node0)->(node1)->...->(nodeM)

asgard ★
(18.04.07 16:49:27 MSK)

Ответ на: комментарий от asgard 18.04.07 16:49:27 MSK

у меня есть дерево в котором хранятся все куски - у меня есть поддерево с свободными и занятыми кусками

alphex_kaanoken ★★★
(18.04.07 17:02:54 MSK) автор топика

Ответ на: комментарий от alphex_kaanoken 18.04.07 17:02:54 MSK

> у меня есть дерево в котором хранятся все куски - у меня есть поддерево с свободными и занятыми кусками

как у тебя получит организовать поддерево со свободными кусками, если при ребалансинге ноды перемещаются?

или ты будешь менять стандартный алгоритм скоса в сплее, чтобы гарантировать, что будет данное поддерево со свободными кусками? если да, то это очень много гемора - разработка алгоритма, док-во его стабильности, тестинг, etc

asgard ★
(18.04.07 17:07:59 MSK)

Ответ на: комментарий от asgard 18.04.07 17:07:59 MSK

>если да, то это очень много гемора - разработка алгоритма, док-во его стабильности, тестинг, etc

уже писал, смотрел, и тестил

alphex_kaanoken ★★★
(18.04.07 17:17:00 MSK) автор топика

Ссылка

Вот такая штука существует: http://www.nedprod.com/programs/portable/nedmalloc/index.html

Davidov ★★★★
(19.04.07 04:48:57 MSK)

Ответ на: комментарий от Davidov 19.04.07 04:48:57 MSK

а чего то то там только win32, мне win32 как собаке здрасти - мне портабельно чтобы под *nix было, до win32 мне лесом ;)

alphex_kaanoken ★★★
(19.04.07 14:26:21 MSK) автор топика

Ответ на: комментарий от alphex_kaanoken 19.04.07 14:26:21 MSK

он портаьильный, только я сомневаюсь, что он настолько хорош, на сколько его описывают.

да и лицензия у него boost.

asgard ★
(19.04.07 15:02:56 MSK)

Ответ на: комментарий от asgard 19.04.07 15:02:56 MSK

>да и лицензия у него boost.

вот вот

alphex_kaanoken ★★★
(19.04.07 15:40:18 MSK) автор топика

Ссылка

> Вообщем есть tcp server критичный очень, использует он libc-ный malloc. Суть в том что например в glibc аллокатор убогий.

Почему убогий? Чем не подходит?

>То есть нужен свой, по сему вопрос - я подумал и решил делать его на mmap, НО как будет с кроссплатформенностью ? Этот сервер возможно понадобится в будующем и на *bsd.

В OpenBSD сделано на m*map(), и разные кучки там используются для разного размера chunkов. Утверждалось, что на gnu/linux он тоже работает: http://mr.himki.net/index-alloc.html

anonymous
(20.04.07 10:04:09 MSK)

Ссылка

Не знаю почему никто не написал, но помнится похожие проблемы были у squid и они описаны в документации и FAQ к нему. Кстати они вроде рекомендовали использовать или dmalloc (он вроде в исходниках идет) или GNU malloc (что странно, с учетом текста вашего сообщения) :-\ И еще вспоминается LUBheap (LUB - это Little Useful Bits library), там всего один файл в 7Кб posix/sysheap.c.

saper ★★★★★
(23.04.07 01:49:12 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← Библиотека распознавания текста

Development

Java, вывод из созданного процесса на консоль →

Похожие темы