masloed в соседнем топике поднимает интересный вопрос о кэшах, памяти и прочем. И топик и каменты - норкоманский угар, напишу лучше отдельно.
Вот недавно Тутубалин выложил свою презентацию с highload-2012
http://blog.lexa.ru/2012/10/23/prezentatsiya_s_highload.html
Там на страницах 30-31 как раз то что нужно. Кому лень пойти по ссылке, вкратце, по сравнению с 1980г.: «память - это новый диск, диск - это новая лента, кэши - немного спасают, LAN-приятное исключение из общего правила».
И дальше решения, такие рецепты современных алхимиков-программистов.
Возник собственно вопрос: а существуют ли облегчающие жизнь промышленные решения? Допустим, мне нужно хранить и обрабатывать некоторое количество (единицы терабайт) информации. Обрабатывать - это пробегать по этой информации и делать что-то примитивное, типа матчинга по регекспам и сложения. Есть ли Волшебная Технология, которая все сделает сама оптимально? Хочется сказать этой технологии что-то типа «вот алгоритм, нужно его применить к этому». А оно уже там унутре вычисляет оптимальные блоки для вычитывания данных с диска, режет на куски чтоб не промазывать мимо кэша, разбрасывает обработку по CPU и т.п.
Про РСУБД и МапРедюс рассказывать не надо, они немного не про это. То есть основной критерий - производительность на одном узле. Никаких там ACID, распределенных по сети рассчетов и прочего не нужно, оно здорово оверхедит.
Или только брать эти Тутубалинские рецепты и вручную?