Двоичный поиск, математика

0

1

Добрый день!

Я новичок, поэтому вопросы у меня соответствующие.

Я услышала на одной из онлайн лекций, что согласно алгоритму двоичного поиска (binary search) если, например, есть 4 милларда данных в телефонной книге, то найти нужного человека по имени (например, Kim Smith) можно за 32 шага. Если удвоить количество данных до 8 млрд, то потребуется 33 шага.

Я понимаю алгоритм (делим попалам, затем еще попалам нужные половины пока не надем), но я плохо владею математикой и не понимаю как получаются 32 и 33 шага, и тем более log(n). Пожалуйста, подскажите где можно про это прочитать и изучить (не в Википедии)?

Спасибо!

Ссылка

← qemu на debain. После паузы в гостевой ОС(win) время бежит в разы быстрее

Не удаётся собрать Unreal Engine . ArchLinux →

Я понимаю алгоритм (делим попалам, затем еще попалам нужные половины пока не надем), но я плохо владею математикой и не понимаю как получаются 32 и 33 шага, и тем более log(n).

Тут всё просто. log(n) по основанию 2 — это то, в какую степень нужно возвести 2 для того, чтобы получить n. То есть,

log(n) = 32
отсюда n = 2^32

И 32 шага получаются потому, что делишь ты постоянно на 2. А 2^32 = 4294967296, то есть, около 4 миллиардов

Deleted
(08.12.15 12:05:51 MSK)

не в Википедии

религия не позволят?

http://neerc.ifmo.ru/wiki/index.php?title=Целочисленный_двоичный_поиск

http://cppstudio.com/post/2996/

hope13 ★★★
(08.12.15 12:06:02 MSK)

Ответ на: комментарий от Deleted 08.12.15 12:05:51 MSK

Большое спасибо!

Ducol
(08.12.15 12:54:18 MSK) автор топика

Ссылка

Ответ на: комментарий от hope13 08.12.15 12:06:02 MSK

нет ) возможность мозга - для меня там очень сложно написано. Спасибо за ссылки.

Ducol
(08.12.15 12:55:29 MSK) автор топика

Ссылка

Алгоритм интересный, но с точки зрения применимости крайне ненужный, так как упорядоченные данные редко имеем.

~~unt1tled~~ ★★★★
(08.12.15 13:02:49 MSK)

Ответ на: комментарий от unt1tled 08.12.15 13:02:49 MSK

ну, сначала отсортировать за nlog(n), а потом уже искать :-)

gnunixon ★★★
(08.12.15 13:18:26 MSK)

Ссылка

Ответ на: комментарий от unt1tled 08.12.15 13:02:49 MSK

крайне ненужный

так как упорядоченные данные редко имеем

Лол.

intelfx ★★★★★
(08.12.15 13:28:56 MSK)
Последнее исправление: intelfx 08.12.15 13:29:09 MSK (всего исправлений: 1)

Ссылка

Это легко можно понять, взяв карандаш и бумажку, и начав симуляцию алгоритма с поиска одного из двух вариантов.

thesis ★★★★★
(08.12.15 13:33:32 MSK)

Ссылка

Ответ на: комментарий от unt1tled 08.12.15 13:02:49 MSK

но с точки зрения применимости крайне ненужный

Я постоянно пользую питонячий bisect даже в говновебе.

A1 ★
(08.12.15 14:41:52 MSK)

Ссылка

Ответ на: комментарий от unt1tled 08.12.15 13:02:49 MSK

так как упорядоченные данные редко имеем.

intelfx хоть и школие, но это действительно лол. Как по твоему работают B-tree индексы?

A1 ★
(08.12.15 14:43:48 MSK)

Ответ на: комментарий от A1 08.12.15 14:43:48 MSK

причем тут B-tree?

~~unt1tled~~ ★★★★
(08.12.15 15:23:13 MSK)

Ответ на: комментарий от unt1tled 08.12.15 15:23:13 MSK

причем тут B-tree?

Упорядоченные данные с логарифмическим поиском.

A1 ★
(08.12.15 16:00:12 MSK)

Ответ на: комментарий от A1 08.12.15 16:00:12 MSK

упорядоченные данные редко имеем

Упорядоченные данные с логарифмическим поиском.

что ты несешь?

~~unt1tled~~ ★★★★
(08.12.15 16:03:50 MSK)

Ответ на: комментарий от unt1tled 08.12.15 16:03:50 MSK

Прими два курса Седжвика.

A1 ★
(08.12.15 16:07:06 MSK)

Ссылка

Ответ на: комментарий от unt1tled 08.12.15 13:02:49 MSK

Алгоритм интересный, но с точки зрения применимости крайне ненужный, так как упорядоченные данные редко имеем.

Данный алгоритм используется повсеместно. Даже не знаю, что у тебя за задачи такие, где ты без него обходишься.

m0rph ★★★★★
(08.12.15 16:37:00 MSK)

Ответ на: комментарий от m0rph 08.12.15 16:37:00 MSK

мне даже интересно стало, сколько людей используют в работе алгоритмы поиска по сортированным данным, вместо встроенных contains() или get()

~~unt1tled~~ ★★★★
(08.12.15 20:33:12 MSK)
Последнее исправление: unt1tled 08.12.15 20:33:35 MSK (всего исправлений: 1)

Ответ на: комментарий от unt1tled 08.12.15 20:33:12 MSK

вместо встроенных contains() или get()

Которые внезапно используют двоичный поиск в упорядоченном дереве.

no-such-file ★★★★★
(08.12.15 20:42:53 MSK)

Ответ на: комментарий от no-such-file 08.12.15 20:42:53 MSK

который так же внезапно каждый день пишет половина лора?

~~unt1tled~~ ★★★★
(08.12.15 20:45:51 MSK)

Ответ на: комментарий от unt1tled 08.12.15 20:33:12 MSK

вместо встроенных contains() или get()

Встроенных куда? Это важный вопрос в свете того, что структура данных может быть таблица, дерево, список, хэш-таблица. Этим ты хотел сказать, что тебе все равно, что за структура данных используется?

мне даже интересно стало, сколько людей используют в работе алгоритмы поиска по сортированным данным

Сложность O(n) тебя не смущает? Окай.

iVS ★★★★★
(08.12.15 20:47:35 MSK)

Ответ на: комментарий от iVS 08.12.15 20:47:35 MSK

я вообще никогда не работаю с сортированными данными, а кому-то тут везде b-tree мерещатся

~~unt1tled~~ ★★★★
(08.12.15 20:52:10 MSK)

Ответ на: комментарий от unt1tled 08.12.15 20:45:51 MSK

но с точки зрения применимости крайне ненужный, так как упорядоченные данные редко имеем

который так же внезапно каждый день пишет половина лора?

Одно дело нужность алгоритма, и совсем другое - нужность велосипедостроения. А так можно сказать, что вообще программирование ненужное занятие, т.к. «всё уже украдено до нас».

no-such-file ★★★★★
(08.12.15 20:52:36 MSK)

Ответ на: комментарий от no-such-file 08.12.15 20:52:36 MSK

Ладно, поставим вопрос подругому: сколько лоровцев имеют честь постоянно искать что-то в b-tree? Можно даже опрос запилить.

~~unt1tled~~ ★★★★
(08.12.15 20:57:46 MSK)
Последнее исправление: unt1tled 08.12.15 20:57:58 MSK (всего исправлений: 1)

Ответ на: комментарий от unt1tled 08.12.15 20:57:46 MSK

я ищу, правда не в b-tree, а в trie )

Harald ★★★★★
(08.12.15 20:59:46 MSK)

Ответ на: комментарий от Harald 08.12.15 20:59:46 MSK

Ну вот и зачем ты пришел? Все, вопрос снят, я сливаюсь.

~~unt1tled~~ ★★★★
(08.12.15 21:01:10 MSK)

Ответ на: комментарий от unt1tled 08.12.15 21:01:10 MSK

ну не знаю, поделиться радостью штоле

Harald ★★★★★
(08.12.15 21:20:42 MSK)

Ссылка

Ответ на: комментарий от unt1tled 08.12.15 13:02:49 MSK

Однако часто встречаются данные, которые редко меняются, зато по ним нужно часто искать. В таком случае выгодно их отсортировать один раз и запомнить (а при добавлении новых элементов вставлять их на такие позиции, чтобы сортировка не портилась), а потом искать двоичным поиском.

Разумеется, если у нас данные каждый раз абсолютно новые, то двоичный поиск не подойдёт. Но не всегда же так бывает.

KivApple ★★★★★
(09.12.15 01:29:01 MSK)
Последнее исправление: KivApple 09.12.15 01:32:31 MSK (всего исправлений: 2)

Ответ на: комментарий от KivApple 09.12.15 01:29:01 MSK

а потом искать двоичным поиском

Для равномерно распределенных данных есть и более быстрые алгоритмы.

anonymous
(09.12.15 05:32:48 MSK)

Ссылка

Ответ на: комментарий от unt1tled 08.12.15 20:57:46 MSK

Ладно, поставим вопрос подругому: сколько лоровцев имеют честь постоянно искать что-то в b-tree?

Понимаешь, что сейчас ты показал уровень редчайшей безграмотности в структурах данных. Сортировка и поиск — это binary-search tree (BST). B-tree — из другой области. Естественно, что лоровцы ничего не ищут в B-tree, но могут искать в BST. B-tree — оптимизированная версия деревьев под размер кэша, ты ею пользуешься практически постоянно, обращаясь к оперативке или диску.

iVS ★★★★★
(09.12.15 06:47:21 MSK)
Последнее исправление: iVS 09.12.15 06:48:00 MSK (всего исправлений: 1)

https://en.wikipedia.org/wiki/Red-black_tree

anto215 ★★
(09.12.15 07:00:40 MSK)

Ответ на: комментарий от unt1tled 08.12.15 20:52:10 MSK

Если ты работаешь с hashmap, map, set и другими подобными типами в твоём любимом недоязычке, у меня для тебя плохие новости.

~~hateyoufeel~~ ★★★★★
(09.12.15 07:08:19 MSK)

Ссылка

Ответ на: комментарий от unt1tled 08.12.15 20:33:12 MSK

я использую.

было это лет 5 назад.

срочно вызывают на обьект, а там вся сеть упала изза arp-шторма. откуда идет шторм не понятно. сеть простая, компов 30, коммутатор простой на 48 портов.

что делать? как быстро найти виновника?

все порты на коммутаторы поделили на левые и правые.

отключили левую половину сети, оставили только правую, проблема пропала.

выключили левую часть.

правую часть снова поделили на левую и правую.

провели несколько итерации и в итоге нашли нерабочий компьютер.

после этого случая на этом обьекте я стал звездой.

вот польза от двоичного поиска.

Nurmukh ★★★★
(09.12.15 12:19:23 MSK)