MySQL запрос, проблема с использованием индексов!

0

1

1 таблица с именами автомобилей, а 2ая с именами марок авто table1 таблица - у неё есть следующие поля:

Чтобы было яснее, это будет таблица с мобильными телефонами.

table1:
l_id      - идентификатор автомобиля, он уникален
l_name    - наименование авто («ВАЗ 2101»,«AUDI R8»)
a_id      - id марки автомобиля, cвязь с 2ой таблицей
--------------------------------------------------------------------- 
table2:
a_id      - уникальный id марки авто
g_id      - id страны производителя авто (от 1 до 100)

Очень сложная структура таблиц, поэтому прошу помощи.

Делаем сложный запрос:

SELECT
   SQL_NO_CACHE #для чистоты эксперемента
   * 
FROM 
   table1 as al,
   table2 as a
WHERE
   a.a_id=al.a_id
AND
   g_id IN (1)

limit 1000 , 30;

Получается мы фильтруем всех производителей кроме страны с id 1, запрос выполняется 0.0003 сек.

Попробуем вывести 20 стран: g_id IN (1,2,3,4,5,6,7,8,9,20,30,40,50,60,70,80,90,99,55,77). Всё отлично, всё так же быстро.

Делаем сортировку по имени авто: ORDER BY l_name ASC - и вместо 0.0003 сек получаем 2 секунды. По-моему долго!

Explain подсказал, что l_name переберается и не использует индекс! Нам поможет FORCE INDEX (l_name). О чудо! 0.0400 сек! По-моему для связывания таблиц, установки WHERE и сортировки - 0.0400 сек это быстро.

Казалось бы выход найден. Используем индексы. Вернемся к запросу в котором мы фильтровали все страны кроме одной g_id in (1). Если опять это выполнить с использованием уже ускоряющего нас FORCE INDEX (l_name) - время выполнения будет 1 сек. КАК ТАК?? Кажется нелогичным, уменьшить объем выбираемой и сортируемой информации и при этом возрастает время обработки в 20 раз. Профилирование запроса покажет, что 99.5% времени процесс в статусе sending data. Добавляя в условие g_id новые страны дополнительного фильтрования - время sending data снижается по мере добавления идентификаторов стран в условие. Если не использовать FORCE INDEX (l_name), то скорость выполнения с условием g_id in (1) быстрая.

Неужели мне придется использовать FORCE INDEX (l_name) в зависимости от разности количества записей условия? :)

Буду рад любым пинкам в правильном направлении.

Ссылка

←	Как правильно указывать кодировку в HTML?

javascript (как сделать web-приложение живущее в браузере)

→

Буду рад любым пинкам в правильном направлении.

postgresql.

~~baverman~~ ★★★
(10.09.12 13:48:03 MSK)

Буду рад любым пинкам в правильном направлении.

left join

А вообще

show create table `table1`;

show create table `table2`;

В студию

А то нихера не понятно на каких полях у тебя индексы. Мож ты на поле сортировки его поставил, а на поля по которым связываешь - нет.

r_asian ★☆☆
(10.09.12 14:18:27 MSK)

Ответ на: комментарий от baverman 10.09.12 13:48:03 MSK

postgresql

А вот и любители собственное невежество за косяки ПО выдавать.

r_asian ★☆☆
(10.09.12 14:19:23 MSK)

А если через подзапрос сделать, какой из вариантов будет дольше?

Apple-ch ★★
(10.09.12 14:23:02 MSK)

Ответ на: комментарий от r_asian 10.09.12 14:18:27 MSK

CREATE TABLE `table1` (
  `l_id` int(11) NOT NULL AUTO_INCREMENT,
  `a_id` int(11) NOT NULL,
  `l_name` varchar(256) NOT NULL,
  PRIMARY KEY (`l_id`),
  KEY `a_id` (`a_id`),
  KEY `l_name` (`l_name`)
) ENGINE=MyISAM AUTO_INCREMENT=1222617 DEFAULT CHARSET=utf8 ROW_FORMAT=DYNAMIC

CREATE TABLE `table2` (
  `a_id` int(11) NOT NULL AUTO_INCREMENT,
  `g_id` int(11) NOT NULL,
  `y_id` int(11) NOT NULL,
  PRIMARY KEY (`a_id`)
) ENGINE=MyISAM AUTO_INCREMENT=100001 DEFAULT CHARSET=utf8 ROW_FORMAT=DYNAMIC

ex3me ★★
(10.09.12 14:34:06 MSK) автор топика

Ответ на: комментарий от Apple-ch 10.09.12 14:23:02 MSK

Дело в том, что данных много - table1 более 1 млн записей, table2 - 100000 записей.

Через подзапрос - временная таблица долго создается. Чуть чуть быстрее, но это уже и память кушает.

ex3me ★★
(10.09.12 14:36:57 MSK) автор топика

Ссылка

Ответ на: комментарий от ex3me 10.09.12 14:34:06 MSK

любопытно, а чего g_id не индекс? ты ж по нему выбираешь..

AndreyKl ★★★★★
(10.09.12 15:08:22 MSK)

Ответ на: комментарий от ex3me 10.09.12 14:34:06 MSK

1. Добавь индекс для `g_id`, у тебя же это поле в условии стоит

2. Давай сделаем с твоим запросом вот что

SELECT
   SQL_NO_CACHE #для чистоты эксперемента
   `al`.`i_id` as `id`,
   `al`.`l_name` as `name`,
   `a`.`a_id` as `a_id`
FROM 
   `table1` as `al`
      LEFT JOIN
   `table2` as `a`
      ON `a`.`a_id`=`al`.`a_id`
WHERE
   `a`.`g_id` IN (1)
ORDER BY 
   a.l_name ASC
limit 1000 , 30;

То есть

а) Свяжем таблицы через JOIN

б) Ограничим число выбираемых полей

r_asian ★☆☆
(10.09.12 15:17:37 MSK)

Мда... школоло. Иди почитай сначала про SQL.

VirRaa ★★★
(10.09.12 15:23:53 MSK)

Ответ на: комментарий от AndreyKl 10.09.12 15:08:22 MSK

Поставил. Тот же запрос который выполняется 1 сек. выполняться стал 1 min 3.64 sec

ex3me ★★
(10.09.12 15:24:33 MSK) автор топика

Ответ на: комментарий от ex3me 10.09.12 15:24:33 MSK

Поставил. Тот же запрос который выполняется 1 сек. выполняться стал 1 min 3.64 sec

гм.. гм.. а ты не юзаешь там force index? если юзаешь, убери.

ну и эксплейн в студию если совет разина не поможет.

AndreyKl ★★★★★
(10.09.12 15:28:26 MSK)

Ответ на: комментарий от r_asian 10.09.12 15:17:37 MSK

2. Запрос выполнил. Запрос выполняется ровно столько, сколько и мой запрос. (я уже задавал вопрос на другом сайте, мне дали подобный запрос в ответ)

1. Как только я добавил индекс, Запрос выполнился за 0.05 сек. Но как только я в условие IN добавил десяток циферок - запрос стал выполняться больше секунды. Проблема стала «с точностью до наоборот» :)

б. Запрос , таблица, имена полей - тестовые. Поэтому я использую «*» вместо перечисления. Перечисление никакого ускорения не даст, т.к. проблема совсем в другом.

ex3me ★★
(10.09.12 15:53:25 MSK) автор топика

Ссылка

Ответ на: комментарий от AndreyKl 10.09.12 15:28:26 MSK

EXPLAIN запроса который выполняется 1 сек c LEFT JOIN

EXPLAIN запроса который выполняется 1 сек БЕЗ LEFT JOIN

ex3me ★★
(10.09.12 16:08:48 MSK) автор топика

Ссылка

Ответ на: комментарий от VirRaa 10.09.12 15:23:53 MSK

на 50% уверен, что ты даже не понял суть проблемы, а на 99.9% уверен что тебе никогда не решить такой запрос.

ex3me ★★
(10.09.12 16:11:51 MSK) автор топика

Ответ на: комментарий от ex3me 10.09.12 16:11:51 MSK

на 50% уверен, что ты даже не понял суть проблемы, а на 99.9% уверен что тебе никогда не решить такой запрос.

Я щаслив за тебя.

VirRaa ★★★
(10.09.12 16:39:59 MSK)

Ссылка

не используй смещение. limit 1000 , 30;

RR ★
(10.09.12 17:01:07 MSK)

Ответ на: комментарий от RR 10.09.12 17:01:07 MSK

Очень интересное решение.. Но мне нужен limit :)

ex3me ★★
(10.09.12 18:28:21 MSK) автор топика

что-то мне кажется что во второй таблице нужно не два отдельных индекса а один составной

bismi ★
(10.09.12 18:51:43 MSK)

Ответ на: комментарий от bismi 10.09.12 18:51:43 MSK

делал... причем составной так же работает как и 2 отдельных индекса

ex3me ★★
(10.09.12 19:58:16 MSK) автор топика

Ссылка

Ответ на: комментарий от ex3me 10.09.12 18:28:21 MSK

лимит можно использовать но смещение на больших таблицах никогда, посмотри в плане запроса как мускул его обрабатывает - чтоб найти смещение мускуль пройдется по всем записям игнорируя индекс (а как по другому?), поэтому если будешь брать записи с 100000 20 штук то физически мускуль отгребет 100000+20 записей. http://www.scribd.com/doc/14683263/Efficient-Pagination-Using-MySQL

RR ★
(10.09.12 20:24:44 MSK)

Ответ на: комментарий от RR 10.09.12 20:24:44 MSK

Поидее ваш ответ самый правильный. Спасибо

ex3me ★★
(10.09.12 21:18:38 MSK) автор топика

Ответ на: комментарий от r_asian 10.09.12 14:19:23 MSK

А вот и любители собственное невежество за косяки ПО выдавать.

PHP и mysql — братья навек, понимаю.

~~baverman~~ ★★★
(10.09.12 22:51:03 MSK)

Ответ на: комментарий от RR 10.09.12 17:01:07 MSK

как же он без смещения.. жить то надо как-то..

AndreyKl ★★★★★
(10.09.12 23:20:39 MSK)

Ссылка

Ответ на: комментарий от bismi 10.09.12 18:51:43 MSK

Mysql обычно делает слияние довольно индексов довольно в тему.. так что вряд ли поможет..

AndreyKl ★★★★★
(10.09.12 23:21:18 MSK)

Ссылка

Ответ на: комментарий от RR 10.09.12 20:24:44 MSK

хорошие советы, спасибо

AndreyKl ★★★★★
(10.09.12 23:27:16 MSK)

Ссылка

Ответ на: комментарий от baverman 10.09.12 22:51:03 MSK

Братья навек - это postgre и пионЭры

r_asian ★☆☆
(11.09.12 06:25:01 MSK)

Ответ на: комментарий от r_asian 11.09.12 06:25:01 MSK

После ANALYZE и постгресовского планировщика ковыряться в мускульных эксплейнах захотят люди только определенного склада ума.

~~baverman~~ ★★★
(11.09.12 08:28:25 MSK)

Ответ на: комментарий от baverman 11.09.12 08:28:25 MSK

postgres the best. для холивара создавайте отдельный тред.

На это сообщение отвечать не нужно.

ex3me ★★
(11.09.12 10:02:47 MSK) автор топика

Ссылка

Ответ на: комментарий от ex3me 10.09.12 21:18:38 MSK

Под эту задачу неплохо сфинкс подходит - http://habrahabr.ru/blogs/webdev/40443/ Еще можно заюзать какой-то хандлерсокет или мемкашединнодб интерфейс, ну и перейти на иннодб - муисам сакс.

RR ★
(11.09.12 12:27:20 MSK)