Какие алгоритмы выявления закономерностей существуют?

Статистические методы, генетические алгоритмы посмотри, машинное доказательство теорем

anonymous
(24.12.14 19:37:38 MSK)

Ссылка

теория вероятности и мат. статистика, исследование операцийб простые числа

anonymous
(24.12.14 20:13:20 MSK)

Ссылка

https://ru.wikipedia.org/wiki/Самоорганизующаяся_карта_Кохонена

no-such-file ★★★★★
(24.12.14 20:24:09 MSK)

Ссылка

Есть методы разведочного анализа. Наиболее известены Принципиальные компоненты (PCA). Но во всех этих методах надо «смотреть глазами» на результат анализа :) оно просто показывает те же данные что и так есть в максимально простом виде.

Это на случай когда просто есть данные и нет никакого понятия что это такое.

Если цель более конкретна — именно цель, в виде меня интересует вот этот показатель, то всё что на него влияет найти уже можно из сколь угодно большого кол-ва мусорных показателей с помощь того или иного фичеэкстрактора. Например типичный представитель library(Boruta) или какое нибудь «эластическое лассо» прикрученное к чему то типа svm.

Когда набор фич извлечен начинается обычный ML со всякими кроссвалидациями и ROC оценками-сравнниями решений...

Как то так.

PS ну ещё на основе генетики народ постоянно рождает новые революционные алгоритмы типа Ивахненковских которые типа «сами все делают» перебирая огромное пространство возможных аналитически содержательных моделей (а не просто тупо типа универсальных решений-«полиномов»). но это как бы всё мрии скорее всего...

psv1967 ★★★★★
(24.12.14 22:37:58 MSK)

Ответ на: комментарий от psv1967 24.12.14 22:37:58 MSK

ну а вообще какие виды закономерностей есть? логические, статистические..?

elf80lvl
(25.12.14 00:14:24 MSK) автор топика

ИМХО в Science & Engineering надо было.

ashot ★★★★
(25.12.14 02:51:37 MSK)

Ссылка

в чистом виде «поиска закономерностей» нет толкового, просто потому, что данные IRL настолько зашумлены, что никаких новых закономерностей из них не извлечь, а те, что извлекаемы, и так очевидны(вроде «употребляющие наркотики долго не живут»).

Если закономерность найдена(предположительно), то можно проверить её достоверность, гуглить «математическая статистика». Работает это хорошо, но только если выборка достаточно большая. На практике, даже при достаточной выборке это подходит лишь для стратегических решений, в частном случае это может не только не сработать, а сработать в прямо противоположном направлении.

Есть специальные случаи, с ними проще. Но тут всё сильно зависит от специализации.

emulek ★
(25.12.14 03:24:46 MSK)

Ссылка

Ответ на: комментарий от elf80lvl 25.12.14 00:14:24 MSK

с таким подходом сразу теорию категорий тогда давайте учите :)

psv1967 ★★★★★
(25.12.14 15:39:22 MSK)

Ссылка

Тебе какие закономерности нужны? «Априори» ищет ассоциативные правила: всесте с пивом часто покупают подгузники. Если у тебя во времени какие-то действия, то можешь попробовать т-паттерны: человек сел за стол, через время икс взял вилку, через время икс2 вствл из-за стола.

Завтра утром могу подробнее.

maggotroot ★
(25.12.14 21:02:26 MSK)

Ссылка

Пс. Думаю материалы и слайды Воронцова по ассоциативным правилам ты уже нашел.

maggotroot ★
(25.12.14 21:07:42 MSK)

Ссылка

Ответ на: комментарий от psv1967 24.12.14 22:37:58 MSK

Только что натолкнулся на ответ. Нет универсального алгоритма выявления закономерностей :(

А.С. Потапов Искусственный интеллект и универсальное мышление
Однако никакая композиция неуниверсальных алгоритмов не даст универсального алгоритма распознавания: сколько бы вы ни взяли классификаторов, каждый из которых умеет находить в данных свой тип закономерностей, всегда найдется закономерность, которую все эти классификаторы не смогут обнаружить.

Осталось только узнать какие типы закономерностей бывают, подскажите пожалуйста.

elf80lvl
(26.12.14 23:48:14 MSK) автор топика

Ответ на: комментарий от elf80lvl 26.12.14 23:48:14 MSK

Да, да ... Еще один шаг и ~~управляемый термоярд~~искуственный интеллект у нас в руках :)

Раз тебе философия нужна, вот почитай маркетологов :) http://www.kylbakov.ru/page205/page224/index.html

psv1967 ★★★★★
(27.12.14 00:48:21 MSK)

Ответ на: комментарий от psv1967 27.12.14 00:48:21 MSK

Мне не нужна философия, я про конкретный алгоритм спрашивал. Ты видимо неправильно понял слова «Осталось только узнать...» они относятся к моему второму вопросу в самом первом сообщении (на него так и не ответили), а не к твоим надуманным предположениям.

elf80lvl
(27.12.14 00:58:03 MSK) автор топика

Ответ на: комментарий от elf80lvl 27.12.14 00:58:03 MSK

тебя вообще трудновато понять, что спросил то?

psv1967 ★★★★★
(27.12.14 10:17:17 MSK)

Ссылка

Ответ на: комментарий от elf80lvl 27.12.14 00:58:03 MSK

По-моему не очень понимаешь, что тебе нужно. Закономерность это очень расплывчатое понятие. Говорить просто об «алгоритмах поиска закономерностей» не имеет смысла, нужно иметь в виду класс задач. Раз уж ты упомянул про ассоциативные правила, то спешу тебя предупредить, что к задачам классификации и кластеризации она прямого отношения не имеют. Ты должен уточнить, какие закономерности ты ищешь. Но пальцем в небо, могу посоветовать тебе несколько статей. Только учти, что это все еще исследовательские статьи, и они ищут не те закономерности, что ищет APriori.

Discovering hidden time patterns in behavior: T-patterns and their detection. Magnusson MS. — это сейчас используется для поиска закономерностей в поведении животных.

Mining Partially Periodic Event Patterns With Unknown Periods. Sheng Ma and Joseph L. Hellerstein

«Discovery of Frequent Episodes in Event Sequences». HEIKKI MANNILA HANNU TOIVONEN A. INKERI VERKAMO.

Frequent Pattern Mining. Charu C. Aggarwal. — если нужно, могу тебе скачать эту книжку.

Frequent pattern mining: current status and future directions. Jiawei Han.

maggotroot ★
(27.12.14 17:34:21 MSK)

Ответ на: комментарий от maggotroot 27.12.14 17:34:21 MSK

Говорить просто об «алгоритмах поиска закономерностей» не имеет смысла, нужно иметь в виду класс задач

Почему же, имеет смысл в задаче неуправляемого обучения, обучения без учителя, задаче автоматической классификации.

Unsupervised learning или «пойди туда, не знаю куда, найди то, не знаю что» в общем то похоже на то, что мне нужно, но все эти нейронные сети - черный ящик, плохо подходят для анализа, видимо придется копать в сторону Data mining.

elf80lvl
(27.12.14 18:27:09 MSK) автор топика

Ответ на: комментарий от maggotroot 27.12.14 17:34:21 MSK

maggotroot спасибо за названия постараюсь ознакомится.

elf80lvl
(27.12.14 18:28:26 MSK) автор топика

Ссылка

Ответ на: комментарий от elf80lvl 27.12.14 18:27:09 MSK

Ты действительно не понимаешь, что тебе нужно. Я тебе советую ознакомиться с основами машинного обучения. Без системного подхода и понимания о том как ставить задачи, ты только будешь спотыкаться о собственные заблуждения.

Очень хорошо для начала, т.к. много примеров: http://www.ccas.ru/voron/download/Introduction.pdf

дальше можешь смотреть http://www.ccas.ru/voron/teaching.html http://www.machinelearning.ru/wiki/index.php?title=Машинное_обучение

maggotroot ★
(27.12.14 18:54:48 MSK)

Ответ на: комментарий от maggotroot 27.12.14 18:54:48 MSK

Ты действительно не понимаешь, что тебе нужно.

Я же четко задал вопрос «какие виды закономерностей вообще есть?», а в ответ слышу что я не понимаю что мне нужно.

Вот я нашел ответ на свой вопрос: Типы закономерностей

elf80lvl
(28.12.14 00:19:03 MSK) автор топика

Ответ на: комментарий от elf80lvl 28.12.14 00:19:03 MSK

Надо сказать, твоя ссылка намного лучше, чем могла быть.

Например, вот эта классификация выковыряна из носа автором: http://www.olap.ru/basic/img/ar2small004.jpg . В чем проблема? Да в том, что тебе такое определение закономерности никак на деле не поможет.

Теперь попытаюсь объяснить, почему ты не понимаешь что хочешь. Ответь на первый вопрос: возьми последовательность цифр десятичной записи числа пи. Там есть закономерность? Какая?

Второй. Вот график y = sin(x*100) на отрезке [0, 0.1]: https://www.dropbox.com/s/dwv5bsyghgdyf1h/s0.png?dl=0 видишь закономерность? А вот найди закономерность на этом графике: https://www.dropbox.com/s/rh9xldgyq0dpwi7/s1.png?dl=0 . А тут y = sin(x*300000000073), правда не очень похоже на закономерность?

maggotroot ★
(28.12.14 01:31:34 MSK)

Ответ на: комментарий от elf80lvl 26.12.14 23:48:14 MSK

Нет универсального алгоритма выявления закономерностей

неправда:

Однако никакая композиция неуниверсальных алгоритмов не даст

автор пропустил(очевидно где-то рядом есть про это «упущение») слово «детерминированная». Теоретически, не детерминированный алгоритм может дать ответ, хотя и не со 100% гарантией, но очень близко к этому.

Осталось только узнать какие типы закономерностей бывают, подскажите пожалуйста.

1. корреляция: свойства X, и Y зависимы.

2. следствие: свойство X является следствием Z(п1 это очевидно либо следствие, либо X и Y являются следствием некого Z). Хотя теоретически обычно достаточно этого пункта, но пункт 1 тоже полезен на практике, в силу того, что первопричина Z не нужна и/или сложно-вычисляемая.

emulek ★
(28.12.14 01:54:58 MSK)

Ссылка

Какие-то у тебя теги неправильные. Так-то этим статистика занимается. Когда-то в школе писал apriori на сях.

ps: помни, юный падаван, correlation does not mean causation!

~~unt1tled~~ ★★★★
(28.12.14 01:56:48 MSK)

Ссылка

Ответ на: комментарий от elf80lvl 27.12.14 00:58:03 MSK

я про конкретный алгоритм спрашивал.

их достаточно много, и без знания предметной части сложно что-то советовать. Может тебе простой экстраполяции (интерполяции) многочленом достаточно? Тогда для n известных точек, просто реши уравнение n-1`й степени. В многомерном случае лучше использовать Монте-Карло, в одномерном метод Ньютона например. Ну или Фурье, если данные имеют периодическую структуру.

emulek ★
(28.12.14 02:00:20 MSK)

Ссылка

Ответ на: комментарий от elf80lvl 28.12.14 00:19:03 MSK

Вот я нашел ответ на свой вопрос: Типы закономерностей

всё, что там перечислено, является причинно-следственной связью по времени. Т.е. событие X является причиной события Y, произошедшего позже. Далее авторы выделяют частные случаи этого частного случая. В более общем виде эта задача решается при сжатии данных, когда очередной символ кодер (а потом декодер) пытается угадать, в зависимости от контекста. Ну и если почти угадал, то почти не выдаёт бит, но если символ ВНЕЗАПЕН, то выдаёт много бит. Если мадскилз кодера(и декодера) прокачен, то на каждый символ уходит немного бит на радость нищебродам с маленькими HDD и узкими каналами.

И да, то, что ты читаешь — ближе к рекламе.

emulek ★
(28.12.14 02:09:16 MSK)

Ссылка

Ответ на: комментарий от maggotroot 28.12.14 01:31:34 MSK

Ответь на первый вопрос: возьми последовательность цифр десятичной записи числа пи. Там есть закономерность? Какая?

1. есть

2. это остатки от деления на 10 числа пи.

emulek ★
(28.12.14 02:11:21 MSK)

Ссылка

Ответ на: комментарий от maggotroot 28.12.14 01:31:34 MSK

такое определение закономерности никак на деле не поможет.

Ну это не тебе решать поможет или нет, вопрос то был не в этом.

А.С. Потапов Искусственный интеллект и универсальное мышление
... для понятия закономерности есть хорошая формализация - в виде алгоритмов. С помощью алгоритмов можно описать любую закономерность (по крайней мере, содержащуюся в массиве символов или чисел).
...
Сравнительно небольшими алгоритмами может быть напечатано и любое количество знаков таких трансцендентных чисел как пи, е или ln (2).

elf80lvl
(28.12.14 02:13:49 MSK) автор топика

Ссылка

Похожие темы