LINUX.ORG.RU

Анализ данных с R

 , , ,


0

2

Выложил в открытый доступ четыре статьи цикла Анализ данных с R (III). Цикл статей был опубликован в LXF с февраля по май 2010 года.

Основной идеей цикла было показать возможности R на реальных примерах. Поставщиком и основным автором примеров выступил Сергей Петров. Анализ кадровой политики ордена иезуитов предоставил Владимир Левшук.

На примерах показаны бутстреп-анализ, построение простого GUI-интерфейса, как подходить к «тяжёлым» вычислениям и поиск зависимостей.

Из Википедии: R — язык программирования для статистической обработки данных и работы с графикой, а также свободная программная среда вычислений с открытым исходным кодом в рамках проекта GNU.

Информация по улучшению и советы по развитию всячески приветствуются.

>>> Подробности

★★★★★

Проверено: mono ()
Последнее исправление: CYB3R (всего исправлений: 1)

Годная вещь! Всё никак не начну изучать, а надо бы...

BattleCoder ★★★★★
()

Если бы не информация из Википедии, можно было бы предположить, что Вы уже настегались, проважая уходяший год.

anonymous
()

О, круто, спасибо, как раз хотел поковырять

yoghurt ★★★★★
()

Спасибо, очень понравились статьи, особенно про постоение GUI. Будет ли продолжение? Интересно было бы почитать про нейронные сети, анализ нелинейных систем (теория хаоса, фрактальный анализ) на базе R.

Mr_Brightside
()
Ответ на: комментарий от bik

> а не планируется html-версии статей? или я не заметил?

Нет.

P.S. Да, с Новым Годом! У нас уже случилось.

Evgueni ★★★★★
() автор топика
Ответ на: комментарий от DNA_Seq

> здорово. Стоит ждать книги?

К сожалению лидер немного тормозит :( Мне тоже хотелось бы чтобы книга получилась, но у меня не хватает квалификации, ну и такой мелочи как времени.

Evgueni ★★★★★
() автор топика

Ad majorem Dei gloriam

anonymous
()

Хорошая, годная новость, спасибо! Хотя статьи уже не очень актуальны для меня, но пойду скачаю, может что-то новое для себя почерпну или в универе кому пригодится.

skvitek ★★★
()

> Анализ кадровой политики ордена иезуитов предоставил Владимир Левшук.

Ну хоть для чего-то иезуиты нужны.

const86 ★★★★★
()

Эх, были бы данные!

anonymous
()

R не нужен

anonymous
()
Ответ на: комментарий от skvitek

> или в универе кому пригодится.

Распространение и дублирование новости и информации всячески приветствуется.

Evgueni ★★★★★
() автор топика
Ответ на: комментарий от Mr_Brightside

> Будет ли продолжение?

Я в прошлом году выдохся. Хотя сейчас, в этом году, вроде как, оживаю потихоньку. Но скорее нет, чем да.

Будет ли продолжение? Интересно было бы почитать про нейронные сети, анализ нелинейных систем (теория хаоса, фрактальный анализ) на базе R.

Предлагаю ещё более интересный квест: напишите об этом сами :) Можно опробовать туже схему, что и на предыдущих 12 статьях aka идеи и текст ваши, а их обработка и представление моё, но лучше чтобы вы всё сделали от начала и до конца.

Evgueni ★★★★★
() автор топика

Спасибо, полезно (главное - по-русски, студентам проще).

Кстати, интересно - сделано в emacs? (ESS+AUCTeX)?

oami ★★
()

Спасибо.

Предлагаю ещё более интересный квест: напишите об этом сами :)

А что? Это идея. Есть две вещи, с которыми хотелось повозиться в 2011: R и ugene :)

Stalin ★★★★★
()

Евгений, а не могли бы вы на примере любого современного языка программирования периодически публиковать статьи об основах алгоритмики? Мне бы, например, было очень интересно «живое» изложение основ нечёткого поиска подстроки в строке. Ну или описание того же алгоритма Бойера-Мура: было бы здорово, если бы вы, например, смогли такие вещи доступным человеческим языком объяснить.
Кстати, алгоритмы поиска шаблона в строке (в особенности тот, что КМП), построение суфиксных деревьев и пр. подобное - широко используются не только в быту, но и в молекулярной биологии, так что вдвойне полезно будет: вдруг кого-то сподвигнете поучаствовать в разработке чего-нибудь антивирусного, но не компьютерного:)

DRVTiny ★★★★★
()
Ответ на: комментарий от bik

> а почему? у латеха же вроде бы нет проблем с экспортом в xhtml

Вообще-то есть и проблема в формулах и картинках. То есть для вменяемого качества только автоматом это сделать не выйдет. Необходим ручной труд.

Evgueni ★★★★★
() автор топика
Ответ на: комментарий от Stalin

> Есть две вещи, с которыми хотелось повозиться в 2011: R и ugene :)

Мой e-mail легко найти на моей домашней страничке. Я ничего гарантировать, естественно, не могу, но просто поговорить на эту тему всегда можно.

Evgueni ★★★★★
() автор топика
Ответ на: комментарий от Evgueni

> К сожалению это постоянное состояние потенциальных авторов ☹

Знаю. В этом деле спец - два диссера зависло по по таким причинам. На конкурсе распиздяев занял бы второе место (с) :)

Stalin ★★★★★
()
Ответ на: комментарий от DRVTiny

Не нагружайте других бессмысленной работой. КМП достаточно разжеван у Вирта, в «Алгоритмы и структуры данных» (второе издание есть на русском языке). Найдите и прочтите.

Вот Вам вторая ссылка из гугла: http://masterpc.alfaspace.net/books/downloads/virt_algorithms/

anonymous
()

Вот как можно называть ПО одной буквой? Как искать в репах пакеты по одной букве R?

AVL2 ★★★★★
()

Извините за занудство...

От старого зануды-переводчика: предлог with переводится на русский язык словосочетанием "при помощи". «Анализ данных при помощи языка R» или что-нибудь в таком духе.

Orlusha ★★★★
()

R нужен. Статьи нужны. Автор нужен тоже.

ugoday ★★★★★
()
Ответ на: Извините за занудство... от Orlusha

> От старого зануды-переводчика: предлог with переводится на русский язык словосочетанием «при помощи».

Ээээ. Статьи авторские, вообще-то. Причём здесь перевод?

Evgueni ★★★★★
() автор топика
Ответ на: комментарий от Evgueni

>Ээээ.

Хм... Да тут автор безграмотный. Читать безграмотных - себя не уважать.

anonymous
()
Ответ на: комментарий от Evgueni

да я уже понял, что искать можно r-project

А вообще по этому пакету нужна фундаментальная литература. В статьях получается отчаянно поверхностно-кусочно. Пакет такой-то, мантра такая-то. Никакой системы.

У меня, например, задача - обработать данные анкетирования. Исследовать зависимости в данных, качество анкеты, отфильтровать ложные ответы и получить классификацию респондентов. В этих статьях кое-что есть, но явно недостаточно.

AVL2 ★★★★★
()
Ответ на: Извините за занудство... от Orlusha

>«Анализ данных при помощи языка R»

ненене, правильно именно «Анализ данных с R». Ты же не говоришь «секс при помощи девушки».

anonymous
()
Ответ на: комментарий от AVL2

> А вообще по этому пакету нужна фундаментальная литература.

Да никто и не спорит. Проблема в том, что создание этой литературы совершенно не окупается. Даже безудержный энтузиазм не особо помогает ☹

Evgueni ★★★★★
() автор топика
Ответ на: комментарий от AVL2

> У меня, например, задача - обработать данные анкетирования. Исследовать зависимости в данных, качество анкеты, отфильтровать ложные ответы и получить классификацию респондентов. В этих статьях кое-что есть, но явно недостаточно.

IMHO, а тут нужно читать статьи по предмету, а не по программному продукту. А вот затем искать/реализовывать найденные алгоритмы уже средствами R. В таких вещах волшебной кнопки не существует.

Другой вариант — купить готовый продукт как раз для таких дел (у меня одноклассник работает в фирме, которая занимается датамайнингом), но это будет стоить весьма и весьма не хило.

Evgueni ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.