LINUX.ORG.RU

Data mining


8

0

Всего сообщений: 3

R — самое используемое приложение в data mining

Группа Open Source

Регулярно проводимый опрос популярности программного обеспечения среди специалистов по прикладному анализу данных KDnuggets Software Poll впервые показал превышение доли продуктов анализа с открытым кодом над проприетарными решениями анализа данных.

Доля пользователей использующих именно R превысила 30%. Это самое популярное средство анализа в абсолютной категории. Эта доля подозрительно равна доле специалистов, использующих только средства анализа с открытым кодом. Похоже, R — полностью самодостаточный продукт анализа данных.

Доля пользователей, использующих одновременно и открытые, и проприетарные средства анализа, составила 41%.

Доля пользователей, использующих исключительно проприетарные программные продукты — 28%.

Обзор интересен также списком наиболее популярных продуктов анализа данных.

>>> Подробности

 , ,

psv1967
()

AINL: Искусственный Интеллект и Естественный Язык

Группа Конференции и встречи

26 мая 2012 года в Санкт-Петербурге пройдет конференция «AINL: Искусственный Интеллект и Естественный Язык».

В рамках конференции AINL организаторы хотят собрать российских и зарубежных специалистов в этих областях, как из научной и ВУЗовской среды, так и из профильных компаний, ведущих разработку технологий и применяющих данные технологии в своих продуктах.

Цели конференции:

  • представить последние разработки в области прикладного искусственного интеллекта;
  • обменяться опытом в их применении для создания интеллектуальных диалоговых систем и агентов;
  • найти возможные варианты сотрудничества.

Участники:

  • представители профильных компаний и проектов, научных групп, стартапов, ученые;
  • студенты, аспиранты и преподаватели ведущих ВУЗов России.

Конференция будет проходить один день и предполагает проведение трех основных секций:

  • распознавание и синтез речи;
  • искусственный интеллект, диалоговые системы;
  • инженерия знаний, онтологии, извлечение данных, data mining.

Участие бесплатное. Язык мероприятия: русский. Обязательна предварительная регистрация на сайте.

Предварительная программа.

Место проведения.

>>> Подробности

 , , ,

ymn
()

Релиз Apache Mahout 0.6

Группа Кластеры

6 февраля увидел свет релиз Apache Mahout за номером 0.6.

Среди нововведений:

  • Уменьшение времени вычисления скалярного произведения векторов.
  • Поддержка MongoDB и Cassandra DataModel.
  • Исправлены некоторые ошибки и введены некоторые дополнительные улучшения.

Подробный список изменений доступен на сайте Apache Software Foundation.

Apache Mahout представляет собой реализацию большого количества алгоритмов машинного обучения: кластеризацию, классификацию, фильтрацию и т.п. Основные алгоритмы разработаны с применением парадигмы map/reduce и применяются для обработки и анализа больших объемов данных на платформе Hadoop. Apache Mahout выпускается на условиях Apache Software license 2.0.

Напоминаю, что Apache Hadoop — один из перспективных проектов Apache Foundation, который предоставляет собой свободно распространяемый набор утилит, библиотек и программный каркас для разработки и выполнения распределённых программ, работающих на кластерах из сотен и тысяч узлов.

>>> Подробности

 , , , ,

ymn
()