Помогите выбрать язык программирования.

1

3

Добрый вечер. Нужен какой-то язык программирования для анализа больших csv файлов, написанная программа на котором работала быстро. Все решения на python не подходят из-за медлительности, делать что-то с применением cython долго и не всегда приводит к резкому увеличению производительности.

Что мне надо:

Наличие отладчика;
Понятный и легкий синтаксис.
Автоматическая уборка мусора. Руками освобождать память — усложнение кода.

Что я пробовал:

Nim — проблемы с инфраструктурой (нормально не запускается отладка) + еще не стабилен. Но язык понравился.
Rust — на мой взгляд переусложнили с unwrap(), например + зачем-то сделали 2 вида строк.
С, С++ — не нравится «ручная» работа с памятью.

Сейчас присматриваюсь к Go, но отталкивает поддержка многопоточности, Scala — Хорошая интеграция с экосистемой java или .net. Еще не читал документацию.

Ссылка

← WebKitGtk без GUI

Методология разработки ПО, просьба поделиться опытом →

← 1 2 3 →

Ответ на: комментарий от Iron_Bug 19.01.16 00:11:54 MSK

справедливости ради стоит заметить, что существует несколько реализаций контейнеров STL. но все они проигрывают по скорости простым связным спискам с аллокацией в пулах.

Нелепое утверждение, по крайней мере по двум причинам:

1. Не указано, для какого сценария использования нужен контейнер. Если контейнер используется для прямого доступа к элементам по индексу или для частых последовательных проходов вперед/назад, но без вставок/удалений (особенно в середину), то вряд ли связный список будет эффективнее простого вектора, даже с аллокацией в пулах.

2. Для стандартных контейнеров так же можно использовать свои аллокаторы, в том числе и на основе пулов. Пока, правда, это не очень удобно, но в над этим работают.

eao197 ★★★★★
(19.01.16 09:29:40 MSK)

Ссылка

Ответ на: комментарий от Iron_Bug 19.01.16 00:11:54 MSK

меня не надо отсылать к измерениям. я их за 20 лет сделала предостаточно.

Похоже, замуж уже поздно...

ovk48 ★★★
(19.01.16 09:37:58 MSK)

Ссылка

Ответ на: комментарий от dicos 18.01.16 12:39:36 MSK

Ты вообще почитал описание?
- Highly optimized for performance, with critical code paths written in Cython or C.
- Python with pandas is in use in a wide variety of academic and commercial domains, including Finance, Neuroscience, Economics, Statistics, Advertising, Web Analytics, and more.

Похоже на твой случай?

zolden ★★★★★
(19.01.16 10:27:02 MSK)

Ответ на: комментарий от dicos 19.01.16 07:11:44 MSK

Эту, что ли?
https://docs.oracle.com/javase/8/docs/api/java/util/stream/Stream.html

GoodPerson ★
(19.01.16 11:22:26 MSK)

Ответ на: комментарий от zolden 19.01.16 10:27:02 MSK

Да, читал.

1. Не подходит из-за того, что почти весь код придется переписать на Cython. Если писать на C критические участки, то вообще питон не нужен, так как большая часть программного кода будет С.

2. Аналитика аналитике рознь. Так как я только примерно знаю что мне надо, лучше взять какой-то быстрый язык и на нем сделать, чем читать документацию и думать что же с этими полученными знаниями делать.

dicos ★★★
(19.01.16 12:41:35 MSK) автор топика

Ответ на: комментарий от GoodPerson 19.01.16 11:22:26 MSK

ага, я думал это питонячьий код

dicos ★★★
(19.01.16 12:42:14 MSK) автор топика

Ответ на: комментарий от dicos 19.01.16 12:41:35 MSK

Не подходит из-за того, что почти весь код придется переписать на Cython

Хз с чего ты это взял, но тебе несомненно видней

zolden ★★★★★
(19.01.16 13:05:24 MSK)

Ссылка

Ответ на: комментарий от jori 19.01.16 00:51:12 MSK

И кстати, го без геморроя собирается под линь, винь и мак. Я думаю это хороший бонус.

jori ★
(19.01.16 14:17:16 MSK)

Шла вторая страница обсуждения хай-перфоманс языка для парсанга цсв.

cdshines ★★★★★
(19.01.16 14:19:34 MSK)

Ответ на: комментарий от cdshines 19.01.16 14:19:34 MSK

Off-topic Третья, для default-настройки (50 комментариев на странице) :D А так, да, уездили тему :)

znenyegvkby ★
(19.01.16 14:26:47 MSK)

Ссылка

Ответ на: комментарий от cdshines 19.01.16 14:19:34 MSK

Ему же не только «парсанг цсв» нужен. Еще с сетью работать, алгоритмы машинного обучения, какая-то веб-морда.

jori ★
(19.01.16 14:29:54 MSK)

Ссылка

Ответ на: комментарий от dicos 19.01.16 12:42:14 MSK

А выкати своим csv-файлы на пару гигов, чтобы устроить батл.

anonymous
(19.01.16 15:18:30 MSK)

Ответ на: комментарий от cdshines 19.01.16 14:19:34 MSK

Мне не нужен просто парсинг цсв, мне надо обработать данные. Сам по себе парсинг и на питоне отлично работает.

dicos ★★★
(19.01.16 15:43:24 MSK) автор топика

Ответ на: комментарий от anonymous 19.01.16 15:18:30 MSK

Завтра сделаю.

dicos ★★★
(19.01.16 15:45:13 MSK) автор топика

Ссылка

Ответ на: комментарий от jori 19.01.16 14:17:16 MSK

Да, уже пытаюсь какую-то программку на нем написать.

dicos ★★★
(19.01.16 15:45:46 MSK) автор топика

Ответ на: комментарий от dicos 19.01.16 15:43:24 MSK

Так напиши в ОП, а то из него кажется, что ты просто грепать не умеешь.

cdshines ★★★★★
(19.01.16 15:46:01 MSK)

Ответ на: комментарий от cdshines 19.01.16 15:46:01 MSK

Прочитал тред. Пиши на чем угодно из предложенного. го или пузон или скала.

cdshines ★★★★★
(19.01.16 15:50:57 MSK)

Ссылка

Голосую за C#. Под Linux-ом есть mono.

peregrine ★★★★★
(19.01.16 16:05:26 MSK)

Ссылка

Ответ на: комментарий от cdshines 19.01.16 15:46:01 MSK

кажется, что ты просто грепать не умеешь

Ну что ж ты сразу с козырей то ходишь
Надо было подождать пока ТС начнёт рассказывать про Big Data, Hadoop, вот это всё

zolden ★★★★★
(19.01.16 16:32:51 MSK)

Ответ на: комментарий от zolden 19.01.16 16:32:51 MSK

Я еще маленький для таких умных слов :-)

dicos ★★★
(19.01.16 17:19:18 MSK) автор топика

Ссылка

Ответ на: комментарий от dicos 19.01.16 15:45:46 MSK

Уже дошел до ипанутого if err != nil {} на каждый чих?

jori ★
(20.01.16 01:30:06 MSK)

Ссылка

Да тут однозначно JVM с кучей библиотек для всяких CSV подойдёт на ура. К тому же есть всякие сфинксы, «люся» и обвязки для поиска полнотекстового по текстовым файлам. Кстати, на Сишке есть неплохие библиотеки для автоматического подсчёты ссылок, чтобы не трахаться с вашей ручной памятью, нормальные строки и массивы, ну и т.п. фенечки - не всё так плохо. Есть ещё Objective-C и открытый Swift. Лучше уж на них писать, компилируя с си или си++ библиотеками статическими, если уж охренеть как нужна скорость, что прям по 5 Гигов файлы каждый час нужно грепать.

А про питон - попробуй лучше запустить свой код на Jython / PyPy.

menangen ★★★★★
(20.01.16 01:38:18 MSK)

Ссылка

Ответ на: комментарий от Oxdeadbeef 18.01.16 09:55:04 MSK

Ну тогда бери R (как уже советовали)

Братишка, а ты пробовал R для больших данных (миллионы строк)? Он отсасывает на таких задачах с такой силой, что приходится придумывать костыли с предварительной конверсией данных и последующим mmap'ом.

anonymous
(20.01.16 02:19:38 MSK)

Ссылка

Ответ на: комментарий от dicos 18.01.16 12:38:37 MSK

«анализ» — это поиск зависимостей по историческим данным, чтобы по этим зависимостям можно было предугадать дальнейшее изменение цены.

лучше бы на завод токарем пошел
с такими запросами тебе в R без вариантов

anonymous
(20.01.16 02:21:26 MSK)

Ссылка

Ответ на: комментарий от anonymous 19.01.16 15:18:30 MSK

Вот несколько файлов: https://yadi.sk/d/I6nEDMOnnPHN2

dicos ★★★
(20.01.16 07:55:33 MSK) автор топика

Посмотри еще Ocaml/F# - по ним вроде были истории успеха как раз в области финансового анализа. Если решишь пойти хоть чуть-чуть дальше «предсказаний» цены по скользящей средней, есть например целая книжка F# for Quantitative Finance.

ovk48 ★★★
(20.01.16 08:11:58 MSK)

Ответ на: комментарий от ovk48 20.01.16 08:11:58 MSK

Спасибо, почитаю.

dicos ★★★
(20.01.16 08:23:12 MSK) автор топика

Ссылка

Ответ на: комментарий от dicos 20.01.16 07:55:33 MSK

Вот несколько файлов: https://yadi.sk/d/I6nEDMOnnPHN2

Ну чо, летс зе бэттл бегин?

anonymous
(20.01.16 12:09:06 MSK)

Ответ на: комментарий от anonymous 20.01.16 12:09:06 MSK

Ты, видимо, понял задачу, как «кто быстрее прочитает файл с диска»?
Или что именно за баттл?

zolden ★★★★★
(20.01.16 13:23:49 MSK)

Ответ на: комментарий от zolden 20.01.16 13:23:49 MSK

Преобразовать файл во вменяемое представление в памяти. Хотя-бы массив {price, id, date}, можно с последующим дампом в файл и загрузкой. либо [id]{price, date} или что там автору нужно.

Потом можно прикрутить поиск - если автор опишет что он из себя представляет.

anonymous
(20.01.16 15:35:19 MSK)