[haskell] Регулярные выражения

haskell

Есть две задачи, которые в perl делал при помощи сабжа: если строка начинается с правильного слова и заканчивается правильным словом, тогда извлечь из строки подстроку соответствующею заданному выражению и если строка содержит правильное слово, тогда заменить его на другую подстроку. Собственно вопрос: можно ли это сделать в haskell? Сейчас первое решено извлечением из текста Maybe String соответствующего правильной строке, а затем извлечением из неё правильной подстроки, а второе — не решено вообще.

Ссылка

← Почему не запускается команда в скрипте на ruby?

[django][python] Разные результаты queryset →

хм?

jtootf ★★★★★
(14.01.11 19:46:16 MSK)

Хм, биндинги к PCRE, причем много всяких, есть даже с квазиквотером.

А так, если тебе не сильно важна производительность, заюзай Parsec. Это намного приятнее, чем кошка-по-клаве-стайл регулярных выражений. И контекстно-зависимо можно сделать, отпять же...

Macil ★★★★★
(14.01.11 19:54:44 MSK)

Ответ на: комментарий от jtootf 14.01.11 19:46:16 MSK

Это я уже видел. Тут дело в другом. Допустим у меня есть кусок текста

Год 2011ый
Число 42

из которого мне необходимо извлечь год. Я могу воспользоваться perl и сделать как-то так:

$str =~ /^Год +([0-9]+)ый$/

И поимею в $1 выражение в скобочках. В haskell же у меня получается пока только выделить всю совпавшую строку из-за чего мне приходится разбирать её два раза (сначала ищу правильную строку, потом извлекаю из неё дату). Собственно меня интересует, есть ли возможность получить не всю совпавшую строку, а только её часть.

KblCb ★★★★★
(14.01.11 20:01:57 MSK) автор топика

Ответ на: комментарий от Macil 14.01.11 19:54:44 MSK

Parsec безусловно прекрасен, да и не факт что медленнее чем Text.Regex.Posix. Я когда в нём малость разобрался, поплакал о том что года 3 назад писал парсер для cue-таблиц на перловых регулярках. Но я как раз только что отказался от использования parsec'а по нескольким причинам: программка маленькая и парсер на parsec'е ощутимо раздувает её код, программка маленькая и парсер на parsec'е ощутимо раздувает бинарник, ну и использовать parsec для таких бытовых задач как-то странно.

KblCb ★★★★★
(14.01.11 20:41:09 MSK) автор топика

Ссылка

Ответ на: комментарий от KblCb 14.01.11 20:01:57 MSK

Собственно меня интересует, есть ли возможность получить не всю совпавшую строку, а только её часть.

Prelude Text.Read Text.ParserCombinators.ReadP Data.Char> let p =  string "Year" >> skipSpaces >> (many1 $ satisfy isDigit) >>= \x -> (string "suf") >> return x in readP_to_S p "Year 2011suf"
[("2011","")]

Ну или записать с помощью do:

p = do { string "Year"
       ; skipSpaces
       ; x <- many1 $ satisfy isDigit
       ; string "suf"
       ; return x
       }

Вроде ничего не раздувается

anonymous
(15.01.11 07:23:40 MSK)

Ответ на: комментарий от anonymous 15.01.11 07:23:40 MSK

Там совсем маленький инструмент меньше чем на сто строк включая сигнатуры, импорты и комментарии. И я очень надеюсь, что так оно и останется. Да и вопрос в общем был именно про то можно ли это решить при помощи регулярок. Text.ParserCombinators.ReadP в любом случае дома посмотрю.

KblCb ★★★★★
(15.01.11 15:48:38 MSK) автор топика

Ответ на: комментарий от KblCb 15.01.11 15:48:38 MSK

Ну так я тебе дал вариант из 2ух строк импорта и ещё пары строк на всё остальное. Куда меньше-то?

anonymous
(15.01.11 16:13:05 MSK)

Ссылка

Ответ на: комментарий от KblCb 15.01.11 15:48:38 MSK

> Да и вопрос в общем был именно про то можно ли это решить при помощи регулярок.

оффтопик: если ты построчно обрабатываешь текст и тебе нужны регэкспы и удобна работа с ними, то советую делать это с помощью awk :)

anonymous
(15.01.11 16:14:51 MSK)

Если ничего не помогает, прочтите, наконец, доку

h> "abbbbcc" =~ "(a+)(b+)(c+)" :: [[String]]
[["abbbbcc","a","bbbb","cc"]]

lelf
(15.01.11 22:19:20 MSK)

Ответ на: комментарий от anonymous 15.01.11 16:14:51 MSK

Угу, и дёргать его из bash'е скрипта.

KblCb ★★★★★
(15.01.11 23:39:52 MSK) автор топика

Ссылка

Ответ на: комментарий от lelf 15.01.11 22:19:20 MSK

Чёрт. То что надо. В своё оправдание могу сказать лишь то, что с документацией в hackage обычно плохо. А почему такой странный тип?

KblCb ★★★★★
(15.01.11 23:43:11 MSK) автор топика

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← Почему не запускается команда в скрипте на ruby?

Development

[django][python] Разные результаты queryset →

Похожие темы