Как бы такой алгоритм переложить на чистое ФП

0

2

Есть такой код:

escape = False
        
unescaped = []
        
for x in data:
    if escape :
        unescaped.append(x ^ 0x7D)
        escape = False
            
    if x == 0x7D:
        escape = True
    else:
        unescaped.append(x)

суть его в том, что в массиве байт могут быть экранированные символы, которые предваряются определёным байтом и надо получить новый массив, в котором будут все байты без экранирования.

Что интересно - как можно подобный алгоритм реализовать в чистом функциональном ЯП. лиспо-хаскело-эрланго-срач приветствуется.

Ссылка

← git список коммитов на удаленном сервере

насколько целесообразно уклоняться от создания глобальных объектов? →

а решение на питоне в функциональном стиле не канает?

ymn ★★★★★
(18.02.13 18:07:17 MSK)

неоптимально, но функционально:

es = chr 0x7D
unescape :: [String] -> [String]
unescape [] = []
unescape (es:x:xs) = ord x .|. 0x7D : unescape xs
unescape x:xs = x :unescape xs

оптимальный вариант на байтострингах искать лень, там есть несколько эффективных и чистых вариантов, можно и грязно сработать, тогда более эффективно будет.

qnikst ★★★★★
(18.02.13 18:19:06 MSK)

Ссылка

Ответ на: комментарий от ymn 18.02.13 18:07:17 MSK

был бы пример, а перенести на питон проблемы не составит. Это мне скорее для понимания, как подобные вещи в принципе реализовывать.

Dark_SavanT ★★★★★
(18.02.13 18:29:18 MSK) автор топика
Последнее исправление: Dark_SavanT 18.02.13 18:29:51 MSK (всего исправлений: 1)

Ссылка

reduce( lambda R, x: R[:-1]+[x^0x7D] if R and R[-1]==0x7D else R+[x], data, [] )

как то так.

~~AIv~~ ★★★★★
(18.02.13 18:36:18 MSK)

Ответ на: комментарий от AIv 18.02.13 18:36:18 MSK

Про APL вроде не спрашивали?

anonymous
(18.02.13 18:58:11 MSK)

Ответ на: комментарий от anonymous 18.02.13 18:58:11 MSK

Вообще то это питон;-)

~~AIv~~ ★★★★★
(18.02.13 18:59:47 MSK)

Ссылка

-module(f).
-export([f/2]).

f([], A) ->
	A;

f([H|T], A) when H == escape ->
	f(T, A);

f([H|T], A) ->
	f(T, lists:append(A, [H])).

сильно не пинайте, всё ещё его изучаю.

~~nanoolinux~~ ★★★★
(18.02.13 20:09:33 MSK)

Ссылка

А первый символ массива по условию не может быть экранированным?

tailgunner ★★★★★
(18.02.13 20:12:45 MSK)

а зачем ?

решение задачи на питоне - на самом деле один вызов re.sub, так же как и на любом другом языке.

MKuznetsov ★★★★★
(18.02.13 20:19:50 MSK)

[char == 0x7d and char ^ 0x7d or char for char in data]

Virtuos86 ★★★★★
(18.02.13 22:19:26 MSK)
Последнее исправление: Virtuos86 18.02.13 22:27:58 MSK (всего исправлений: 2)

Ответ на: комментарий от AIv 18.02.13 18:36:18 MSK

жжошь, отец :)

Virtuos86 ★★★★★
(18.02.13 22:20:42 MSK)

Ссылка

Ответ на: комментарий от MKuznetsov 18.02.13 20:19:50 MSK

регекспы для такой задачи? да вы издеваетесь.

qnikst ★★★★★
(18.02.13 22:27:39 MSK)

Ответ на: комментарий от Virtuos86 18.02.13 22:19:26 MSK

Если это питон, то это решение не той задачи. Лучше жечь, чем тупить;-)

~~AIv~~ ★★★★★
(18.02.13 22:43:14 MSK)

Ответ на: комментарий от qnikst 18.02.13 22:27:39 MSK

регекспы для такой задачи? да вы издеваетесь.

самое то, кратко пишется, быстро работает, всем понятно, легко сопроваждается.

НО, если вам в Индии, нужен объём, то можно предложить много всяких подходов..функциональный - не самый выгодный..

Рассмотрите лучше ОО - можно создать класс(шаблон/интерфейс) который представляет исходное нечто, закодить класс substitutionRulezz, ко всему этому фабрику, и наконец-то transformer..возможен такой полёт фантазии, что можно реализовывать года два, лишь бы платили :)

MKuznetsov ★★★★★
(19.02.13 01:28:43 MSK)

Ответ на: комментарий от MKuznetsov 19.02.13 01:28:43 MSK

самое то, кратко пишется, быстро работает, всем понятно, легко сопроваждается.

для перла или пхп соглашусь, при этом приведенный мною понятный код, так же быстро пишется и легко сопровождается, и надеюсь вы не будете утверждать, что эти подходы работают хотя бы за сравнимое время?

НО, если вам в Индии, нужен объём,

давайте вы не будете меня учить, что мне читать и рассматривать, хорошо?

qnikst ★★★★★
(19.02.13 01:35:25 MSK)

Ссылка

Ответ на: комментарий от MKuznetsov 19.02.13 01:28:43 MSK

ну и в дополнение к моему посту, хотелось бы увидеть, то как дожно выглядеть решение использующее re.sub.

qnikst ★★★★★
(19.02.13 01:39:54 MSK)

обещанный вариант на байтстрингах с фьюзингом и прочими радостями:

unescape xs = toLazyByteString (s <> (foldl' (<>) mempty t'))
     where (s,t) = span (/=0x7D) xs
           t' = map (\x -> word8 (head x .|. 0x7D) <> bytestring (tail x)) (split 0x7D)

можно было написать сильно проще, но не правильно, всё равно никто проверять не будет.

qnikst ★★★★★
(19.02.13 01:51:08 MSK)
Последнее исправление: qnikst 19.02.13 01:54:46 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от qnikst 19.02.13 01:39:54 MSK

к примеру

import re

s = 'Hello ^[[42mgreen word^[[0m'

print re.sub(r'\^(.)',lambda m:chr(ord(m.group(1))-0100),s)

см http://docs.python.org/2/library/re.html «7.2.5.5. Text Munging»

MKuznetsov ★★★★★
(19.02.13 02:34:25 MSK)

Ответ на: комментарий от tailgunner 18.02.13 20:12:45 MSK

Может. на это ограничений нет.

Dark_SavanT ★★★★★
(19.02.13 09:00:50 MSK) автор топика

Ссылка

Ответ на: комментарий от MKuznetsov 19.02.13 02:34:25 MSK

принятно, но ну его к черту такое решение за рамками интерпретируемых языков :)

qnikst ★★★★★
(19.02.13 09:10:37 MSK)

Ссылка

Ответ на: комментарий от AIv 18.02.13 22:43:14 MSK

Ну так. Тред не читай @ сразу отвечай :-). Но от своих слов я не отказываюсь всё равно.

Virtuos86 ★★★★★
(19.02.13 09:28:47 MSK)

Ссылка

Как-то так

def unescape(data):
    i = iter(data)
    while True:
        try:
            x = next(i)
            yield next(i) ^ 0x7D if x == 0x7D else x
        except StopIteration:
            break

p.s. код не проверял, мог допустить ошибку, но принцип такой.

p.p.s. наверное можно и проще без десятиэтажных конструкций

BattleCoder ★★★★★
(19.02.13 09:36:39 MSK)
Последнее исправление: BattleCoder 19.02.13 09:46:16 MSK (всего исправлений: 6)

Ответ на: Как-то так от BattleCoder 19.02.13 09:36:39 MSK

Не вижу смысла в данном случае делать ленивые вычисления, поскольку «очищенный» массив будет сразу же попилен на header+payload и дальше разобран.

Dark_SavanT ★★★★★
(19.02.13 11:00:36 MSK) автор топика

Ответ на: комментарий от Dark_SavanT 19.02.13 11:00:36 MSK

Ну зато ФП стиль. За исключением двух переменных, но это по факту не переменные, а константы - в питоне просто вроде нет констант как таковых.

А ленивость тут особой роли не играет... output = list(unescape(input))

По факту тут нужен генератор списков.

BattleCoder ★★★★★
(19.02.13 12:06:32 MSK)

Ответ на: комментарий от BattleCoder 19.02.13 12:06:32 MSK

По факту, проще (короче) чем с reduce сделать не получиться. С генератором будет муторно, придется делать тройки элементов и отдельно обрабатывать концы.

Ну или прятаться за елдами и пр фигней, но это во первых много строк, во вторых чудес то не бывает - все равно надо хранить «состояние», которое меняется экранирующим символом.

~~AIv~~ ★★★★★
(20.02.13 13:29:50 MSK)

Ответ на: комментарий от AIv 20.02.13 13:29:50 MSK

да... наверное reduce попроще :) я ваш пост как-то проглядел.

BattleCoder ★★★★★
(20.02.13 13:31:28 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← git список коммитов на удаленном сервере

Development

насколько целесообразно уклоняться от создания глобальных объектов? →

Как-то так

Похожие темы