Является ли такая реализация правильной?

dictionary, hash, python, структуры данных

0

2

Задача.

Имеются запросы в форме tuple of ints например

 
q=(1,5)  No1 query
q=(2,3)  No2 query
q=(3,1)  No3 query

q[0] может быть 1 или 2 или 3
q[1] - любое положительное число

Условия (по-англ. короче)
array=[ ]
if q[0]==1, insert q[1] to array
if q[0]==2, remove q[1] from array
if q[0]==3, check if there is integer whose frequency is q[1] in array

Количество запросов: 1<= queries <= 10**9

Является ли это правильным решением, если удалять запрошенные числа не по мере поступления запроса с q[0]=2, а сформировать сначала два независимых списка (один с числами для добавления, а другой с числами ждя удаления) и удалять, когда придет запрос с q[0]=3? И является ли решение с генераторами приемлемым или это странное решение?

def freqQuery(queries):
    from collections import Counter

    output=[]
    ad = Counter()
    de = Counter()
    for k,v in queries:
        if k==3:
            ad=ad-de
            if v in ad.values():
                output+=[1]
            else:
                output+=[0]
        elif k==2:
             de.update([v])
        else:
             ad.update([v])

    return output


def freqQuery(queries):
    from collections import Counter

    def helper(k, v, ad, de):

        if k==1:
            ad.update([v])   # add value as key & count its frequency only for No 1 queries
        elif k==2:
            de.update([v])   # add value as key & count its frequency only for No2 queries
        return ad-de         # remove all integers of No2 quaries from Counter related to No 1 queries


    a = Counter()
    d = Counter()

    #list of final arrays in the form of generator to analyze No 3 queries
    # such list includes Counters , tuples of Counter and int related to No 3 query
    gen=(helper(key, value, a, d) if key !=3 else (a, value) for key,value in queries)

    # list of tuples in the form of generator
    gen2=(item for item in gen if type(item) == tuple)

    #form final output
    gen3=(1 if item[1] in item[0].values() else 0 for item in gen2)

    return list(gen3)

Ссылка

← ION — убийца CBOR, protobuf и прочих форматов бинарной сериализации?

Не работает захват Ctrl+Shift+x в Qt 5.11.2 →

Работать должно правильно, но что если запросы в основном будут типа 3? Не будет ли производительность убита постоянным ad=ad-de + v in ad.values()?

xaizek ★★★★★
(08.12.18 14:17:45 MSK)

Оверинжениришь дофига. Вот решение проще:

def process_queries(queries):
    from collection import Counter
    array = Counter()

    total = 0
    for action, value in queries:

        if action == 0:
            array[value] += 1
            total += 1

        elif action == 1:
            array[value] -= 1
            total -= 1

        else:
            count = array[value]
            frequency = float(count) / float(total)

    return  # process_queries

anonymous
(08.12.18 14:42:26 MSK)

Ответ на: комментарий от xaizek 08.12.18 14:17:45 MSK

наверное, это неудачно

В этом варианте уже проще, но с ним тоже проблемы. Выполнение замедляется из-за v in c.values()?

def freqQuery(queries):
    from collections import Counter

    output=[]
    c=Counter()
    for k,v in queries:
        if k==1:
            c[v]+=1
        elif k==2 and v in c:
            c[v]-=1

        elif k==3:

            if v in c.values():
                output+=[1]
            else:
                output+=[0]
    return output

hibiscusM
(08.12.18 16:07:17 MSK) автор топика

Ответ на: комментарий от anonymous 08.12.18 14:42:26 MSK

я не понимаю что это

        else:
            count = array[value]
            frequency = float(count) / float(total)

в вашем коде value из запроса № 2 и № 3 - ключи в словаре array.

Вы берете запрос №3, в котором value не должно являться ключом в словаре. Оно должно быть значением одного из ключей.

hibiscusM
(08.12.18 16:13:52 MSK) автор топика

Ссылка

Ответ на: комментарий от hibiscusM 08.12.18 16:07:17 MSK

and v in c

Не думаю, что это надо проверять. Входные данные должны быть корректны.

Выполнение замедляется из-за v in c.values()?

Не больше чем должно, наверное. Если что, я не питонист.

Только дошло, что нужно там проверять. Думаю, можно сделать проверку быстрее с помощью дополнительного словаря.

output+=[1]

Мне кажется, что append может работать быстрее: output.append(1).

xaizek ★★★★★
(08.12.18 16:16:30 MSK)
Последнее исправление: xaizek 08.12.18 16:19:41 MSK (всего исправлений: 2)

Ответ на: комментарий от xaizek 08.12.18 16:16:30 MSK

Мне кажется, что append может работать быстрее: output.append(1)

да с этим стало работать быстрее

and v in c
Не думаю, что это надо проверять. Входные данные должны быть корректны.

(1,2)
(2,3)

>>> ar=Counter()
>>> ar[2]=1
>>> ar
Counter({2: 1})
>>> ar[3]-=1
>>> ar
Counter({2: 1, 3: -1})
>>>

hibiscusM
(08.12.18 16:32:59 MSK) автор топика

Ссылка

А это задачка не на использование всяких деревьев? )

vvn_black ★★★★★
(08.12.18 18:20:22 MSK)

Ответ на: комментарий от vvn_black 08.12.18 18:20:22 MSK

нет, тематика - hash tables.

hibiscusM
(09.12.18 17:24:43 MSK) автор топика

Ссылка

Ответ на: комментарий от vvn_black 08.12.18 18:20:22 MSK

Здесь нету ничего иерархического, да и у деревьев доступ по log(n). Эта на двусторонний хеш, похоже.

xaizek ★★★★★
(09.12.18 18:12:15 MSK)

Ответ на: комментарий от xaizek 09.12.18 18:12:15 MSK

ТС перед этим месяц активно BST осваивал, так подколол слегка.

vvn_black ★★★★★
(09.12.18 18:14:37 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← ION — убийца CBOR, protobuf и прочих форматов бинарной сериализации?

Development

Не работает захват Ctrl+Shift+x в Qt 5.11.2 →

Похожие темы