Удалить элементы из списка удовл. рег. выражению

1

1

Приветствую! Помогите пожалуйста разобраться, почему код не работает как надо.

Есть список:

[('1 (BODY[HEADER.FIELDS (Subject)] {29}', 'Subject: Scan from Raffael\r\n\r\n'), ' RFC822.SIZE 289845 UID 17761)', 
('2 (BODY[HEADER.FIELDS (Subject)] {38}', 'Subject: do your work\r\n\r\n'), ' RFC822.SIZE 2637 UID 18022)', 
('3 (BODY[HEADER.FIELDS (Subject)] {24}', 'Subject: IP Adress\r\n\r\n'), ' RFC822.SIZE 67875 UID 18050)']

Хочется удалить из списка все элементы содержащие: «RFC822.SIZE <размер> UID <номер>)»

Я пытаюсь делать так:

 regexp= re.compile(r'( RFC822.SIZE) * (\d{1,9}) UID (\d{1,9}\))')
 filtered_subjects = filter(lambda a: a != regexp , subjects)

Если вместо regexp подставить точный текст, то он удаляется. С регулярным выражением нет. Поправьте пожалуйста.

Ссылка

← Веб-сервисы на Python.

GtkTreeView →

а документацию почитать?

lambda a: regexp.match(a) is not None

x0r ★★★★★
(23.10.13 14:33:31 MSK)

Ответ на: комментарий от x0r 23.10.13 14:33:31 MSK

что-то не так:

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "<stdin>", line 1, in <lambda>
TypeError: expected string or buffer

hope13 ★★★
(23.10.13 15:08:39 MSK) автор топика

Ответ на: комментарий от x0r 23.10.13 14:33:31 MSK

lambda a: regexp.search(a)

anonymous
(23.10.13 15:14:18 MSK)

Ответ на: комментарий от anonymous 23.10.13 15:14:18 MSK

Не, такая же ошибка. Попробуйте сами.

hope13 ★★★
(23.10.13 15:18:37 MSK) автор топика
Последнее исправление: hope13 23.10.13 15:19:03 MSK (всего исправлений: 1)

Ответ на: комментарий от hope13 23.10.13 15:18:37 MSK

Python 2.7.5 (default, May 15 2013, 22:43:36) [MSC v.1500 32 bit (Intel)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import re
>>> a=('111','222','aaa','333')
>>> regexp=re.compile('[0-9]+')
>>> filter(lambda a:regexp.search(a),a)
('111', '222', '333')
>>>

anonymous
(23.10.13 15:20:54 MSK)

Ответ на: комментарий от hope13 23.10.13 15:08:39 MSK

у тебя входные данные состоят из кучи разносортного дерьма, там же не список из строк

~~mashina~~ ★★★★★
(23.10.13 15:22:02 MSK)

Ответ на: комментарий от mashina 23.10.13 15:22:02 MSK

Ну в этом и закавыка. Хотя для точного текста всё работает. Там такая каша:

tulpe, str, tulpe, str, tulpe, str.....

hope13 ★★★
(23.10.13 15:25:23 MSK) автор топика
Последнее исправление: hope13 23.10.13 15:26:13 MSK (всего исправлений: 1)

Ответ на: комментарий от anonymous 23.10.13 15:20:54 MSK

Попробуй теперь с моими списком.

hope13 ★★★
(23.10.13 15:29:52 MSK) автор топика

Ссылка

Ответ на: комментарий от hope13 23.10.13 15:25:23 MSK

пиши тогда функцию, которая будет смотреть на тип элемента. Если строка то дёргаешь re, если кортеж - делаешь map с этой же ф-ей на кортеж

~~mashina~~ ★★★★★
(23.10.13 15:31:33 MSK)

Ссылка

Ответ на: комментарий от hope13 23.10.13 15:25:23 MSK

а, там же список из говна...

lambda a: regexp.match(a[1])

x0r ★★★★★
(23.10.13 15:49:32 MSK)

Ответ на: комментарий от x0r 23.10.13 15:49:32 MSK

Там волшебный список. Такой вариант, я уже пробовал. Получается просто пустой список :)

hope13 ★★★
(23.10.13 16:13:57 MSK) автор топика

' RFC822.SIZE 289845 UID 17761)'

r'\s+RFC822.SIZE\s+(\d+)\s+UID\s+(\d+)\)'

~~arturpub~~ ★★
(23.10.13 16:24:00 MSK)

Ответ на: комментарий от hope13 23.10.13 16:13:57 MSK

так у тебя же все записи матчатся по регекспу

x0r ★★★★★
(23.10.13 17:16:50 MSK)

Ссылка

Ответ на: комментарий от arturpub 23.10.13 16:24:00 MSK

А точку тоже не экранируешь.

Kalashnikov ★★★
(23.10.13 17:23:22 MSK)

Ответ на: комментарий от Kalashnikov 23.10.13 17:23:22 MSK

Да и фиг с ней, я не академик :)

~~arturpub~~ ★★
(23.10.13 18:40:20 MSK)

Ссылка

#!/usr/bin/python

import re

subjects =\
[('1 (BODY[HEADER.FIELDS (Subject)] {29}', 'Subject: Scan from Raffael\r\n\r\n'), ' RFC822.SIZE 289845 UID 17761)',.
 ('2 (BODY[HEADER.FIELDS (Subject)] {38}', 'Subject: do your work\r\n\r\n'), ' RFC822.SIZE 2637 UID 18022)',.
 ('2 (BODY[HEADER.FIELDS (Subject)] {38}', 'Subject: do your work\r\n\r\n'), ' RFC822.SIZE 2637 UID 180w22)',.
 ('3 (BODY[HEADER.FIELDS (Subject)] {24}', 'Subject: IP Adress\r\n\r\n'), ' RFC822.SIZE 67875 UID 18050)']
regexp= re.compile(r'( RFC822.SIZE) * (\d{1,9}) UID (\d{1,9}\))')

def group(a):
    lst = []
    for i in a:
        lst.append(i)
        if len(lst)==2:
            yield lst
            lst = []
def ungroup(a):
    for i in a:
        for j in i:
            yield j

filtered_subjects = list(ungroup(filter(lambda a: regexp.search(a[1]), group(subjects))))

anonymous
(23.10.13 20:58:32 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← Веб-сервисы на Python.

Development

GtkTreeView →

Похожие темы