LINUX.ORG.RU

Прошу помочь с регексом - парсер перечня доменов ruadlist

 ,


0

1

Запилил себе на сервере DNS с встроенным адблоком, воспользовался этим скриптом для генерации базы доменов. Опыт прошел успешно, но хочется добавить в скрипт получение базы доменом из ruadlist. В сети есть парсер на grep и sed, но в скрипте используется парсер на python, соответственно прошу подсказать, как перевести это

/usr/bin/fetch -qo - 'https://easylist-downloads.adblockplus.org/ruadlist+easylist.txt' | grep '^||.*\^$' | sed 's/||//g' | sed 's/\^//g'
в такой формат
{'url': 'https://pgl.yoyo.org/as/serverlist.php?hostformat=nohtml&showintro=0'},
{'url': 'http://mirror1.malwaredomains.com/files/justdomains'},
{'url': 'http://winhelp2002.mvps.org/hosts.txt', 'regex': '^0\\.0\\.0\\.0\\s+(?P<domain>([a-z0-9\\-_]+\\.)+[a-z]+)$'},
{'url': 'https://adaway.org/hosts.txt', 'regex': '^127\\.0\\.0\\.1 (?P<domain>([a-z0-9\\-_]+\\.)+[a-z]+)$'},
{'url': 'https://hosts-file.net/ad_servers.txt', 'regex': '^127\\.0\\.0\\.1\\s+(?P<domain>([a-z0-9\\-]+\\.)+[a-z]+)$'},
{'url': 'http://someonewhocares.org/hosts/zero/hosts', 'regex': '^0\\.0\\.0\\.0\\s+(?P<domain>([a-z0-9\\-_]+\\.)+[a-z]+)$'},
{'url': 'https://www.malwaredomainlist.com/hostslist/hosts.txt', 'regex': '^127\\.0\\.0\\.1\\s+(?P<domain>([a-z0-9\\-]+\\.)+[a-z]+)$'}

В программировании не силен, поэтому перевести регекс из баша в питон, к сожалению, не смог

Юзай pihole. Сделай форвард со своего днс на него. Там все красиво и с графичками)

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.