LINUX.ORG.RU

Сообщения E2-E4

 

Обойти рекурсивно сайт

Здравствуйте, нужно не закачивая сайт, обойти его рекурсивно, и выдрать всё, что находится между тегами, допустим между <h1>...</h1> и соответственно, результаты записать в файл.Страницы закачивать не нужно, слишком жирно.
Чем и как бы всё это организовать? Я так понял, что с вгетом это плохо получится?

 , ,

E2-E4
()

Линукс в аниме

Сабж. Встречался ли он там хотя бы отдалено? Маздай, к примеру, встречается. Например, на компе у Киры в Тетради Смерти.

 ,

E2-E4
()

Получить из числа рандомные слагаемые

Есть число. Например. 10 миллиардов. 10.000.000.000. 10^10
Мне нужно, получить сто достаточно рандомных слагаемых из этих 10^10, которые бы в сумме дали эти самые 10 миллиардов. И еще, пожалуй, стоит поставить условия, чтобы слагаемые не повторялись.
Как?

Спасибо.

 , ,

E2-E4
()

Простой вопрос про Гитхаб

https://cardse.net/image/F9q

То ли я не туда кликнул, может я пьяный был, но откуда в моем профиле это появилось, что это такое, и как мне это удалить? Это не мое, мне это не интересно, это не форк, я за этим чудом не слежу. Единственное чего я хочу, избавится от этого.
Что эта книжечка вообще означает? Просьба ответить нормально, не петросянствовать.

 

E2-E4
()

Подскажите резолвер DNS

Нужна легкая, быстрая, надежная, мультипоточная тулза для обработки списков содержащих миллионы доменов.
То есть получить linux.org.ru -> 178.248.233.6 от первого же отозвавшегося сервера. Или, если ответ не пришел, записать и это. Ну и конечно, если пришел ответ ответ что такого не существует.
Спасибо.

 , ,

E2-E4
()

Какой алгоритм(ы) сортировки использует sort?

Известно, что этих алгоритмов имеется под три десятка. Некоторые из них носят демонстрационный, обучающий, а то и просто развлекательный характер. Другие же, носят характер сугубо практический, и которые, судя по тестам и теории, оптимальны для определенных задач.
Сабж.
А какой алгоритм(ы) использует sort?

 , , ,

E2-E4
()

Помогите с регуляркой

Если в строке присутствует хотя бы один символ не из набора, то строку удалить.

Например, если набор [a-zа-я0-9], то удалить:
apk!!**lol
地方的脱贫攻坚答卷
地方的脱7777贫攻坚答卷

а вот это оставить:
apkжэш
7776654
linux

Перемещено leave из talks

 

E2-E4
()

Поиск строк по списку

Есть текстовые файл(ы), в них конечно же есть строки, а есть список элементов элементов строк.
Как найти и выдрать эти строки в отдельный файл?
И там и там их очень много, поэтому, мне бы какое-то быстродействующее решение. Быстродействие, реализовать можно, к примеру, за счет большого кэша оперативной памяти, которую могу выделить для этой операции.

 ,

E2-E4
()

enca построчное преобразование кодировки

В файле кракозябры. Хорошо, если бы все строки были в одной кодировке, и преобразовать их можно было бы как 1251->utf-8. Нет, строки разные. Разные кодировки.
Как бы сделать, чтобы считывался файл построчно, определять, преобразовать и заменить строку автоматически?

 , , ,

E2-E4
()

Проблема с sort

Есть файл over 20Gb, который мне нужно отсортировать и попутно удалить дубликаты.

sort --parallel=4 -u in.txt -o out.txt
Проблема в том, что out.txt выглядит как будто сырой пакет, вместо отсортированного списка, который я ожидаю.

https://vgy.me/gTXVaT.png

Что я сделал не так?

 

E2-E4
()

Удалить дубликаты строк из разных файлов

Есть много файлов, как их сравнить между собой и удалить дубликаты строк? Не из одного файла, тут все понятно, а из разных, не объеденяя их.

E2-E4
()

глупый вопрос (curl)

на машине нет wget :( но есть curl :) как скопировать несколько удаленных файлов на локальную машину в определенную директорию? не давайте ссылки и маны, голова трещит. конкретные параметры какие?

curl site.com/backup.zip /usr/home/1.zip - не работает.

тупой вопрос, да.

E2-E4
()

RSS подписка на новые темы