LINUX.ORG.RU

История изменений

Исправление foror, (текущая версия) :

1. Легально ли это?

Поисковики хранят базу всего публичного интернета, но ты же не поисковик?

Не нарушает ли это законы РФ\США\Других стран?

Зависит от многих факторов, вплоть до того сколько у тебя бабосов на банковском счету. Или думаешь законы стран логичны и выверены? И вот это прост так придумали: Закон, что дышло, хе-хе, — забубнил Ездаков, — куда повернул — туда и вышло.

2. Я так понимаю что надо очень быстрый интернет, то есть арендовать выделенный сервер на гигабитами в секунду.

Нужно много ipv4 не заблоченных пациентом. У хетцнера, например, много ipv4 заблочены. Купишь и обломаешься.

Поэтому покупать лучше у малоизвестных хостеров, но которые не перепродают ресурсы известных хостеров. А еще можно попробовать проксей купить, кто гарантирует, что они не заблочены. Но есть риск купить базу зомбей и попасть под раздачу отделения «К».

Не забанят ли за это хостеры?

Им пох, если тебя не ддосят и абузы на тебя не шлют.

Не забнят ли «по IP» служба безопасности социальных сетей?

Забанит.

Не нарушает ли это правила социальных сетей?

См. подпункт 1 (про законы)

4. Может кто знает с чего начать?

С программирования. Лучше использовать джаву, если не осилишь, можешь попробовать питон или голанг. Больше тебе не подскажут, потому что ты спалишь пул ipv4 своими неграмотными действиями, а людям потом новый пул собирать.

Это должен быть shell script с использованием wget или есть специальные инструменты для этого?

Нет, это будет относительно сложная, многопоточная программа, с выверенными таймаутами для каждого потока, с биндингом ipv4 или прокси на каждый поток. С библиотекой для разбора HTML и умеющая в XPath запросы. И по итогу сливающая всё в одну базу.

Исходная версия foror, :

1. Легально ли это?

Поисковики хранят базу всего публичного интернета, но ты же не поисковик?

Не нарушает ли это законы РФ\США\Других стран?

Зависит от многих факторов, вплоть до того сколько у тебя бабосов на банковском счету. Или думаешь законы стран логичны и выверены? И вот это прост так придумали: Закон, что дышло, хе-хе, — забубнил Ездаков, — куда повернул — туда и вышло.

2. Я так понимаю что надо очень быстрый интернет, то есть арендовать выделенный сервер на гигабитами в секунду.

Нужно много ipv4 не заблоченных пациентом. У хетцнера, например, много ipv4 заблочены. Купишь и обломаешься.

Поэтому покупать лучше у малоизвестных хостеров, но которые не перепродают ресурсы известных хостеров. А еще можно попробовать проксей купить, кто гарантирует, что они не заблочены. Но есть риск купить базу зомбей и попасть под раздачу отделения «К».

Не забанят ли за это хостеры?

Им пох, если тебя не ддосят и абузы на тебя не шлют.

Не забнят ли «по IP» служба безопасности социальных сетей?

Забанит.

Не нарушает ли это правила социальных сетей?

См. подпункт 1 (про законы)

4. Может кто знает с чего начать?

С программирования. Лучше использовать джаву, если не осилишь, можешь попробовать питон или голанг. Больше тебе не подскажут, потому что ты спалишь пул ipv4 своими неграмотными действиями, а людям потом новый пул собирать.

Это должен быть shell script с использованием wget или есть специальные инструменты для этого?

Нет, это будет относительно сложная, многопоточная программа, с выверенными таймаутами для каждого потока, с биндингом ipv4 или прокси на каждый поток. И по итогу сливающая всё в одну базу.