Сабж. Приглашаются всякого рода энциклонги и просто люди, которым доводилось парсить википедию и её подпроекты. Хочется очень вытянуть список из категории отсюда (просто текста достаточно без ссылок и прочего хлама) https://ru.wikinews.org/wiki/Категория:Хоккеисты_по_алфавиту да все 1004 записей и ещё из нескольких категорий в самой жирной из которых 100k записей. Собственно викиданные через запрос тут https://query.wikidata.org/ не могут выдать большие категории (таймаут). Слышал ещё про другие api википедии, но боюсь, что там тоже ограничение раньше чем 100 000 записей будет. Кто как решал подобное? Поднять всю копию вики из дампа конечно можно, но это деньги (один день аренды машинки на которой будет полноценно ворочаться википедия стоит 3-5 килорублей и я не уверен что за день я её полноценно настрою и какое-то говно не вылезет, которое ещё неделю буду ковырять в конфигах каких-то лимиты, например которые будут нужны не дефолтные или ещё много чего может быть, а чисто чтоб поиграться с питоном и не заработать на этом и рубля, а только проверить одну гипотезу для себя, как по мне дороговатое удовольствие). Бан по айпишнику к википедии тоже схлопотать не хочу. Так что пишите кто как такое делал если делал. Какие инструменты использовал. В принципе могу использовать много чего, но предпочёл бы ограничиться Python, на худой конец C# или Java. Да, регулярно тягать оттуда данные мне нет нужды, раз в год а то и реже вполне норм.

Ответ на:
комментарий
от anonymous
Ответ на:
комментарий
от anonymous

Ответ на:
комментарий
от dataman

Ответ на:
комментарий
от peregrine
Ответ на:
комментарий
от peregrine
Ответ на:
комментарий
от peregrine
Ответ на:
комментарий
от peregrine

Ответ на:
комментарий
от peregrine
Ответ на:
комментарий
от LINUX-ORG-RU
Ответ на:
комментарий
от anonymous
Ответ на:
комментарий
от anonymous

Ответ на:
комментарий
от anonymous
Ответ на:
комментарий
от anonymous

Ответ на:
комментарий
от anonymous


Ответ на:
комментарий
от Psilocybe

Ответ на:
комментарий
от manntes-live

Ответ на:
комментарий
от peregrine


Ответ на:
комментарий
от itn

Ответ на:
комментарий
от peregrine
Ответ на:
комментарий
от peregrine
Ответ на:
комментарий
от anonymous

Ответ на:
комментарий
от peregrine
Ответ на:
комментарий
от anonymous

Ответ на:
комментарий
от peregrine
Ответ на:
комментарий
от peregrine
Ответ на:
комментарий
от anonymous

Ответ на:
комментарий
от peregrine
Похожие темы
- Форум Энциклонги (2007)
- Форум [баянъ] энциклонги (2008)
- Форум Энциклонги продолжают радовать (2007)
- Форум Энциклонги от мира IT и как с ними бороться (2019)
- Форум Тред. (2012)
- Форум треды (2006)
- Форум треды (2006)
- Форум Треды (2004)
- Форум Грибы-тред, помогите (2012)
- Форум Не прибиваются треды (2012)