LINUX.ORG.RU
ФорумTalks

Помогите найти критерий определения типа страницы


0

1

Нужна помощь людей с больным воображением и воспалённой фантазией — меня одного не хватает.
В википедии попадаются иногда страницы, которые не описание какого-то понятия, а лишь список ссылок.
Например http://ru.wikipedia.org/wiki/Поле
не описывает поле, а содержит множество ссылок на статьи про различные поля (от векторных, до аграрных).
Помогите найти на странице что-то такое, что точно указывало бы, что эта страница лишь список.
Причём важно, чтобы это что-то не зависело от языка.
Так, например, строка title=«Категория:Многозначные термины» хоть и точно детектирует такую страницу, но лишь для русского. А языков много.
Как вам такая задача?

★★☆

Также можно считать количество —, элементов списков, ссылок на знак текста. Обучите классификатор.

Sadler ★★★
()
Ответ на: комментарий от abraziv_whiskey

Ыъ!
Вот что значит свежий взгяд!
Спасибо тебе, человек.

P.S. И не пей виски с абразивом — это может привести к язве.

Stahl ★★☆
() автор топика

grep disamb по исходному коду

crowbar
()
Ответ на: комментарий от amomymous

А как же! Костыль - это самое устойчивое решение, как показывает опыт.

abraziv_whiskey ★★★★★
()
Ответ на: комментарий от NeXTSTEP

У них есть как минимум две страницы. Одна Help:Disambiguation и вторая Wikipedia:Disambiguation. На одну ведёт цветной значок, на другую серый. В разницу не вчитывался.

Xellos ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.