История изменений
Исправление amomymous, (текущая версия) :
Формализовать задачу можно следующим образом: пусть имеются N статей, и L[i][j] = 1, если i-я статья ссылается на j-ю. Таким образом, L - матрица перекрестных ссылок. Далее предположим, что у любой статьи есть входящие ссылки. Пусть R[i] - степень понимания ранее прочитанной статьи i, от 0 до 1. И пусть чтение i-й статьи позволяет понять ее полностью или нет, в зависимости от числа ранее прочитанных статей, на которые она ссылается:
f(i) = b[i] + (1 - b[i]) * sum по j(w[j]*R[j])/sum по j(w[j]*L[j][i]), где 0<=f(i)<=1, для простоты линейная зависимость, b - уровень понимания статьи с 0 прочитанных ссылок, (1-b[i]) - нормировка, w[j] - некоторый весовой коэффициент.
Таким образом, понимание статьи основывается на определенных знаниях читателя, не связанных с целевой тематикой, и даже ничего не знающий по теме может понять b[i]-ю часть смысла. А прочтение каждой связанной тематической статьи добавляет к пониманию еще немножко. Повторяя процесс для разных статей, можно придти к полному пониманию. Для входа целесообразным является чтение статей, понятных неподготовленному читателю (большие b[i]) и имеющих много исходящих ссылок ( sum(L[i][j]) - велика ) и мало входящих ссылок ( sum[j][i] мала).
Задача сводится к тому, чтобы (видимо на основе экспертных оценок) выставить или как-то оценить коэффициенты и веса и далее упорядочить все статьи так, чтобы R(i)=1 для всех достигался при минимальном общем числе чтений. Алгоритм сейчас выдумывать лень.
Исходная версия amomymous, :
Формализовать задачу можно следующим образом: пусть имеются N статей, и L[j] = 1, если i-я статья ссылается на j-ю. Таким образом, L - матрица перекрестных ссылок. Далее предположим, что у любой статьи есть входящие ссылки. Пусть R - степень понимания ранее прочитанной статьи i, от 0 до 1. И пусть чтение i-й статьи позволяет понять ее полностью или нет, в зависимости от числа ранее прочитанных статей, на которые она ссылается:
f(i) = b + (1 - b) * sum по j(w[j]*R[j])/sum по j(w[j]*L[j]), где 0<=f(i)<=1, для простоты линейная зависимость, b - уровень понимания статьи с 0 прочитанных ссылок, (1-b) - нормировка, w[j] - некоторый весовой коэффициент.
Таким образом, понимание статьи основывается на определенных знаниях читателя, не связанных с целевой тематикой, и даже ничего не знающий по теме может понять b-ю часть смысла. А прочтение каждой связанной тематической статьи добавляет к пониманию еще немножко. Повторяя процесс для разных статей, можно придти к полному пониманию. Для входа целесообразным является чтение статей, понятных неподготовленному читателю (большие b) и имеющих много исходящих ссылок ( sum(L[j]) - велика ) и мало входящих ссылок ( sum[j] мала).
Задача сводится к тому, чтобы (видимо на основе экспертных оценок) выставить или как-то оценить коэффициенты и веса и далее упорядочить все статьи так, чтобы R(i)=1 для всех достигался при минимальном общем числе чтений. Алгоритм сейчас выдумывать лень.