Необходимо для примитивного самодельного текстового анализатора считать слова, явно имеющие отношение к научным дисциплинам для оценки того, как часто в объекте попадаются тексты из научных источников. Списки стоп-слов русского языка существуют, наверняка с такой задачей для мелких проектов сталкивались люди и такие списки составляли кустарно. Кто может поделиться? Со стеммингом разберусь сам.