LINUX.ORG.RU

История изменений

Исправление peregrine, (текущая версия) :

А расскажи ка, как сейчас в общих чертах алгоритм выглядит, чтобы не копаться зря в коде. Имеется ввиду совсем в общих, а-ля берётся текст, проводится выделение ключевых слов/какой-то другой анализ, их в матрицу, матрицу в кластеризацию, кластеризованную матрицу в модель такую-то и т.д.. Что-то в этом духе интересно узнать.

Если что-то похожее, на то что я пилю увижу, то могу подсказать и много времени сэкономить. Ну или наоборот, тут как повезёт. Исправление опечаток для модели пробовал вводить? Приведение слов к начальной форме? Т.е. стараемся исправить опечатки, считаем их количество, бОльШие буквы среди слов тоже считаем, чтобы ПеЙсАтЕлЕй определять, они тоже как признак сгодятся. Ну а исправленный текст уже в модель подавать.

Исправление peregrine, :

А расскажи ка, как сейчас в общих чертах алгоритм выглядит, чтобы не копаться зря в коде. Имеется ввиду совсем в общих, а-ля берётся текст, проводится выделение ключевых слов/какой-то другой анализ, их в матрицу, матрицу в кластеризацию, кластеризованную матрицу в модель такую-то и т.д.. Что-то в этом духе интересно узнать.

Если что-то похожее, на то что я пилю увижу, то могу подсказать и много времени сэкономить. Ну или наоборот, тут как повезёт. Исправление опечаток для модели пробовал вводить? Приведение слов к начальной форма? Т.е. стараемся исправить опечатки, считаем их количество, бОльШие буквы среди слов тоже считаем, чтобы ПеЙсАтЕлЕй определять, они тоже как признак сгодятся. Ну а исправленный текст уже в модель подавать.

Исправление peregrine, :

А расскажи ка, как сейчас в общих чертах алгоритм выглядит, чтобы не копаться зря в коде. Имеется ввиду совсем в общих, а-ля берётся текст, проводится выделение ключевых слов/какой-то другой анализ, их в матрицу, матрицу в кластеризацию, кластеризованную матрицу в модель такую-то и т.д.. Что-то в этом духе интересно узнать.

Если что-то похожее, на то что я пилю увижу, то могу подсказать и много времени сэкономить. Ну или наоборот, тут как повезёт. Исправление опечаток для модели пробовал вводить? Т.е. стараемся исправить опечатки, считаем их количество, бОльШие буквы среди слов тоже считаем, чтобы ПеЙсАтЕлЕй определять, они тоже как признак сгодятся. Ну а исправленный текст уже в модель подавать.

Исправление peregrine, :

А расскажи ка, как сейчас в общих чертах алгоритм выглядит, чтобы не копаться зря в коде. Имеется ввиду совсем в общих, а-ля берётся текст, проводится выделение ключевых слов/какой-то другой анализ, их в матрицу, матрицу в кластеризацию, кластеризованную матрицу в модель такую-то и т.д.. Что-то в этом духе интересно узнать.

Если что-то похожее, на то что я пилю увижу, то могу подсказать и много времени сэкономить. Ну или наоборот, тут как повезёт. Исправление опечаток для модели пробовал вводить? Т.е. стараемся исправить опечатки, считаем их количество, бОльШие буквы среди слов тоже считаем, чтобы ПеЙсАтЕлЕй определять, они тоже как признак сгодятся.

Исправление peregrine, :

А расскажи ка, как сейчас в общих чертах алгоритм выглядит, чтобы не копаться зря в коде. Имеется ввиду совсем в общих, а-ля берётся текст, проводится выделение ключевых слов/какой-то другой анализ, их в матрицу, матрицу в кластеризацию, кластеризованную матрицу в модель такую-то и т.д.. Что-то в этом духе интересно узнать.

Если что-то похожее, на то что я пилю увижу, то могу подсказать и много времени сэкономить. Ну или наоборот, тут как повезёт.

Исходная версия peregrine, :

А расскажи ка, как сейчас в общих чертах алгоритм выглядит, чтобы не копаться зря в коде. Имеется ввиду совсем в общих, а-ля берётся текст, проводится выделение ключевых слов/какой-то другой анализ, их в матрицу, матрицу в кластеризацию, кластеризованную матрицу в модель такую-то и т.д.. Что-то в этом духе интересно узнать.