Пытаюсь решить задачу, у меня программа сгенерировала достаточно много тегов, я их нормализовал, убрал повторяющиеся итд. Теперь хочу обучить алгоритм так, чтобы из этих тегов выбрал самые важные, слышал про TF-IDF но как я понял он генерирует фичи из текста, т.е. их потом можно положить в какойнить DecisionTree и обучить, но какой формат данных должен быть тогда на выходе? так же текст? или какая-то структура данных? до этого только с числами работал.