LINUX.ORG.RU

Фильтр плохих слов на основе нейросети

 , ,


0

1

В последние дни появилось много тем и интересных предложений. В одной из тем предложили даже добавить фильтр запрещенных и оскорбительных слов. Правда главная проблема такого фильтра в том, что существует миллион способов маскировать плохие слова различными символами или аналогичными буквами из других языков. Так что же нам теперь, опустить руки и позволить злостным нарушителям процветать? Нет. Я предлагаю ввести в строй нейросеть, которая будет обучаться на многочисленных примерах завуалированных оскорблений и обидных слов, которые появляются здесь в большом количестве. Позже нейросеть научится запоминать нарушителей и банить их за повторные нарушения. А потом она научится вычислять новые инкарнации старых нарушителей по стилю общения и банить их тоже.

Готов даже задонатить на такое нововведение!

★★★

Последнее исправление: fail2ban (всего исправлений: 2)

Ответ на: комментарий от fail2ban

Вообще-то банить следует в первую очередь за использование слова «токсичный» применительно к чему-либо отличному от веществ в химическом смысле. Ибо абслютно все, кто этим занимается, являются конченными педерастами в самом плохом смысле этого слова.

Stanson ★★★★★
()
Ответ на: комментарий от kekelia

Можешь назвать произведение, где больше 2 нецензурных слов? В «Царе Никите» вообще ни одного, несмотря на тему.

question4 ★★★★★
()
Ответ на: комментарий от fail2ban

Значит ты называешь админов и модераторов, которые составляли правила форума, недоразвитыми школьниками?

Ты не поверишь, некоторые до сих пор грамматику русского языка не освоили и новости с ошибками публикуют.

Радость моя, у меня уже дети давно.

Давно, говоришь? Репчик и попсу слушают? Продукты современной дегенеративной анти-культуры потребляют?

trynoval
()

Строка может быть любой, просто при фильтрации учтите, что строка окружена пробелами или знаками препинания, что типа: " нехороший!"

record ★★★★★
()
Ответ на: комментарий от WitcherGeralt

Любая цензура — признак скудоумия.

Может быть, но мат - признак для удаления поста. Вручную.

record ★★★★★
()
Последнее исправление: record (всего исправлений: 2)
Ответ на: комментарий от kekelia

А ребята тебя в детстве не звали бабку-матершинницу вызывать?

trynoval
()
Ответ на: комментарий от Deleted

Зачем подсказываешь? :)

И это исключение подтверждает правило. Хулиганистый школьник попробовал «не ругаться, а разговаривать матом», у него получилось хорошо, но по какой-то причине он решил так больше не делать. Судя по статье https://rvb.ru/philologica/03/03ciavlovskij.htm, в огромном корпусе текстов Пушкина всего несколько десятков нецензурных слов, и на одно стихотворение или письмо приходится не более 1-2 штук. То есть он крайне редко их употреблял на письме. И даже когда употреблял в произведениях, не возражал против их удаления издателями.

Для сравнения, живший незадолго до Пушкина Моцарт по причине болезни мозга на каком-то этапе очень часто писал нецензурные слова. Его жена специально всё прочитывала и помногу вымарывала на каждом листе.

question4 ★★★★★
()
Ответ на: комментарий от question4

Зачем подсказываешь? :)

Я тут вас учу. И статью ту перечитай, да внимательно, там и про произведения порядком сказано и про его употребление в письмах. А про издателей, ты меня не смеши.

Deleted
()

Можно еще тренировать нейросеть вообще на всех удалениях. С синтаксическим и лексическим парсером на входе. Допустим, вариации на тему приседания на бутылку присутствуют сразу в нескольких удаленных нацпольных комментариях. Нейросеть научается от таких комментариев полыхать задом - и при появлении следующего на реактивной тяге летит жаловаться модераторам.

Bagrov ★★★★★
()

не, не прокатит, пусть хоть на вымирающих мелкофорумах останется немного свободы, итак везде наползает выхолощенная антиутопия с тотальной слежкой и контролем

BLOBster ★★★
()
Ответ на: комментарий от BLOBster

Я придумал, как спасти ЛОР. Можно выманить из Инстаграмма всех активисток #freethenipplemovement, рассказав, что у нас в галерее можно выкладывать... ну, по крайней мере, правилами не запрещено.

Bagrov ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.