LINUX.ORG.RU

Фильтр плохих слов на основе нейросети

 , ,


0

1

В последние дни появилось много тем и интересных предложений. В одной из тем предложили даже добавить фильтр запрещенных и оскорбительных слов. Правда главная проблема такого фильтра в том, что существует миллион способов маскировать плохие слова различными символами или аналогичными буквами из других языков. Так что же нам теперь, опустить руки и позволить злостным нарушителям процветать? Нет. Я предлагаю ввести в строй нейросеть, которая будет обучаться на многочисленных примерах завуалированных оскорблений и обидных слов, которые появляются здесь в большом количестве. Позже нейросеть научится запоминать нарушителей и банить их за повторные нарушения. А потом она научится вычислять новые инкарнации старых нарушителей по стилю общения и банить их тоже.

Готов даже задонатить на такое нововведение!

Ответ на: комментарий от fail2ban

Вообще-то банить следует в первую очередь за использование слова «токсичный» применительно к чему-либо отличному от веществ в химическом смысле. Ибо абслютно все, кто этим занимается, являются конченными педерастами в самом плохом смысле этого слова.

Stanson ★★★★★ ()
Ответ на: комментарий от kekelia

Можешь назвать произведение, где больше 2 нецензурных слов? В «Царе Никите» вообще ни одного, несмотря на тему.

question4 ★★★★★ ()
Ответ на: комментарий от question4

Быть матершинником и писать матершинину — разные вещи, кмк.

kekelia ()
Ответ на: комментарий от fail2ban

Значит ты называешь админов и модераторов, которые составляли правила форума, недоразвитыми школьниками?

Ты не поверишь, некоторые до сих пор грамматику русского языка не освоили и новости с ошибками публикуют.

Радость моя, у меня уже дети давно.

Давно, говоришь? Репчик и попсу слушают? Продукты современной дегенеративной анти-культуры потребляют?

trynoval ()

Строка может быть любой, просто при фильтрации учтите, что строка окружена пробелами или знаками препинания, что типа: " нехороший!"

record ★★★★★ ()
Ответ на: комментарий от WitcherGeralt

Любая цензура — признак скудоумия.

Может быть, но мат - признак для удаления поста. Вручную.

record ★★★★★ ()
Последнее исправление: record (всего исправлений: 2)
Ответ на: комментарий от question4

Матершинник — тот, кто матерится в жизни.

Матершинина — текст с матами.

Что сложного?

kekelia ()
Ответ на: комментарий от kekelia

А ребята тебя в детстве не звали бабку-матершинницу вызывать?

trynoval ()
Ответ на: комментарий от question4

«Тень Баркова»

А вам, сударь двойка, за незнание классики.

Deleted ()
Ответ на: комментарий от Deleted

Зачем подсказываешь? :)

И это исключение подтверждает правило. Хулиганистый школьник попробовал «не ругаться, а разговаривать матом», у него получилось хорошо, но по какой-то причине он решил так больше не делать. Судя по статье https://rvb.ru/philologica/03/03ciavlovskij.htm, в огромном корпусе текстов Пушкина всего несколько десятков нецензурных слов, и на одно стихотворение или письмо приходится не более 1-2 штук. То есть он крайне редко их употреблял на письме. И даже когда употреблял в произведениях, не возражал против их удаления издателями.

Для сравнения, живший незадолго до Пушкина Моцарт по причине болезни мозга на каком-то этапе очень часто писал нецензурные слова. Его жена специально всё прочитывала и помногу вымарывала на каждом листе.

question4 ★★★★★ ()
Ответ на: комментарий от question4

Зачем подсказываешь? :)

Я тут вас учу. И статью ту перечитай, да внимательно, там и про произведения порядком сказано и про его употребление в письмах. А про издателей, ты меня не смеши.

Deleted ()

Можно еще тренировать нейросеть вообще на всех удалениях. С синтаксическим и лексическим парсером на входе. Допустим, вариации на тему приседания на бутылку присутствуют сразу в нескольких удаленных нацпольных комментариях. Нейросеть научается от таких комментариев полыхать задом - и при появлении следующего на реактивной тяге летит жаловаться модераторам.

Bagrov ★★★★★ ()

не, не прокатит, пусть хоть на вымирающих мелкофорумах останется немного свободы, итак везде наползает выхолощенная антиутопия с тотальной слежкой и контролем

BLOBster ★★ ()
Ответ на: комментарий от BLOBster

Я придумал, как спасти ЛОР. Можно выманить из Инстаграмма всех активисток #freethenipplemovement, рассказав, что у нас в галерее можно выкладывать... ну, по крайней мере, правилами не запрещено.

Bagrov ★★★★★ ()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)