LINUX.ORG.RU

Ответ на: комментарий от Mike_RM

Имею возможность положить свой серт на устройство.

ya-betmen ★★★★★ ()

Как найдёте с нами поделитесь. А то пока даже нейросеть у многих не справляется не то что по аудио, а по написанному в комментариях. Например польский с украинским путают и так далее.

anc ★★★★★ ()
Ответ на: комментарий от anc

Нубы делают просто. Скорее всего кладут боль на обработку данных, кластеризацию, решающие деревья и т.д., а сразу ляпают нейросети, т.к. модно же.

peregrine ★★★★★ ()
Ответ на: комментарий от anc

Не нужно быть гением, чтобы не желать говна. И если пользователю в принципе не интересен контент на определённом языке, то зачем оправдывать отсутствие персональной фильтрации?

anonymous8 ★★ ()
Ответ на: комментарий от anc

Нейросеть, иди искать товарищей где-нить в другом месте.

ya-betmen ★★★★★ ()
Ответ на: комментарий от anonymous8

И если пользователю в принципе не интересен контент на определённом языке

Скажите пожалуйста как вы из mp4 выдерните «контент на определённом языке» ?

anc ★★★★★ ()
Ответ на: комментарий от anc

Устроило хотя бы по принадлежности ip залившего

anonymous ()
Ответ на: комментарий от anc

Это долго и сложно. Гораздо проще вытаскивать автосгенерированные ютубом субтитры, заголовок и описание видео, вдобавок можно вытаскивать комментарии и даже попробовать получить информацию о релевантных видео (хотя бы без сохраненных кук). С этих данных можно с некоторой статистической точностью предположить язык контента.

Часть логики можно сделать в виде расширения браузера, которое в фоне буде подгружать нужные данные, а часть - в виде нативного приложения, в котором уже обрабатывать данные и экспериментировать со статистическими моделями. Обмен данными сделать через native messaging (в firefox).

Можно хоть нейронки засунуть. Идея в том, что мы можем получить набор релевантных данных быстро и легко, без скачивания всего видео и без распознавания аудиодорожки и текстов на видео.

anonymous8 ★★ ()
Ответ на: комментарий от anonymous8

На уровне прокси сделать то же самое, только headless, ну и приостановить отдачу контента клиенту, пока не проанализируем видео или вытащим результат анализа из своей бд.

Да, могут быть лаги в десятки секунд перед первой загрузкой видео, но это зависит от приоритета этой самой блокировки.

anonymous8 ★★ ()
Ответ на: комментарий от anc

Но твой ответ весьма типичен - вместо того, чтобы подумать, как можно это реализовать, ты задаешь риторический вопрос, подразумевая, что это сделать нельзя.

Это ответ лентяя или уставшего человека, который просто не хочет думать. Или не может, что ещё хуже.

anonymous8 ★★ ()
Ответ на: комментарий от anc

Это плохая нейросеть. Не нужно игнорировать существующие программы по распознаванию языков без нейросетей. Они все вместе могут работать в тандеме.

anonymous8 ★★ ()
Ответ на: комментарий от anonymous8

Вы привели много косвенных вариантов, по которым можно «предположить». Я не спорю, реализовать можно много чего. Можно и распознавание речи прикрутить. На основании которого постфактум(или в буфер и пока не обработаем клиенту не дадим) сделать блокировку. Только вот нюанс, это будет убер комбайн который все равно не гарантирует 100% результата.
ЗЫ Вы похоже так и не поняли намек на mp4.

anc ★★★★★ ()
Последнее исправление: anc (всего исправлений: 2)
Ответ на: комментарий от anc

даю подсказку как отличить украинский от польского: украинский - кириллица, польский - латиница

anonymous ()
Ответ на: комментарий от anonymous8

Я про то что можно скачать голый mp4, да в низком кач-ве но можно же. А если говорить про аудио то тут кач-во вообще без разницы.

anc ★★★★★ ()
Ответ на: комментарий от ya-betmen

Нужно иметь ввиду, что ютуб сам иногда ошибается с языком. Так что я не рекомендую использовать автосубтитры как единственный источник информации, о чём писал выше.

anonymous8 ★★ ()
Ответ на: комментарий от anc

Можем скачать, чтобы что? Распознавать локально? Или перехватывать медиапоток и распознавать на лету?

anonymous8 ★★ ()
Последнее исправление: anonymous8 (всего исправлений: 1)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.