LINUX.ORG.RU
ФорумTalks

Bash awk редактор субтитров

 , , , ,


0

1

Нужна срочная оплачиваемая помощь

titulky.sh -d dict1 -d dict2 -d dictn file1 file2 file3

где -d dict1 сообщает вашей программе, что текстовый файл dict1 должен быть загружен как словарь, который будет использован дальше . А остальные файлы file1 ... fileN загружаются как субтитры к фильмам. Которые даны в таком формате:

{20758}{20930}HELLO WORLD, BILL IS A YELLOW EXCAVATOR FROM USA. BUT|OUR JANE IS TOO!

где первые два числа без пробелов, заключенных в {a}, указывают начальный и конечный кадры субтитров сразу после (без пробела), за которыми следуют слова субтитров, которые содержат буквы английского алфавита и символы из набора,!?.

Ваша задача - отредактировать file1 ... filen файлы, чтобы они выглядели так: {20758}{20930}Hello world, Bill is a yellow excavator from USA. But|our Jane is too!

Так что делайте все в нижнем регистре, за исключением начала предложений, имен собственных (Джейн) и сокращений (США). Но у него есть подвох - Bill. «Bill» также переводится как счет, и поэтому слово «БИЛЛ» не может решить, будет ли он большим или маленьким. В этом случае ваша программа должна записать в журнал или вывод, что в этой строке он не уверен, и оставить «Bill».

slovo s slovo2 v slovo3 sv ZKRTKA MUDr. knife s knives read v reads read read

Если первый столбец - это слово в «голой» форме, второй столбец - это все части речи, которые могут быть существительным, глаголом и другими (это интересно).

Если слово неправильное и является существительным, оно имеет еще одно слово (knives) которая является формой множественного числа.

Для обычных существительных мы всегда используем окончание -s или -es (если слово оканчивается на -s, -sh, -x) или или -ies, если слово оканчивается на -y и до того, как y является согласной (согласная SK).

Сокращения в словарях, мы можем узнать потому что они не содержат никаких дополнительных слов в строке. (например, MUDR. или ZKRTKA)

Перемещено beastie из development

Форум — Development

Нужна срочная оплачиваемая помощь

А чо, в Job забанили?

По сабжу: какая-то наркоманская херня. Ты хочешь самообучающуюся нейросеть, так что ценник будет начинаться в астрономических величинах. А если ты настаиваешь на bash и awk, то можешь добавить к числу ещё сотню порядков.

Пережёвывание файлов вручную очень голодными студентами или дрессированными обезьянками обойдётся тебе дешевле, и местами даже качественнее.

mord0d ★★★★★
()
Ответ на: комментарий от beastie

awk, bash, shell

1 BTC и начинаем разговор.

Что-то ты себя не ценишь. Нейросеть на bash стоит дороже. xD

mord0d ★★★★★
()
Ответ на: комментарий от mord0d

Читал. Нет там ничего такого. Просто набор правил и эвристик. А у тебя какое-то искаженное понятие нейросетей

yoghurt ★★★★★
()
Ответ на: комментарий от mord0d

Как будто из баша нельзя выполнить скрипт на питоне.

yoghurt ★★★★★
()

вот вы сейчас поможете ТС, а завтра он выпустится и госуслуги или какую-нибудь хрень пойдет писать. хорошо хоть, не в хирурги стремится.

crypt ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.