LINUX.ORG.RU

Создание субтитров с нуля

 ,


1

2

Думаю может для иностранцев один наш фильм перевести. Какой софт посоветуете для создания субтитров? Знаю есть Aegisub, но хотелось бы еще проще. Например, начало диалога - нажимаю горячую клавишу (создается начальная метка), конец диалога - другая горячая клавиша (конечная метка). А потом не помешает speech-to-text recognition (eng), хотя бы в общих чертах надиктовать, чтобы не печатать, а я потом подкорректирую. По максимуму оптимизировать процесс, в общем.
Вроде бы Cinelerra умеет работать с субтитрами, но сама она сложновата.

Вроде бы Cinelerra умеет работать с субтитрами, но сама она сложновата.

тыкал когда-то это поделие - оно вообще инопланетянское.

anonymous ()

Прогони через YouTube,он и переведёт. Раньше api было в открытом доступе, и можно было через него. Но Google огородил его, вроде. Можно сделать lua плагин к mpv.

boowai ★★ ()
Ответ на: комментарий от boowai

А это мысль. Придется разбивать на короткие отрезки и думаю гуглу не очень придется по душе грузинский акцент.
Как я понял категорию нужно выбирать «фильмы и анимация» вместо «люди и блоги» иначе не будет переводить. И еще у ютуба при сохранении ужасный тайминг с накладывающимися строками. Раньше явовская Google2SRT сохраняла с корректным таймингом, но сейчас и у нее такой же. Можно правда автоматом «исправить ошибки» и устранить наложения в SubtitleEdit (работает на Mono). Как вытащить тайминг как в онлайн плеере я не знаю. Точнее вытащить webvtt субтитры можно, но софтовые плееры их играют также неправильно.
Вот результат ютубовского распознавания (ссылка будет жить недолго).
Еще можно попробовать Голосовой блокнот или подобные софтовые решения, хотя бы как образец.

anonymous ()
Ответ на: комментарий от grem

Кабы они были, я бы так не парился.
Еще у меня лежит французский фильм Les amoureux 1994, к которому кроме убогой одноголоски вообще нет никаких субтитров ни на каком языке. Тоже думаю как его приладить. Ну ладно я в принципе могу смотреть на французском вообще без перевода (если перед этим с ним ознакомится), но русский то точно никто специально учить не будет.

anonymous ()

Через распознавание речи можно надиктовывать и сразу английский перевод или упрощенный переговор на русский. Я качнул Nuance Dragon NaturallySpeaking 12, но думаю, гугл все равно лучше будет.

anonymous ()
Ответ на: комментарий от anonymous

А французы с одного форума не захотели переводить Les amoureux, т.к. неформат. В принципе они правы, но вот и получается, что никому до него дела нет. А все же быть русским хорошо, потому что у нас водятся авторские переводчики.

anonymous ()
Ответ на: комментарий от anonymous

Разговорный французский, испанский (особенно латиноамериканский, где медленно говорят) и итальянский не сложные, имхо, если знать слова. По сравнению с немецким и английским, но английский везде, поэтому худо бедно привыкаешь, хотя жесть как они говорят.

И субтитры составлять такая скукота. Я набивал как-то по озвучке если честно не очень хочется повторять этот процесс, поэтому надежда на голосовые автоматизированные технологии.

anonymous ()

Например, начало диалога - нажимаю горячую клавишу (создается начальная метка), конец диалога - другая горячая клавиша (конечная метка). А потом не помешает speech-to-text recognition

Если speech-to-text умеет даже речь распознавать, неужели они не умееют локализовать начало и конец диалога (а, может, ещё и определённого голоса в придачу)?

gag ★★★★★ ()

Что-то надоело мне тут тусить и капча эта дурацкая. Так что я все-таки прощаюсь. Если сообщения с похожей стилистикой будут отправляться в ближайшие 3 месяца хотя бы, то это не я, а фейк. Если кому-то очень надо со мной связаться (это маловероятно, конечно, но мало ли), то, ну я, например, периодически мониторю новые раздачи chanteurs croix bois на рутрекере, можно отписать туда, а еще лучше залить новый альбом.

Bye. DenisLp.

anonymous ()

Adobe Premiere Pro CS4 умеет распознавать речь. Последняя версия, работающая на XP, если что, найти в интернете не проблема. Правда русский не умеет, но для англоязычных (возможно еще каких) видео должно помочь. Тут же для облегчения распознавания аудиодорожку можно предварительно обработать - убрать шумы, выделить звуковые частоты.

Конечно, не без огрехов, да и отсутствие знаков препинания обескураживает. Зато порадовал факт точного распознавания имён и географических названий. Данный текст можно отредактировать, а каждое слово здесь является отдельным объектом, привязанным к своему месту в видео- или аудиоролике.

anonymous ()
Ответ на: комментарий от anonymous

Скормил Премьеру акапеловский синтезированный голос. Распознает более менее. Сложные слова, конечно, путает. Обрабатывает медленно. Распознанный текст привязан к аудио, можно кликом по слову перейти в нужное место звука. При монтаже интервью, для поиска по ключевым словам, опция может пригодиться. К сожалению, непонятно можно ли как-то экспортировать распознанный текст в виде титров.

Premiere поддерживает English US (можно загрузить для других языков). Но от этой фичи в новых версиях отказались, ссылаясь на неудовлетворительные результаты. Возможно есть другие плагины или скрипты для монтажек.

anonymous ()
Ответ на: комментарий от Im_not_a_robot

Да этих субтитроредакторов как грязи и все на одно лицо. А мне хочется чего монтажноподобного. В свое время оставлял фич реквесты разработчикам всех основных линуксовых монтажек, чтобы добавили поддержку субтитров. И везде был отказ, мол не ихнее это дело.
SubtitleEdit хоть автопереводить умеет и автоматически исправлять разные дефекты типа наложений, длинных и коротких строк. А еще объединять два файла субтитра в один (с помощью плагина). Не друг за другом, а именно слить (то есть тайминг может накладываться, если в одно и то же время). Мне один раз такое понадобилось.

anonymous ()
Ответ на: комментарий от anonymous

Я набивал как-то по озвучке если честно не очень хочется повторять этот процесс

Давно было, но... Звучили сериальчик, начали писякать сабы сами, но, нотабеноиды нас в хлам обогнали. Звуканули по их сабам, только иногда меняя.

Впопулярные кинцЫ оч быстро нотабеноются. Остальные не требуют спешки. Одну узкопопулярку мы вообще месяца полтора в реальном времени обсуждали что надо сказать, и никак не опоздали с релизом.

deep-purple ★★★★★ ()
Ответ на: комментарий от deep-purple

Так найти готовые субтитры, если есть такая возможность, на языке оригинала быстрее чем пытаться их писать со звука или распознавалками голоса. Но их, как отметили выше, не получается найти.

grem ★★★★★ ()
Ответ на: комментарий от grem

Пару раз было, что субтитры имелись только в виде hardsub (вшитые в видео). Где-то у кого-то, конечно, хранился исходник, но им делиться не торопились. Приходилось распознавать. К фильму Dark Blood по распознанным русским сабам люди даже сделали португальские.

anonymous ()
Ответ на: комментарий от deep-purple

нотабеноид

Так там несколько людей переводит, качество соответствующее. Хотя бы потому что у каждого своя терминология. Кстати валяется 19 приглашений на нотабеноид, может надо кому?

anonymous ()
Ответ на: комментарий от deep-purple

Звучили сериальчик

Чем звучили?
Я тут решил озвучить фильм Summertime Blues (2009) по хардсабу для своих (также есть чистое видео, но srt субтитров нет). Хотя голос у меня отвратный, но уж больно много текста, читать запаришься, не все привыкли.
Опыта у меня в этом нет. Из всех опробованных монтажек при записи звука только Vegas в винде вел себя не совсем уж глючно. Я решил замедлить скорость с 25 fps до 23, чтобы легче читать и то блин запарился.

AssumeFPS(23)
ConvertFPS(25)

ConvertFPS в отличии от простого ChangeFPS (или -r в ffmpeg) оставляет движения ровными, хоть и смазанными.
Звук перетянул с сохранением:
sox in.wav out.wav tempo 0.92

И размер дорожек на таймлайне лучше не менять, иначе раскадровка будет пересчитываться под новый размер и все тормозить.
Потом надо будет обратно тянуть голос в 25 с сохранением тона, микшировать. Сколько гемора. Хотя, конечно, не сравнить с тем, как знакомый украинец по голосу переводил с немецкого и с нуля создавал сабы, только потому что мне приспичило посмотреть фильм с Гёском.

Deniskx ()
Ответ на: комментарий от Deniskx

Зато теперь я понимаю почему бывает, что текст прочитал (слишком быстро), а персонажи еще продолжают говорить. Сколько раз сталкивался, некоторые еще отсебятину придумывают или повторяют, чтобы чем-то заполнить.

Deniskx ()
Ответ на: комментарий от Deniskx

Чем звучили?

Ardour + xjadeo. Сабы вжаривал прямо в видео + понижал его кач-во на время работы (комп слабый был).

решил озвучить фильм ... читать запаришься

Т.е. уже передумал?

замедлить скорость с 25 fps до 23

Не делай так. А если не успеваешь или оговорился — укороти текст, по возможности, оставив тот же смысл, порепетируй и запиши столько дублей, сколько понадобится для достижения желаемого результата. Я вообще косячные дубли (а их много было) в отдельную дорогу собирал и сидели потом ржали над собой всей оравой.

Сколько гемора

Вот! Не связывайся с перегоном фпс и тянучкой аудио.

deep-purple ★★★★★ ()
Ответ на: комментарий от deep-purple

Ardour + xjadeo

Интересная вещь. Но запустить не получилось. Поставил xjadeo, harvid. При попытке добавить видео в Ardour: «ffmpeg installation was not found». ffmpeg, конечно же установлен и превью видно. Сам xjadeo видео открывает. Ubuntu 16.04, Ardour из репозитория.

уже передумал?

Озвучил половину.

порепетируй

Вот это самое действенное. Интересно как авторские переводчики успевают на лету переводить и озвучивать.

Deniskx ()
Ответ на: комментарий от Deniskx

запустить не получилось

Деб пакет из KX Studio — там всё сразу в ардор воткнуто и настроено и сам пакет ставится в /opt/*

как успевают

Просто практика. И там целые команды — кто-то мониторит новинки, кто-то работает с «азинотритопора», кто-то переводит, кто-то звУчит. Не говорю, что везде так, но делегирование задач имеет место быть. Ну а одиночки — просто делают то, что им нравится, так, как умеют.

deep-purple ★★★★★ ()
Ответ на: комментарий от deep-purple

На рутрекере есть люди (тот же RoxMarty), которые поддерживают связь с авторским переводчиком Юрием Сербиным (кстати большой профи) и Визгуновым вроде. RoxMarty рассказывал, что они не связываются с субтитрами, а озвучивают с речи на лету. Ну могут предварительно посмотреть, выписать на бумажке что-нибудь для себя, уточнить терминологию. У Сербина, несмотря на это, получается переводить точно, во время и без суеты, как это часто бывает. Удивительно.

Deniskx ()
Ответ на: комментарий от denislp

на винде, наверное, и распознавание речи прикрутить не проблема

В английской Win7 (даже Home Basic) есть встроенное распознавание US&UK. Но понимает оно меня чуть более, чем никак. Напомнило Горыныча. Для сравнения google translate понял 100%.

anonymous ()
Ответ на: комментарий от anonymous

Кстати, мониторинг с микрофона в Win7 с задержкой, а значит цифровой. Я помню на XP все по аналогу было, без задержки. Деградация. Системный регулятор громкости наверное тоже в цифре рулит.

anonymous ()
Ответ на: комментарий от anonymous

Я тут подумал. Чтобы носителям проще всего было переводить и не возиться с субтитрами можно сделать так: Настроить захват видео с экрана+звуки из системы+звук с микрофона (какой-нибудь wave или what you hear источник) и открыть в плеере фильм. После небольшой сцены (буфер) нажимать на паузу в плеере и надиктовывать перевод и всякие примечания. Звук в фильме должен быть сведен в моно и быть в левом канале, а микрофон в правом, но можно и в обоих, просто иметь запись чистого голоса предпочтительнее. Потом придется смотреть такую несинхронную пересжатку с паузами и с нее при необходимости делать сабы или нормальный войсовер (тоже возня, уже для себя), но это лучше, чем ничего. Такой перевод можно даже попытаться заказывать у фрилансеров, хотя расценки у них кусаются. Носитель должен знать русский или хотя бы разговорный английский, а самому соответственно нужно его понимать. Но можно попросить говорить разборчиво и без витиеватых фраз.
А вы бы стали так смотреть фильмы?
Авторские переводчики, конечно, могут такое проворачивать синхронно на лету, но и качество у них соответствующее.

У меня есть один чешский фильм (тв рип), никаких переводов к нему вообще нет, opensubtitles про него не в курсе, но выглядит многообещающе. Конечно, кое-что, в общих чертах можно понять по видеоряду, контексту и схожим словам (их мало). Но это довольно интересный процесс, я так по моему еще не смотрел (non-english фильмы). А полно русских фильмов, которые не имеют перевода на английский (и книги Хмелевской). Но мне уже пофиг, пусть иностранцы заводят себе русского друга, чтобы он им переводил. И зачем только придумали разные языки.

Кстати, Summertime Blues озвучил. Меня даже похвалили за актерские навыки, но разборчивость была плохая. Это я и сам знаю, да и микрофон поганый. Смена скорости на 8% вообще не мешает, но не знаю большой ли от нее толк.

anonymous ()
Ответ на: комментарий от anonymous

Если носитель предварительно ознакомится с фильмом, можно несложные и небольшие диалоги переводить не нажимая паузы и паузить только если не успеваешь. Это синхронисты лишены такой роскоши. Просто если говорить только в паузах, можно не монить звук. А если нужен чистый голос и синхронная запись допускается, придется разделять на каналы.

Как-то для мамки переводил и озвучивал на лету фильм Time Share 2000. Но я его сто раз видел и хорошо изучил и то местами трудно было успеть. Проф. перевод к нему, конечно, был, но из-за огромной разницы в версиях ТВ/DVD рутрекерцы такой винегрет наделали в звуке, что было проще переозвучить. Проф. озвучка была под ТВ, но на нем было ужасное качество видео по сравнению с DVD. Эх, были же времена фильмов с Зегерсом...

anonymous ()