Задача: имеется час видео - человек говорит на презентации плюс происходит смена статических слайдов на английском языке плюс PDF/Libreoffice Draw слайды.
Что сделано: на youtube загружено видео, которое было автоматически распознано. Результат распознавания внушает оптимизм (я правильно понимаю, что лучше чем у Google из бесплатных движков распознавания просто нет).
Что хочется: В идеале хотелось бы теперь вытащить звуковую дорожку с лектором и разбить по принципу: один слайд - один звуковой файл - один файл с субтитрами. А потом слушать/редактировать/переводить только к определенному слайду. Это могут делать разные люди параллельно.
Т.е. на выходе я хочу получить отредактированный и переведенный текст диктора для каждого слайда.
Насколько это реально сделать и насколько это автоматизируемо?