LINUX.ORG.RU

Избранные сообщения welkam

Kdenlive 21.08

Новости — Мультимедиа
Группа Мультимедиа

Выпущена новая версия свободного видеоредактора Kdenlive.

Что нового:

  • исправлена неотзывчивость интерфейса при импорте сотен файлов в проект;
  • добавлена функция time remapping для плавного изменения скорости по ключевым кадрам;
  • добавлена возможность создавать маски трёх видов: Shape alpha (mask), Rotoscoping (mask), Alpha shapes (mask);
  • при использовании инструмента Spacer теперь можно перемещать направляющие;
  • с помощью клавиатурных комбинаций теперь можно открывать прикрепляющиеся диалоги;
  • появилась возможность назначать клавиатурные комбинации командам для создания/удаления ключевых кадров, а также для перехода к предыдущему/следующему ключевому кадру;
  • добавлена панель поиска по командам (как в Blender, GIMP, Inkscape и т.д.).

>>> Подробности

 ,

AP
()

Оцифровать голов с mp3 в текст.

Форум — Multimedia

Ищу чем можно оцифровать голов записанный в mp3 Весь голос русский. Хочу на входе дать mp3 а на выходе получить текст.

Точность - не так важна, достаточно будет примерной точности. Мне нужно это для примерного поиска того, что уже слышал и помню фразы или отдельные слова аудиозаписи.

Голос четкий и громкий. К примеру гугл translate если просто телефона к колонкам- слышит почти все слова правильно.

Обработка - пакетная, то есть у меня есть список файлов, я хотел бы иметь возможность задать входящее имя файла без необходимости выбирать файлы через GUI (так как файлов много).

Подойдут решения даже под win если есть, или какие то веб сервисы которые можно использовать бесплатно но где нет лимитов скажем на длительность или размер файла.

спасибо.

 ,

VoDD87
()

Mozilla объявляет новые ценности и увольняет 250 сотрудников

Новости — Mozilla
Группа Mozilla

Mozilla Corporation в своем блоге объявила о значительной реструктуризации и связанным с этим увольнением 250 сотрудников.

Причинами данного решения, по словам CEO организации Митчелл Бейкер, являются финансовые проблемы, связанные с пандемией COVID-19, и изменения в планах и стратегии компании.

Выбранная же стратегия ориентируется на пять основных принципов:

  1. Новый фокус на продуктах. Утверждается, что их у организации будет несколько.
  2. Новый способ мышления (англ. mindset). Ожидается переход от консервативной/закрытой позиции к более открытой и агрессивной (вероятно, в плане стандартов – прим. перев.).
  3. Новый фокус на технологии. Предполагается выход за пределы «традиционной веб-технологии», в качестве примера приводится Bytecode Alliance.
  4. Новый фокус на сообществе, большая открытость к разным проявляемым инициативам в построении его (сообщества) видения Интернета.
  5. Новый фокус на экономике и рассмотрение иных бизнес-моделей.

>>> Подробности

 layoff,

yoghurt
()

Huawei проведет первый Open Source Summit KaiCode

Новости — Конференции и встречи
Группа Конференции и встречи

Компания Huawei, ведущий мировой поставщик инфокоммуникационных и инфраструктурных решений, анонсирует первый саммит «KaiCode», который планируется провести 5 сентября 2020 года в Москве. Мероприятие организует Лаборатория системного программирования Российского исследовательского института Huawei (Huawei Russian Research Institute, RRI) – R&D подразделения компании в России.

Основной целью саммита станет поддержка проектов в области разработки программного обеспечения с открытым исходным кодом. В рамках данного события Huawei объявляет отбор, который пройдет в период с июня по август 2020 года. Решением экспертного совета авторы 20 лучших проектов будут приглашены непосредственно на саммит и получат возможность выступить перед инвесторами и другими разработчиками. Три проекта-победителя получат денежный приз в размере 5000$ и возможность на дальнейшее сотрудничество с компанией Huawei.

>>> Подробности

 , ,

welkam
()

Библиотека для распознавания русской речи на Android и Linux без сети

Новости — Мультимедиа
Группа Мультимедиа

Опубликована версия 0.3 библиотеки vosk для локального распознавания слитной речи, поддерживающая русский язык.

Для платформы Android подготовлен APK-пакет, а для Linux можно использовать Python-библиотеку (пример использования), производительности которой достаточно для работы на платах Raspberry Pi.
Библиотека работает на усовершенствованном движке Kaldi.
Языковая модель занимает всего 50Мб и работает точнее DeepSpeech (модель размером более 1Гб).
Поддерживаются языки: русский, английский, немецкий, французский, китайский. Ожидается поддержка испанского, хинди, арабского и португальского.

Источник

>>> Подробности

 

chukcha
()

Разработчик системы распознавания речи

Форум — Job

Компании требуется ведущий разработчик для решения прикладных и теоретических задач в области обработки речи. Мы развиваем CMUSphinx http://cmusphinx.sourceforge.net - одну из самых популярных систем распознавания, используется десятками различных компаний и миллионами пользователей по всему миру. Мы начинаем серьёзный проект, который должен вывести нашу технологию на новый уровень и позволить нам бросить вызов крупнейшим мировым компаниям.

Требования:

  • желание и способность программировать;
  • знание Linux;
  • владение C, Python, Java;
  • глубокие знания математики (анализ, линейная алгебра, численные методы, алгоритмы);
  • профильное образование (МГУ, МФТИ, МГТУ им. Н.Э. Баумана, ВШЭ);
  • технический английский на хорошем уровне.

Плюсами будут:

  • знание систем синтеза (Festival, Openmary) и распознавания речи (HTK, CMUSphinx, Kaldi);
  • знание алгоритмов на графах — динамическое программирование, различные виды поиска;
  • знания в области цифровой обработки сигналов;
  • глубокое знание в области машинного обучения: опорные вектора, деревья решений, глубокое обучение;
  • знание прикладных пакетов машинного обучения (SciPy, Theano, Torch) обработки сигналов (Octave, Matlab), обработки языка (OpenNLP, NLTK);
  • опыт разработки распределенных высоко-нагруженных систем;
  • опыт анализа неупорядоченных данных;
  • опыт разработки мобильных и встраиваемых приложений;
  • навыки оптимизация алгоритмов и кода по быстродействию и памяти;
  • участие в проектах с открытым исходным кодом.

Условия:

  • работа в горячей области над интересными проектами;
  • поддержка систем с открытым исходным кодом;
  • полная занятость;
  • самостоятельная работа над проектами;
  • официальное трудоустройство;
  • международные командировки.

Преимущества:

  • перспективы быстрого профессионального роста в быстро растущей компании и в индустрии в целом;
  • возможность ведения научной работы, участие в конференциях;
  • гибкий график, возможность удалённой работы.

Офис: Москва, метро Калужская

Зарплата: 70000 - 150000

Контакт: nshmyrev на gmail

 ,

welkam
()