LINUX.ORG.RU

Проекту voxforge.org нужна ваша помощь

 , , , ,


0

3

Вы уже давно хотите помочь движению за свободный софт, но не знаете как? Вы не программист, не дизайнер и знанием иностранных языков не блещете? Вы можете помочь в создании русской языковой модели для систем распознавания речи "Julius" и "Sphinx".

Построением языковых моделей занимаются ребята с сайта voxforge.org, которые будут рады вашей помощи в создании языковой модели русского языка.

Итак, чтобы помочь им, вам нужно зайти на страничку и прочитать в микрофон несколько предложений, приведенных на ней. Проекту нужно всего 140 часов речи для создания качественной языковой модели, однако пока общий объем не достигает и 10 часов.

Дело нужное, предлагаю добровольцам присоединиться ко мне.

>>> Подробности

Жаль, что другой свободный проект, OSS4, так и не сделал поддержку микрофона в моей звуковой карте.

vurdalak ★★★★★ ()
Ответ на: комментарий от vurdalak

Хотя может и зайду с ноута завтра. Там работает.

vurdalak ★★★★★ ()

Вы уже давно хотите помочь движению за свободный софт, но не знаете как?

Ага, ща посмотрим, кто хочет.
Вон в неподтверждённых висит о KTechlab'e - nobody cares, не говоря о том чтоб подтвердить, ostin!

adriano32 ★★★ ()

Посмотрел пока. Во-первых, нужна ява, во-вторых, в списке регионов только российские.

vurdalak ★★★★★ ()
Ответ на: комментарий от adriano32

Пара добровольцев найдется. Ща девушку еще запрягу. Небольшая, а помощь.

ostin ★★★★★ ()
Ответ на: комментарий от vurdalak

Да, из-за явы я с линукса этого делать не стал (-;

ostin ★★★★★ ()
Ответ на: комментарий от ostin

Да, из-за явы я с линукса этого делать не стал (-;

К счастью, у меня везде есть ява.

vurdalak ★★★★★ ()
Ответ на: комментарий от ostin

Блин, я послушал, как ALSA записала мой голос и ужаснулся. Дарт Вейдер отдыхает :) Наверное, надо днём записывать)

adriano32 ★★★ ()
Ответ на: комментарий от vurdalak

>во-вторых, в списке регионов только российские.
Так всё правильно, нечего языковую модель гхеканьем и шоканьем засорять.

Ramen ★★★★ ()
Ответ на: комментарий от Ramen

Так всё правильно, нечего языковую модель гхеканьем и шоканьем засорять.

Таки шо ви говогите?

vurdalak ★★★★★ ()

Хрень!

В моей бубунте не работает.

java version «1.6.0_20»
OpenJDK Runtime Environment (IcedTea6 1.9.7) (6b20-1.9.7-0ubuntu1)
OpenJDK 64-Bit Server VM (build 19.0-b09, mixed mode)

Микрофон input level подпрыгивает на звук. Что надо, чтобы жаба записала?

valich ★★★ ()
Ответ на: комментарий от valich

> Что надо, чтобы жаба записала?

Бубен доставать :) Если в других прогах запись работает, можно попробовать что-то из этого: закрыть все что может производить/записывать звук, открывать лучше в файерфоксе, если в параметрах звука файерфокс или приложение джава не показывается, попробовать запустить браузер через padsp, то есть `padsp firefox`, так весь звук будет форсирован через пульс.

tulskiy ()
Ответ на: комментарий от tulskiy

Трижды матом выругался!

Открываю в Firefox 4, разрешаю апплету запуститься.
Когда пытаюсь записывать наконец увидел белые буковки на белом фоне:
«Java security AccessControlException access denied (javax.sound sampled AudioPermission record)»

valich ★★★ ()

всем неосилившим настройку микрофона

arecord -f dat| aplay и alsamixer в соседней консоли

zyoung ()
Ответ на: комментарий от zyoung

> arecord -f dat| aplay и alsamixer в соседней консоли

уууу, заклинания третьего уровня пошли в ход. Забавно!
Всего-то надо звук на микрофон записать... Эх лялекс...

valich ★★★ ()

И поправьте ссылку на Sphinx на http://cmusphinx.sourceforge.net/

Отличный софт, достаточно быстро разобрался в простых примерах. Правда, до более сложной грамматики и парсинга так и не добрался. Да и акцент мой ему не нравился, а американцев понимал на ура.

Русская модель уже доступна или только разрабатывается?

tulskiy ()

Первый раз за три года решил помочь опенсорсу, и на тебе, теперь сайт упал.

valich ★★★ ()

>Проекту нужно всего 140 часов речи для создания качественной языковой модели

140 часов речи - «нинужно» :)

Для создания качественной языковой модели разработчикам нужно:
1. Изучить фонологию - раздел языкознания, изучающий звуковые единицы языка - фонемы
и создать очередную программу их распознавания (было уже 100500 попыток).
2. Отладить модель на записях профессиональных дикторов радио.
3. Тестировать и доделывать модель на произвольном речевом потоке.

quickquest ★★★★★ ()

О, обязательно прямо сейчас и помогу. Я как раз сейчас пьяный.

anonymous ()

как в генте поставить этот жаба-плагин?

anonymous ()
Ответ на: комментарий от quickquest

> Изучить фонологию - раздел языкознания, изучающий звуковые единицы языка - фонемы и создать очередную программу их распознавания (было уже 100500 попыток).

Carnegie Mellon University, разработчки Sphinx, уже 30+ лет занимаются разработками в области распознавания речи, я думаю, они знают что делают.

tulskiy ()
Ответ на: комментарий от tulskiy

>Если в других прогах запись работает, можно попробовать что-то из этого: закрыть все что может производить/записывать звук, открывать лучше в файерфоксе, если в параметрах звука файерфокс или приложение джава не показывается, попробовать запустить браузер через padsp, то есть `padsp firefox`, так весь звук будет форсирован через пульс.

Современная, кроссплатформенная джава. Просто прекрасно.

anonymous ()
Ответ на: комментарий от anonymous

шутка такая, да? мне казалось гентушники не такие ололо

emerge dev-java/sun-jre-bin

tazhate ★★★★★ ()
Ответ на: комментарий от tazhate

нее. реально. еще я оказывается забыл юзефлаг nsplugin. а вобще до этого мне жаба невхер не уперлась

anonymous ()
Ответ на: комментарий от anonymous

ну это просто гуглится элементарно.
а лично я жаву часто пользую.

tazhate ★★★★★ ()
Ответ на: комментарий от tulskiy

>...разработчки Sphinx, уже 30+ лет занимаются разработками в области распознавания речи...

За 30+ лет не записали 140 часов???

я думаю, они знают что делают.

А я уверен, что даже не догадываются о сложностях распознавания фонем в сплошном потоке, ибо почти все известные системы распознавания речи, обученные на одном множестве фонем, не могут перестроится на другое: «Да и акцент мой ему не нравился, а американцев понимал на ура». Это не я, а ты сказал :)

quickquest ★★★★★ ()

Ни грамма фантазии.
В свое время решал эту проблему при помощи аудио книг.
Их читают люди с хорошей дикцией.

Fastman ()
Ответ на: комментарий от Fastman

Ну так оно и понимать будет только людей с хорошей дикцией. Просят люди помощи, значит им надо зачем-то, почему бы не помочь?

ostin ★★★★★ ()

> вам нужно зайти на страничку и прочитать в микрофон несколько предложений, приведенных на ней.

После чего уже ни один логопед не поможет этому проекту.

Lumi ★★★★★ ()

[ultra_fat]Смотрю тут проблемы с явой и звуком? А флеш это без бубна умеет ;)[/ultra_fat]

win7 ()
Ответ на: комментарий от anonymous

нет, это современная звуковая подсистема линукс

bender ★★★★★ ()

Вы не программист, не дизайнер и знанием иностранных языков не блещете? Вы не нужны.

sid350 ★★★★★ ()

Помог бы, да нет микрофона

buddhist ★★★★★ ()
Ответ на: комментарий от quickquest

> 3. Тестировать и доделывать модель на произвольном речевом потоке.
А это разве не оно?

alix ★★★★ ()
Ответ на: комментарий от bender

>нет, это современная звуковая подсистема линукс

С флешом работает, а с супер-ынтерпрайзной джавой - нет?

anonymous ()

Хм...Текст читать вместе с ошибками?

John_Wehin ()
Ответ на: комментарий от alix

>А это разве не оно?

Нет. Это обучающие множества. Произвольный речевой поток - это, например, запись радиоспектакля со многими голосами, тембрами, акцентами, ... или запись полилога - «базара» на базаре :)

На сегодня, мне не известны модели распознавания фонем, инвариантные к временнЫм и спектральным особенностям речи.

quickquest ★★★★★ ()

Меня глючит, или оно мне предлагает зачитать предложения из «Аэлиты» Алексея Толстого?

cPunk ★★ ()

Оно подходит для проверки правильности произношения как это сделано в некоторых программах для изучения языков?

Leron ★★ ()

О, поможем. Я люблю Java несмотря на то, что иногда она много памяти отжирает. Благо научился указывать приемлемые параметры потребления памяти, да и JRE 1.7 хоть и не стабильна, но резвее чем 1.6. За что Оракулу большое спасибо. Думаю, для Java-комьюнити покупка Sun Oracle'ом пользу принесёт.

lucentcode ★★★★★ ()

Кошмар. Долбаный апплет не работает, можно бы записать через аудацити и кинуть файл на их файлообменник, но инструкцию по этому делу нужно долго и упорно переводить. Они не могли вывесить тексты для чтения и требования к формату аудиофайлов? Да не сложно записать и отправить, но трахаться с их жабами и инструкциями нет никакого желания.

Napilnik ★★★★★ ()

Поучаствовал, анонимно. Теперь думаю, кого ещё бы подключить к делу. Ничего, завтра будет день, посмотрю в список друзей в соцсетях...

lucentcode ★★★★★ ()
Ответ на: комментарий от vurdalak

oss уже полностью свободный? я такой слоууууууу

воспользуйтесь алсой

Ingwar ★★★★★ ()

Заметил, что их апплет выводит кривую похожую на те, что используют в интерактивных системах обучения иностранным языкам. Почему не напишут открытое Java-приложение для этого дела? На подобие Rosetta Stone или Tell me More?

lucentcode ★★★★★ ()
Ответ на: комментарий от Ramen

хотелось бы мою хохляцкую дикцию сравнить с вашим россиянським прононсом. интересно, у кого бы гхеканья и шоканья было бы больше

Ingwar ★★★★★ ()
Ответ на: комментарий от Ingwar

воспользуйтесь алсой

Воспользуюсь оной на ноуте. А вот на десктопе она не прижилась.

vurdalak ★★★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.