Проекту voxforge.org нужна ваша помощь

gpl, julius, opensource, shpinx, voxforge

Вы уже давно хотите помочь движению за свободный софт, но не знаете как? Вы не программист, не дизайнер и знанием иностранных языков не блещете? Вы можете помочь в создании русской языковой модели для систем распознавания речи "Julius" и "Sphinx".

Построением языковых моделей занимаются ребята с сайта voxforge.org, которые будут рады вашей помощи в создании языковой модели русского языка.

Итак, чтобы помочь им, вам нужно зайти на страничку и прочитать в микрофон несколько предложений, приведенных на ней. Проекту нужно всего 140 часов речи для создания качественной языковой модели, однако пока общий объем не достигает и 10 часов.

Дело нужное, предлагаю добровольцам присоединиться ко мне.

>>> Подробности

Ссылка

← Вышел QtSDK 1.1

Apache вызван в суд по делу Oracle vs. Google →

← 1 2 →

Жаль, что другой свободный проект, OSS4, так и не сделал поддержку микрофона в моей звуковой карте.

~~vurdalak~~ ★★★★★
(03.05.11 23:43:18 MSK)

Ответ на: комментарий от vurdalak 03.05.11 23:43:18 MSK

Хотя может и зайду с ноута завтра. Там работает.

~~vurdalak~~ ★★★★★
(03.05.11 23:43:50 MSK)

Ссылка

Вы уже давно хотите помочь движению за свободный софт, но не знаете как?

Ага, ща посмотрим, кто хочет.
Вон в неподтверждённых висит о KTechlab'e - nobody cares, не говоря о том чтоб подтвердить, ostin!

~~adriano32~~ ★★★
(03.05.11 23:44:33 MSK)

Посмотрел пока. Во-первых, нужна ява, во-вторых, в списке регионов только российские.

~~vurdalak~~ ★★★★★
(03.05.11 23:45:29 MSK)

Ответ на: комментарий от adriano32 03.05.11 23:44:33 MSK

Пара добровольцев найдется. Ща девушку еще запрягу. Небольшая, а помощь.

ostin ★★★★★
(03.05.11 23:47:23 MSK) автор топика

Ответ на: комментарий от vurdalak 03.05.11 23:45:29 MSK

Да, из-за явы я с линукса этого делать не стал (-;

ostin ★★★★★
(03.05.11 23:48:07 MSK) автор топика

Ответ на: комментарий от ostin 03.05.11 23:48:07 MSK

Да, из-за явы я с линукса этого делать не стал (-;

К счастью, у меня везде есть ява.

~~vurdalak~~ ★★★★★
(04.05.11 00:01:35 MSK)

Ссылка

Ответ на: комментарий от ostin 03.05.11 23:47:23 MSK

Блин, я послушал, как ALSA записала мой голос и ужаснулся. Дарт Вейдер отдыхает :) Наверное, надо днём записывать)

~~adriano32~~ ★★★
(04.05.11 00:02:13 MSK)

Ссылка

Ответ на: комментарий от vurdalak 03.05.11 23:45:29 MSK

>во-вторых, в списке регионов только российские.
Так всё правильно, нечего языковую модель гхеканьем и шоканьем засорять.

Ramen ★★★★
(04.05.11 06:35:01 MSK)

Ответ на: комментарий от Ramen 04.05.11 06:35:01 MSK

Так всё правильно, нечего языковую модель гхеканьем и шоканьем засорять.

Таки шо ви говогите?

~~vurdalak~~ ★★★★★
(04.05.11 09:27:18 MSK)

Ссылка

Хрень!

В моей бубунте не работает.

java version «1.6.0_20»
OpenJDK Runtime Environment (IcedTea6 1.9.7) (6b20-1.9.7-0ubuntu1)
OpenJDK 64-Bit Server VM (build 19.0-b09, mixed mode)

Микрофон input level подпрыгивает на звук. Что надо, чтобы жаба записала?

valich ★★★
(04.05.11 20:15:04 MSK)

Ответ на: комментарий от valich 04.05.11 20:15:04 MSK

> Что надо, чтобы жаба записала?

Бубен доставать :) Если в других прогах запись работает, можно попробовать что-то из этого: закрыть все что может производить/записывать звук, открывать лучше в файерфоксе, если в параметрах звука файерфокс или приложение джава не показывается, попробовать запустить браузер через padsp, то есть `padsp firefox`, так весь звук будет форсирован через пульс.

tulskiy
(04.05.11 20:21:00 MSK)

Ответ на: комментарий от tulskiy 04.05.11 20:21:00 MSK

Трижды матом выругался!

Открываю в Firefox 4, разрешаю апплету запуститься.
Когда пытаюсь записывать наконец увидел белые буковки на белом фоне:
«Java security AccessControlException access denied (javax.sound sampled AudioPermission record)»

valich ★★★
(04.05.11 20:25:01 MSK)

Ссылка

всем неосилившим настройку микрофона

arecord -f dat| aplay и alsamixer в соседней консоли

zyoung ★
(04.05.11 20:25:17 MSK)

Ответ на: комментарий от zyoung 04.05.11 20:25:17 MSK

> arecord -f dat| aplay и alsamixer в соседней консоли

уууу, заклинания третьего уровня пошли в ход. Забавно!
Всего-то надо звук на микрофон записать... Эх лялекс...

valich ★★★
(04.05.11 20:29:12 MSK)

Ссылка

И поправьте ссылку на Sphinx на http://cmusphinx.sourceforge.net/

Отличный софт, достаточно быстро разобрался в простых примерах. Правда, до более сложной грамматики и парсинга так и не добрался. Да и акцент мой ему не нравился, а американцев понимал на ура.

Русская модель уже доступна или только разрабатывается?

tulskiy
(04.05.11 20:30:06 MSK)

Первый раз за три года решил помочь опенсорсу, и на тебе, теперь сайт упал.

valich ★★★
(04.05.11 20:39:50 MSK)

>Проекту нужно всего 140 часов речи для создания качественной языковой модели

140 часов речи - «нинужно» :)

Для создания качественной языковой модели разработчикам нужно:
1. Изучить фонологию - раздел языкознания, изучающий звуковые единицы языка - фонемы
и создать очередную программу их распознавания (было уже 100500 попыток).
2. Отладить модель на записях профессиональных дикторов радио.
3. Тестировать и доделывать модель на произвольном речевом потоке.

quickquest ★★★★★
(04.05.11 20:39:52 MSK)

О, обязательно прямо сейчас и помогу. Я как раз сейчас пьяный.

anonymous
(04.05.11 20:41:55 MSK)

Ссылка

как в генте поставить этот жаба-плагин?

anonymous
(04.05.11 20:44:41 MSK)

Ответ на: комментарий от quickquest 04.05.11 20:39:52 MSK

> Изучить фонологию - раздел языкознания, изучающий звуковые единицы языка - фонемы и создать очередную программу их распознавания (было уже 100500 попыток).

Carnegie Mellon University, разработчки Sphinx, уже 30+ лет занимаются разработками в области распознавания речи, я думаю, они знают что делают.

tulskiy
(04.05.11 20:47:43 MSK)

Ссылка

Ответ на: комментарий от tulskiy 04.05.11 20:21:00 MSK

>Если в других прогах запись работает, можно попробовать что-то из этого: закрыть все что может производить/записывать звук, открывать лучше в файерфоксе, если в параметрах звука файерфокс или приложение джава не показывается, попробовать запустить браузер через padsp, то есть `padsp firefox`, так весь звук будет форсирован через пульс.

Современная, кроссплатформенная джава. Просто прекрасно.

anonymous
(04.05.11 21:04:26 MSK)

Ответ на: комментарий от anonymous 04.05.11 20:44:41 MSK

emerge sun-jre-bin :)

anonymous
(04.05.11 21:10:33 MSK)

Ссылка

http://2ch.so/b/res/14656269.html

помог как смог

daarijec
(04.05.11 21:13:01 MSK)

Ссылка

Ответ на: комментарий от anonymous 04.05.11 20:44:41 MSK

шутка такая, да? мне казалось гентушники не такие ололо

emerge dev-java/sun-jre-bin

tazhate ★★★★★
(04.05.11 21:36:45 MSK)

Ответ на: комментарий от tazhate 04.05.11 21:36:45 MSK

нее. реально. еще я оказывается забыл юзефлаг nsplugin. а вобще до этого мне жаба невхер не уперлась

anonymous
(04.05.11 21:39:59 MSK)

Ответ на: комментарий от anonymous 04.05.11 21:39:59 MSK

ну это просто гуглится элементарно.
а лично я жаву часто пользую.

tazhate ★★★★★
(04.05.11 21:51:37 MSK)

Ссылка

Ответ на: комментарий от tulskiy 04.05.11 20:30:06 MSK

>...разработчки Sphinx, уже 30+ лет занимаются разработками в области распознавания речи...

За 30+ лет не записали 140 часов???

я думаю, они знают что делают.

А я уверен, что даже не догадываются о сложностях распознавания фонем в сплошном потоке, ибо почти все известные системы распознавания речи, обученные на одном множестве фонем, не могут перестроится на другое: «Да и акцент мой ему не нравился, а американцев понимал на ура». Это не я, а ты сказал :)

quickquest ★★★★★
(04.05.11 21:52:44 MSK)

Ни грамма фантазии.
В свое время решал эту проблему при помощи аудио книг.
Их читают люди с хорошей дикцией.

Fastman
(04.05.11 21:53:10 MSK)

Ответ на: комментарий от Fastman 04.05.11 21:53:10 MSK

Ну так оно и понимать будет только людей с хорошей дикцией. Просят люди помощи, значит им надо зачем-то, почему бы не помочь?

ostin ★★★★★
(04.05.11 21:56:13 MSK) автор топика

Ссылка

> вам нужно зайти на страничку и прочитать в микрофон несколько предложений, приведенных на ней.

После чего уже ни один логопед не поможет этому проекту.

~~Lumi~~ ★★★★★
(04.05.11 22:11:07 MSK)

Ссылка

[ultra_fat]Смотрю тут проблемы с явой и звуком? А флеш это без бубна умеет ;)[/ultra_fat]

win7
(04.05.11 22:11:14 MSK)

Ссылка

Ответ на: комментарий от anonymous 04.05.11 21:04:26 MSK

нет, это современная звуковая подсистема линукс

bender ★★★★★
(04.05.11 22:12:03 MSK)

Вы не программист, не дизайнер и знанием иностранных языков не блещете? Вы не нужны.

sid350 ★★★★★
(04.05.11 22:14:53 MSK)

Ссылка

Помог бы, да нет микрофона

buddhist ★★★★★
(04.05.11 22:19:34 MSK)

Ответ на: комментарий от quickquest 04.05.11 20:39:52 MSK

> 3. Тестировать и доделывать модель на произвольном речевом потоке.
А это разве не оно?

alix ★★★★
(04.05.11 22:20:39 MSK)

Ответ на: комментарий от bender 04.05.11 22:12:03 MSK

>нет, это современная звуковая подсистема линукс

С флешом работает, а с супер-ынтерпрайзной джавой - нет?

anonymous
(04.05.11 22:26:38 MSK)

Хм...Текст читать вместе с ошибками?

John_Wehin ★
(04.05.11 22:34:20 MSK)

Ссылка

Ответ на: комментарий от alix 04.05.11 22:20:39 MSK

>А это разве не оно?

Нет. Это обучающие множества. Произвольный речевой поток - это, например, запись радиоспектакля со многими голосами, тембрами, акцентами, ... или запись полилога - «базара» на базаре :)

На сегодня, мне не известны модели распознавания фонем, инвариантные к временнЫм и спектральным особенностям речи.

quickquest ★★★★★
(04.05.11 22:34:28 MSK)

Ссылка

Меня глючит, или оно мне предлагает зачитать предложения из «Аэлиты» Алексея Толстого?

cPunk ★★
(04.05.11 23:10:19 MSK)

Ссылка

Оно подходит для проверки правильности произношения как это сделано в некоторых программах для изучения языков?

Leron ★★
(04.05.11 23:43:27 MSK)

Ссылка

404 по ссылке

beav228
(04.05.11 23:44:14 MSK)

Ссылка

О, поможем. Я люблю Java несмотря на то, что иногда она много памяти отжирает. Благо научился указывать приемлемые параметры потребления памяти, да и JRE 1.7 хоть и не стабильна, но резвее чем 1.6. За что Оракулу большое спасибо. Думаю, для Java-комьюнити покупка Sun Oracle'ом пользу принесёт.

lucentcode ★★★★★
(05.05.11 00:01:01 MSK)

Ссылка

Кошмар. Долбаный апплет не работает, можно бы записать через аудацити и кинуть файл на их файлообменник, но инструкцию по этому делу нужно долго и упорно переводить. Они не могли вывесить тексты для чтения и требования к формату аудиофайлов? Да не сложно записать и отправить, но трахаться с их жабами и инструкциями нет никакого желания.

~~Napilnik~~ ★★★★★
(05.05.11 00:02:34 MSK)

Ссылка

Ответ на: комментарий от buddhist 04.05.11 22:19:34 MSK

>Помог бы, да нет микрофона

Ага, аналогично.

onix_N ★★
(05.05.11 00:05:51 MSK)

Ссылка

Поучаствовал, анонимно. Теперь думаю, кого ещё бы подключить к делу. Ничего, завтра будет день, посмотрю в список друзей в соцсетях...

lucentcode ★★★★★
(05.05.11 00:16:41 MSK)

Ссылка

Ответ на: комментарий от vurdalak 03.05.11 23:43:18 MSK

oss уже полностью свободный? я такой слоууууууу

воспользуйтесь алсой

Ingwar ★★★★★
(05.05.11 00:19:27 MSK)

Заметил, что их апплет выводит кривую похожую на те, что используют в интерактивных системах обучения иностранным языкам. Почему не напишут открытое Java-приложение для этого дела? На подобие Rosetta Stone или Tell me More?

lucentcode ★★★★★
(05.05.11 00:19:45 MSK)

Ссылка

Ответ на: комментарий от Ramen 04.05.11 06:35:01 MSK

хотелось бы мою хохляцкую дикцию сравнить с вашим россиянським прононсом. интересно, у кого бы гхеканья и шоканья было бы больше

Ingwar ★★★★★
(05.05.11 00:24:05 MSK)

Ответ на: комментарий от Ingwar 05.05.11 00:19:27 MSK

воспользуйтесь алсой

Воспользуюсь оной на ноуте. А вот на десктопе она не прижилась.

~~vurdalak~~ ★★★★★
(05.05.11 00:31:42 MSK)

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 →

← Вышел QtSDK 1.1

Open Source

Apache вызван в суд по делу Oracle vs. Google →

Похожие темы