LINUX.ORG.RU
ФорумTalks

Распознавание речи на ПК - когда уже?

 


0

1

Приходится сейчас забивать просто тонны информации в 1с.

А было бы клёво просто читать в слух, перемежая каким-нибудь «дальше» или «следующее поле».

Почему телефоны умеют в распознавание речи, в том числе оффлайн, а компьютеры до сих пор не умеют? Казалось бы, ресурсов тонны, дай словарь и вперёд. Но имеем что имеем.

★★★★

1 они распознают по 2-3 слова, длинное предложение не получается
2 проще набрать, чем править ошибки

Satou ★★★★★
()

Почему телефоны умеют в распознавание речи, в том числе оффлайн, а компьютеры до сих пор не умеют?

Если ты про распознание голоса гуглем, то оно плохонькое. Лучше печатать.

goingUp ★★★★★
()

Распознавание речи

Разглашение персональных данных, коммерческой тайны и ошибки ввода. Руками быстрее набить.

Suigintou ★★★★★
()

телефоны умеют

Когда я был совсем маленький у было парочку журналов «Техника молодёжи» или что-то в этом духе. Там была схема на рассыпухе, которая детектировала команды «Стоп» и «Пуск». Там было буквально 2-3 транзистора, а остальное и вовсе ерунда.
Так вот — современные телефоны распознают не намного лучше.
Так что нет, нет телефонов, которые могут распознавать речь.

Stahl ★★☆
()

Приходится сейчас забивать просто тонны информации в 1с.

есть же обработки импорта справочников и документов, в том числе и из табличных документов

StellzZz ★★
()
Ответ на: Длинное предложение получается от Camel

В первом коменте он сам же и сказал, что ошибок было очень много. Даже одно криво распознанное слово на 20 правильных дико бесит.

goingUp ★★★★★
()
Ответ на: комментарий от iz_tabakerki

Хотя сейчас попробовал, не так уж всё плохо.
Тестовые вопросы: найди картинки зелёный слоник (стал искать не картинки, а фразу целиком), линукс орг ру (получилось), метамфетамин (получилось), ЛОР (не получилось, распознавал как «алло», «ладно», и ещё как-то). В общем, пока не готово.

iz_tabakerki
()

Люди не всегда могут распознать речь %).

Darth_Revan ★★★★★
()
Ответ на: комментарий от iz_tabakerki

А с целыми предложениями уже совсем жесть начинается:
Все пользователи линукс орг ру упороты -> где пользователь Ирина Безрукова

iz_tabakerki
()
Ответ на: Длинное предложение получается от Camel

Но факт остается фактом: этот пост надиктован.

И там ниже в комментах посмотри по кол-во ошибок :). Вот мой экспериенс с гугловой распознавалкой (оригинал в первом параграфе):

Statistics is the study of the collection, analysis, interpretation, presentation, and organization of data. In applying statistics to, e.g., a scientific, industrial, or social problem, it is conventional to begin with a statistical population or a statistical model process to be studied.

Statistics is the study of the collection analysis interpretation presentation and organization of data in it line statistics to Scientific industrial or social problem with this conventional to beginning with a statistic a population or statistical model process to be started

Работает, но делает много ошибок, увы. Правда, это мой инглиш, у нэтивов должно быть меньше проблем, кмк.

PS Как «e.g.» читается я не знаю, поэтому не произносил.

true_admin ★★★★★
()

Найми секретаршу, которая будет под диктовку это вводить.

Hater ★★
()

Так давно уже.

Под OS X вполне нормально работает.

fornlr ★★★★★
()
Ответ на: комментарий от pacify

Ещё с 8- и 16-битных компьютеров: http://zx-pk.ru/threads/25833-raspoznavanie-rechi-v-1980-kh.html

Старые методы работают в разы хуже новых.

В современном исполнении: тыц 1, тыц 2

Это не «современное». Это говно мамонта уровня 80-90-хх.

Solace ★★
()

Потому что ПК не нужны, пользуйся Nintendo DS. В ней есть всё, что нужно для жизни: можно поставить Linux, эмулятор DOS'а, эмуляторы старых консолей, неофициальные порты старых шутеров, да ещё и в игры самой DS можно играть (хотя кому это нужно?).

И графические редакторы на ней есть, и медиаплееры, и браузеры, и программы вроде калькулятора.

И самое интересное: Love+ на ДС таки умеет в распознавание речи, которое ты так жаждешь. На японском, правда. Но это не важно.

Вывод: выбрось свой ПК из окна и купи DS, сэкономь свои деньги и нервы.

otasan
()

С клавиатуры текст вводить получится гораздо быстрее, если только ты не адепт двухпальцевого метода.

r_asian ★☆☆
()
Ответ на: комментарий от Stahl

Так что нет, нет телефонов, которые могут распознавать речь.

Зато есть портативные консоли от Nintendo, которые могут.

otasan
()
Ответ на: комментарий от Solace

Новые работают тоже отвратительно. Если в случае с английским это ещё можно списать на мой рунглиш, то распознавание русского просто работает примерно никак.

iz_tabakerki
()
Ответ на: комментарий от iz_tabakerki

В чем? Вообще методики нормального разбора есть и они используются. Но в опен-сорсе ничего нет готового, только компоненты.

Solace ★★
()

Об этом многие мечтают, преимущественно в социальных науках и масс-медиа.

Решения есть. Цена вопроса — от 6.000 рублей в полгода за программу.

bookman900 ★★★★★
()

Я у андроида частенько спрашиваю погоду, он мне иногда выдаёт инфу о пагоде. А вот таймер на час всегда ставится как положено. Так что не всё радужно, и 1с я бы точно не стал так забивать.

Sadler ★★★
()
Последнее исправление: Sadler (всего исправлений: 2)

том числе оффлайн

Яблочник? Мне тут недавно один владелец айфона рассказывал про оффлайн распознавание, пока не попробовал отключиться от сети.

kim-roader ★★
()
Ответ на: комментарий от Solace

Да хоть анально закабалённая проприетарищина. Всё равно оно работает плохо, я тольео что проверил, результаты выше.

iz_tabakerki
()

Не нужно. Так я могу тралировать на лоре и параллельно слушать музыку, да еще с кем-нибудь разговаривать.

buddhist ★★★★★
()

Ну я сейчас буду разрабатывать такую софтину. Пока только для оптовой торговли, но там посмотрим.

Единственно не нашел нормального движка для оффлайн распознавания. Честно с неделю тыкал в cmusphinx, но так и не добился от него качественного распознавания даже отдельных команд. Что уже говорить о предложениях.

Но очень понравился как распознает гугловский онлайн движок, вот его и буду использовать.

foror ★★★★★
()
Последнее исправление: foror (всего исправлений: 1)

Секретарша лучше.

dk-
()

действительно, ну когда же уже миллиарды простаивающих микрофонов перестанут простаивать?? Когда же уже миллиарды простаивающих видеокамер перестанут простаивать?? Когда, Господи, ну когда же уже наступит настоящая западная демократия???

ekzotech ★★★  скакун

надо признать, эти ребята ОЧЕНЬ хороши, да. Я не знаю кто они, но они великолепны. Двуногие бараны просто подпрыгивают от нетерпения и уже просто извелись в ожидании. Интересно, обработанный их техникой мозг вообще может восстановиться? Впрочем, вру. Не интересно. Придёт время и весь двуногий мусор будет ликвидирован физически.

targitaj ★★★★★
()

ты не мог бы перечислить используемые тобой средства распространения информации? Не могут же быть заражены все доступные средства. Не верю. Может быть ты помнишь момент своего заражения? Сомнительно, конечно, но всё-таки. Это тот самый день, когда ты всё понял.

targitaj ★★★★★
()
Последнее исправление: targitaj (всего исправлений: 1)

Так умеют. Майкрософт, что им нужно поймут. Телевизоры тоже понимают.

Esteban_Garcia
()

Я постоянно надиктовываю тексты на ноутбуке через гугл, с разморозочкой.

Lordwind ★★★★★
()
Ответ на: комментарий от iz_tabakerki

У меня стоит «Ассистент» на телефоне. Нормально он распознаёт речь.

Учитывая, что всё, что мне нужно - «Иванов Петр Сидорович, 111-11-11» - очень даже справится, я думаю.

ekzotech ★★★★
() автор топика
Ответ на: комментарий от kim-roader

Яблочник? Мне тут недавно один владелец айфона рассказывал про оффлайн распознавание, пока не попробовал отключиться от сети.

Нет, на андроиде можно скачать пакет для распознавания речи оффлайн.

ekzotech ★★★★
() автор топика
Ответ на: комментарий от targitaj

Выдох-вдох. Повторяй. Скоро тебя отпустит.

ekzotech ★★★★
() автор топика
Ответ на: комментарий от Lordwind

хз, я маме выбирал какие есть, dd на первом месте сейчас. Точнее там вроде его как-то отребрендили, но у него интеграция почти со всеми кишками венды и стандартным софтом, даже с браузерами

upcFrost ★★★★★
()

Нормально гугл распознает речь, часто пользуюсь. Там у них фишка же вроде, чем больше ты пользуешься распознавалкой, тем лучше распознает именно тебя. Даже в настройках есть такая галка.
Недавно гугл полностью правильно мои паспортные данные распознал.

beer_and_linux
()
Ответ на: комментарий от ekzotech

На ПК только голосовой поиск использую, он в хроме из коробки идет, как к другим браузерам прикрутить, я не в курсе. А про качество распознавания это я вообще написал, что оно уже в целом удовлетворительно работает, осталось только к ПК прикрутить. У яндекса, кстати, распознование сильно хуже, зато пунктуацию нормально расставляет.

beer_and_linux
()

Найми секретаршу, то что тебе хочется выходит за рамки распознавания голоса и требует искусственного интеллекта.

torvn77 ★★★★★
()
Последнее исправление: torvn77 (всего исправлений: 1)
Ответ на: комментарий от torvn77

Найми секретаршу, то что тебе хочется выходит за рамки распознавания голоса и требует искусственного интеллекта.

Работы дофига, надо нанимать тогда 5-6 секретарш.

И всё равно - всё, что мне нужно - просто вбить произнесённую фразу в поле. Что в этом сложного?

ekzotech ★★★★
() автор топика
Ответ на: комментарий от beer_and_linux

Ну я большие и сложные тексты не надиктовывал, однако по фразам вполне нормально распознаёт.

ekzotech ★★★★
() автор топика
Ответ на: комментарий от ekzotech

И всё равно - всё, что мне нужно - просто вбить произнесённую фразу в поле. Что в этом сложного?

А ты отключи свою мышку от компьютера и поймёшь :)

torvn77 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.