LINUX.ORG.RU
ФорумTalks

Оцените идиотизм (скорее идеи, чем кода)

 


0

1

В общем, я доделал свою YOBA-библиотеку для комбинирования IBM-х Dialog-а (читай - сервис, реализующий такой себе автомат, проверяющий соответствие ввода регулярке - что не особо хорошо подходит, если нужно иметь кучу формулировок), NLC (читай - выбор категории, в которой попались наиболее похожие на введенную фразы) и ... бинго, блин. То есть Bing-го переводчика. Который юзается, чтобы скормить хоть как-то переведенный русский.

Код на https://github.com/alex4321/watson-dialog-nlc-robot . Уже готов ловить тапки за использование жидкобрейновой поделки, впрочем с жабой результат вполне себе стыкуемый :-)

з.ы. да, аватарка в связи с текущими событиями и тем, что я просрал дедлайны (установленные самим собой. Впрочем, самому себе же).

И да, линукс тут при том, что это можно запускать на нём.

alex4321
() автор топика

я доделал

Нихрена не понял что ты доделал. Можешь расписать подробней? А то какие-то регулярки, переводы, автоматы...

Stahl ★★☆
()
Ответ на: комментарий от Stahl

Так и думал. У IBM-а есть сервис Dialog, который по сути - проверяет на пользовательский текст на соответствие, если можно так сказать - определенной регулярке и выдает соответсвующий ответ. Например (синтаксис неверный)

- I can help you to order pizza
- [What|Which] sizes you have
- We have small, medium and big sizes

Не во всех случаях удобно.

У них же - есть NLC (Natural Language Classiifer). Читай - позволяет задать примеры фраз относящиеся к определенному классу и далее оно обсчитывает, что пользовательский ввод с такой-то вероятностью относится к такому классу, с такой - к такому.

Читай - можно передать в Dialog строку вида «size $USER_INPUT», что может быть удобнее.

Ну и т.к. NLC не работает с русским от слова «вообще» - для него прицепил вышеупомянутый переводчик.

alex4321
() автор топика
Ответ на: комментарий от alex4321

И да, разумеется - смысл в том, что вся эта красота не размазывается в 100500 местах (как минимум - исходная разметка диалога, исходные классы классификатора - и, соответственно, если нужен русский язык - переведенные), а описывается в одном xml-е.

alex4321
() автор топика

На секунду допустим, что я понял, о чем речь. Какая у этого ненужно область применения?

arturpub ★★
()
Ответ на: комментарий от alex4321

В смысле, всякое ботоводство на которое можно натянуть модель «получили пользовательский ввод на естественном языке - выявили высокую схожесть с типовым вопросом - дали ответ»

alex4321
() автор топика

Учитывая, как работает автоматический перевод с русского на английский более-менее сложных предложений, связка с прочей йобой тоже будет работать очень плохо.

sholom
()
Ответ на: комментарий от sholom

Да, есть мысля какой либо алгоритм векторизации пользовательского ввода приюзать, да сравнивать векторы введенной фразы и шаблонов - но что-то то руки из жопы, то ли место проклятое :-)

alex4321
() автор топика
Ответ на: комментарий от alex4321

Хм, то ли руки я распрямил, то ли дзинче-петух на аватарке радует - вроде дошло что в тех экспериментах с word2vec я делал через жопу

alex4321
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.