LINUX.ORG.RU
ФорумTalks

[Машинный Надмозг][A.I.BBYY][Со Словарем(ТМ)] не прошло и 5 лет ребрендинга


0

1

По ссылке http://www.computerra.ru/sgolub/663954/ культуртреггер Голубицкий хвалит новую революционную технологию машинного перевода Compreno, которая какбэ вдруг перевернет индустрию и сдвинет парадигмы набекрень, породит искусственные интеллекты, которые захватят мир, «желательно весь»... За минусом дифирамбов и прочей джинсы и заказухи (уличаемый в которой, дядя Сережа всегда очень обижался) преследовало стойкое ощущение дежавю:

примерно лет пять назад, еще в бумажной «КТ» эту ересьперспективную технологию в цвет разоблачали недруги и завистники «Ашманов и партнеры» как основаннную на лженаучной идее. И точно - ниже в камментах есть ссылка на статью 2007-го года http://www.computerra.ru/think/319710/ (дежавю не только у меня). Тогда они обещали чудо к 2009-му году... Маркетологи, видать серьезно переработали концепцию и сравнительное позиционирование, правда не за 15, как в статье Голубицкого, а всего за 5 лет. (За это время, наверное, «потеки» со словаря, выкинутого Ашмановым в мусорку, успели удалить.)

ну вообще семантические концепции развиваются довольно сильно, но перевод натурального языка полностью - утопия.

XVilka ★★★★★
()
Ответ на: комментарий от XVilka

Опять поживем увидим. Коммунизм через 20 лет неизбежен для нынешнего поколения советских людей:)

slackwarrior ★★★★★
() автор топика
Ответ на: комментарий от XVilka

Технический английский не совсем уже натуральный язык. Его сильно упростили за последние лет 30, потихоньку выкидывают исключения. Как же иначе индусы его понимать будут?

DNA_Seq ★★☆☆☆
()

Как ни почитаешь эти ваши новости, дык каждый день то прорыв, то инновация, то революция.
Потом посмотришь по сторонам - вроде все как было.

thesis ★★★★★
()
Ответ на: комментарий от Cancellor

Аффтар ыфкуила с тобой не согласен :)

slackwarrior ★★★★★
() автор топика

Позовите, как стихи научится переводить.

buddhist ★★★★★
()
Ответ на: комментарий от CYB3R

Что же мы без эксепшонов делать будем, раз они не нужны?

Ну что вы заладили? Без них какбудто нельзя никак — можно.

Bad_ptr ★★★★★
()
Ответ на: комментарий от DNA_Seq

Как понимали, так и будут понимать, в индии столько человек, что если будут платить за клингонский, то и на нем говорить будут.
Исключения выкидывают скорее американцы и те, кто ими недавно стал.

Tark ★★
()

Я так и не смог понять, какое отношение высеры ашманова имеют к продукту ABBY? Скиньте кто-нибудь цитату.

Manhunt ★★★★★
()
Ответ на: комментарий от Manhunt

Ах, оно, оказывается, в самой середине простынки.

Ъ

Допустим, что есть в центре Москвы очень успешная софтверная компания «Файн и сыновья», которая уже восемь лет работает над...

- ...единой, фантастической системой машинного перевода. Основатель этой компании - опытный гипнотизер клиентов, журналистов и инвесторов. Но, как все гипнотизеры, он и сам подвержен гипнозу. И поэтому, когда он искал для себя новый крупный проект, то сам поддался гипнозу великих целей и собственных сотрудников. Там ситуация такая: в отечественной прикладной лингвистике в свое время Мельчуком и Жолковским была взорвана бомба под названием «модель смысл-текст». Эта лженаука повредила мозги очень многим тогда, от последствий отечественная прикладная лингвистика избавлялась очень долго, но так и не избавилась до конца. Апресяновская группа («Этап-2», «Этап-3») потратила 30 лет на неработающую систему перевода! Суть же самой идеи в очень грубом изложении в следующем: если мы аккуратно опишем актанты (валентности глаголов, они же лексические функции) всех глаголов и научимся переводить один в другой и подставлять лексические функции одна в другую, то на выходе получим машинный переводчик. Общая идея в том, что у каждого глагола есть набор лексических функций, и в каждом языке этот набор такой же, но средства выражения другие. И если мы средства выражения опишем, то дальше можем взять глагол в одном языке, оценить, какие лексические функции несут окружающие его существительные, и построить выражение с тем же набором лексических функций на другом языке. Просто подставив переводы слов в рамку лексических функций.

Идея эта неверна, что было понятно чуть ли не с самого начала. Они - Мельчук с Жолковским - пытались сделать толково-комбинаторный словарь. Собрали чуть ли не сотню аспирантов и составили. Вот такой толщины (показывает). Я его купил в восьмидесятых годах за сорок рублей, брежневских еще. Толстый черный словарь. В нем было четыреста глаголов. И когда я начал его читать, то понял, что это сборник анекдотов. Буквально через каждые десять глаголов им приходилось придумывать новые лексические функции, ибо в реальности множество этих функций оказалось разомкнутым. Они сделали шестисотстраничный словарь для четырехсот глаголов, но было видно, что, во-первых, эту работу нельзя завершить, а во-вторых, пользоваться ей невозможно, потому что все плывет, множество незамкнутое, и свести его не удается. Я его почитал, выбросил в ведро, но жена потом обратно достала, пожалела сорок рублей. Так до сих пор и стоит, весь в потеках.

И вот один важный сотрудник этой компании - он изначально программист, насколько я понимаю - решил, что все Маркса поняли неправильно, а он один понял правильно. Он - единственный правильный последователь Мельчука и Жолковского, до этого реализации были неверные. Но если сделать все по классической науке, то все заработает. В результате у него сидит сто лингвистов, они уже восемь лет над этим корпят, потратили пятнадцать миллионов долларов, он рассказывает о блестящих перспективах Основателю, а Основатель пересказывает всем остальным.

Они откладывали выпуск уже много раз (последний раз компания отложила выпуск беты в марте этого года - Прим. ред.), пару раз даже собирались свернуть идею и делать translation memory, что гораздо проще и более осмысленно (что-то типа TRADOS).

Manhunt ★★★★★
()
Ответ на: комментарий от Manhunt

Так вот когда ашманов осилит сделать ORC уровня FineReader, или любую сравнимую по сложности задачу ИИ, его мнение о пацанах из abby начнет что-нибудь значить. А пока это больше напоминает сявканье шелудивой собаки на проезжающий мимо автомобиль.

Manhunt ★★★★★
()
Ответ на: комментарий от DNA_Seq

Технический английский [...] сильно упростили, потихоньку выкидывают исключения

несколько раз перечитал, пока понял, кто чего выкидывает ;-)

name_no ★★
()
Ответ на: комментарий от Manhunt

Так вот когда ашманов осилит сделать ORC уровня FineReader, или любую сравнимую по сложности задачу ИИ, его мнение о пацанах из abby начнет что-нибудь значить. А пока это больше напоминает сявканье шелудивой собаки на проезжающий мимо автомобиль.

А твой пост напоминает такое сявканье в адрес Ашманова (специалиста в области компьютерной лингвистики).

tailgunner ★★★★★
()
Ответ на: комментарий от tailgunner

Специалист-то он специалист, да результатов сравнимых с теми, что демонстрируют abby - у него нет. Не ему их судить.

Manhunt ★★★★★
()
Ответ на: комментарий от Manhunt

Спердобейся во все поля. Речь не про OCR, а про машинный перевод. На который товарисчи замахивались оч. давно, с тем, либо другим пеаром и буззвордами, а выходил пук. В 2009 году, например. Вот когда выпустят что-то соответствующее реляциям, в частности претензиям на универсальность этой их «УСИ-пуси» - их мнение про машинный перевод будет что-то значить, независимо от всяких разных OCR достижений.

slackwarrior ★★★★★
() автор топика
Ответ на: комментарий от Manhunt

да результатов сравнимых с теми, что демонстрируют abby - у него нет

Откуда ты знаешь - анализировал «Спамтест»?

Не ему их судить.

Он, в отличие от тебя, судит используемый «пацанами из Abbyy» метод.

tailgunner ★★★★★
()
Ответ на: комментарий от Manhunt

Ну да. Не лингвисту Виноградову В.В. судить лингвиста-любителя М. Задорнова - у него же нет такой кипы сочинений, полных искрометного йумара, и «оригинальных этимологических исследований». Результаты чего сравниваем-то, в какой области?

slackwarrior ★★★★★
() автор топика
Ответ на: комментарий от Manhunt

Речь про конкретную задачу. А не про задачи ИИ вообще.

slackwarrior ★★★★★
() автор топика
Ответ на: комментарий от Manhunt

Так вот когда ашманов осилит сделать ORC уровня FineReader

Ну, ядро для файнридера начинал писать один мой знакомый, в ВЦ РАН,
в 1999 году - что-то там со скелетизацией растра делал. Как они там
его наработки потом использовали - не знаю. Но тот факт, что обычный
МФТИшный аспирант (в соответствующем коллективе) может поднять такую
задачу - уже что-то значит.

Сейчас, разумеется, за ~13 лет уже многое изменилось, но начиналось примерно так.

pacify ★★★★★
()
Ответ на: комментарий от Manhunt

Речь о способности решать нетривиальные задачи ИИ.

Никакого «ИИ» не существует. Есть обычная математика.

pacify ★★★★★
()
Ответ на: комментарий от tailgunner

Откуда ты знаешь - анализировал «Спамтест»?

Спамтест установлен на мейлру, насколько я понял. Спам на мой ящик приходит регулярно. И он вдрызг сливает гугловому (однако ж посявкать на гугль ашманову это не помешало). А finereader - это лучшее в мире, бескомпромиссное решение.

Он, в отличие от тебя, судит используемый «пацанами из Abbyy» метод.

Сомневаюсь, что кто-то из абби отчитывается ашманову о деталях алгоритмов. А то, что их рассказы в общих чертах напомнили ашманову чью-то академическую неудачную попытку составить словарик --- это личные половые трудности ашманова, не более того.

Manhunt ★★★★★
()
Ответ на: комментарий от pacify

Ггг. У нас под распознавание три человека дипломы написали в 2002-м - автоматизировали анализ тестов в родном универе, под общим руками водительством председателя гос.комиссии.

slackwarrior ★★★★★
() автор топика
Ответ на: комментарий от pacify

Но тот факт, что обычный МФТИшный аспирант (в соответствующем коллективе) может поднять такую задачу - уже что-то значит.

Если бы обычный аспирант легко поднимал «такую задачу», высококачественных OCR-ов было бы как собак нерезаных.

Manhunt ★★★★★
()
Ответ на: комментарий от Manhunt

Пока не видно «удачной попытки» именно универсальной переводилки - никакие «секретные детали алгоритмов» не важны. Маркетинговый пеар, не более того. Реклама ханаанского бальзама.

slackwarrior ★★★★★
() автор топика
Ответ на: комментарий от slackwarrior

Пока не видно «удачной попытки» именно универсальной переводилки - никакие «секретные детали алгоритмов» не важны. Маркетинговый пеар, не более того.

Пока никто из нас не видел ни деталей алгоритмов, ни прототипа системы - по существу обсуждать нечего. Ни ругать, ни хвалить. Вот выведут ABBY свою поделку на рынок - тогда и посмотрим.

Manhunt ★★★★★
()
Ответ на: комментарий от Manhunt

Спамтест установлен на мейлру, насколько я понял. Спам на мой ящик приходит регулярно. И он вдрызг сливает гугловому

Ну, то есть не сравнивал. Понятно.

А finereader - это лучшее в мире, бескомпромиссное решение.

Часто распознаешь тексты?

Сомневаюсь, что кто-то из абби отчитывается ашманову о деталях алгоритмов

Зачем детали? То, что описал Ашманов, совпадает с тем, что описал Голубицкий. Люди из Abbyy изобрели универсальный промежуточный язык - как раз о возможности изобретения такого языка высказался Ашманов.

то, что их рассказы в общих чертах напомнили ашманову чью-то академическую неудачную попытку составить словарик --- это личные половые трудности ашманова, не более того.

То, что мнение специалиста кажется тебе половыми трудностями, уже вполне очевидно.

tailgunner ★★★★★
()
Ответ на: комментарий от slackwarrior

Ггг. У нас под распознавание три человека дипломы написали в 2002-м

Ну, я тоже специализировался по распознаванию образов в 1997-2000-м, в МГУ. И что?

Рано или поздно, программное обеспечение такого рода станет бесплатным. Маркетоиды будут выжимать деньги другими способами.

pacify ★★★★★
()
Ответ на: комментарий от tailgunner

То, что мнение специалиста кажется тебе половыми трудностями, уже вполне очевидно.

Я доверяю мнению тех специалистов, что работают в ABBY: эта контора на деле продемонтрировала свою дееспособность. А не тех, что пиарятся путем полива всех вокруг своими фекалиями.

Manhunt ★★★★★
()
Ответ на: комментарий от Manhunt

Я доверяю мнению тех специалистов, что работают в ABBY: эта контора на деле продемонтрировала свою дееспособность.

Гг. Акций Enron у тебя случайно нет?

tailgunner ★★★★★
()
Ответ на: комментарий от Manhunt

тех специалистов, что работают в ABBYY ... А не тех, что пиарятся путем полива всех вокруг своими фекалиями.

То, что сотрудники ABBYY не поливают свою компанию фекалиями - это
вполне логично. Но про всех остальных я бы говорить не стал. Я,
например, просто наблюдаю за всем этим со стороны. Мне безразлична
судьба ABBYY.
Сканированием/распознаванием текстов не занимаюсь, так как это в
нашей стране практически запрещено. Можно только свои записи [из
блокнотика] (или свои книги) распознавать, что по-сути - бессмысленное занятие.

pacify ★★★★★
()
Ответ на: комментарий от tailgunner

Зачем детали?

Потому что решают именно детали. С ИИ вот какая специфика: общие идеи и принципы хорошо известны, пережеваны в сотнях книжек; но попытки эти идеи совместить и воплотить во что-то, способное решать практические задачи, как правило заканчиваются провалом. Мало кто может додуматься до удачной реализации. Ну и есть круг задач, где правильный способ применения идей нащупан - эти задачи решаются хорошо, их любят давать студентам соответствующих специальностей.

Manhunt ★★★★★
()
Ответ на: комментарий от Manhunt

Потому что решают именно детали.

Это называется: сведения из предметной области. Например, нейрофизиологии, психологии восприятия и т.п.

Всё остальное - чистая математика.

pacify ★★★★★
()
Ответ на: комментарий от Manhunt

Мало кто может додуматься до удачной реализации.

Это называется: эвристика, эвристические алгоритмы. Ни о какой «удаче» и речи нет. Обычный труд ученых, подбирающих алгоритмы по требуемым свойствам, и творчески мыслящих.

pacify ★★★★★
()
Ответ на: комментарий от Manhunt

Зачем детали?

Потому что решают именно детали.

Детали могут решать, когда доказана принципиальная применимость подхода, а она нифига не доказана.

tailgunner ★★★★★
()
Ответ на: комментарий от pacify

Да ничего. Задача как задача. Кто экспертные системы писал, кто тексты распознавал. Модно было.

slackwarrior ★★★★★
() автор топика
Ответ на: комментарий от pacify

Всё остальное - чистая математика.

Математика - это всего лишь язык и формальный аппарат. С таким же успехом можно сказать про какой-нибудь фирефокс/хром, что там немножко сведений из предметной области, а всё остальное - «чистый c++» :D

Manhunt ★★★★★
()
Ответ на: комментарий от tailgunner

Детали могут решать, когда доказана принципиальная применимость подхода, а она нифига не доказана.

Чтобы применение подхода было успешным, сперва нужно правильно угадать детали.

Manhunt ★★★★★
()

Ашманов что-то понимает в лингвистике и технологиях перевода? Давно это с ним?

Xellos ★★★★★
()
Ответ на: комментарий от pacify

Мало кто может додуматься до удачной реализации.

Это называется: эвристика, эвристические алгоритмы.

Почему ты так решил? То есть здорово, что ты знаешь слово «эвристика».. но причем тут решения, принимаемые исследователями при построении алгоритма, реализующего некие подходы и идеи?

Manhunt ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.