LINUX.ORG.RU

Tolma.ch - поддерживая месячник CAT-инструментов на ЛОРе

 , , , ,


1

2

Недавний скриншот @Bagrov про OmegaT показал, что среди лорчан есть интерес к софту для переводчиков, а потому неплохо бы мне самому немного выйти из тени и рассказать, на что я трачу все свои свободные силы и время в последние пять лет - вдруг кому будет интересно, полезно и удобно:)

Для начала наверное немного предыстории - по основному образованию я лингвист-переводчик китайского и англиского языков, но как-то так вышло, что где-то на втором курсе я вдруг понял, что большая часть профессиональной работы письменного переводчика составляют не всякие классные художественные тексты, а бесконечная юридическая и техническая макулатура, едва отличимая одна от другой. Поэтому, продолжая про запас доучиваться на основной специальности, начал качаться параллельно в айти - линуксы, админство, немного разработки. Чем, собственно, в последние девять лет и кормлю себя.

И вот пока я ещё доучивался на переводчика, меня невероятно поражала неэффективность того, как мне и моим коллегам приходилось работать над переводами. Каждый делал всё сам по себе, словари часто бумажные, даже не электронные, тексты в ворде, перевод прямыми заменами внутри оригинального текста. Всё это медленно, муторно, никаких бэкапов, никакого переиспользования уже сделанных переводов. Тогда уже существовал Trados (вообще, есть ощущение, что этот мамонт был вообще всегда), но даже тогда, в середине нулевых он выглядел невероятно монструозным и уродливым. А на фоне свежеобретённого увлечения юниксами, очень важным фактором была кроссплатформенность, которой Trados, очевидно, не обладал. И на вот этом вот прекрасном фоне оформилась идея накостылить собственный велосипед, которым хотелось бы в первую очередь пользоваться самому.

Основные идеи, лежащие в основе Tolma.ch такие:

  • кроссплатформенность
  • коллективная работа над переводом
  • максимальная простота и доступность интерфейса
  • (и с последующим бумом смартфонов) максимально полноценная работа с мобилок

Учитывая всё вышесказанное и то, что я, в общем-то, был один со своей задачей, самым доступным вариантом реализации задуманного был веб-сервис. Миллион разных клиентов под разные платформы тащить даже сейчас кажется непосильной задачей.

Результат почти пяти лет трудов можно наблюдать на скриншоте:) Что на нём вообще видно:

  • документ бьётся на сегменты по предложениям
  • в левом блоке список сегментов и, собственно, ведётся работа над переводом, в правом блоке - общий вид переводимого текста для контроля контекста. Можно переключаться между режимом оригинального текста и режимом отображения уже переведённых фрагментов
  • сделанные переводы сохраняются в базы памяти и потом предлагаются, если достаточно похожи на текущий сегмент
  • отдельно можно вести глоссарии (на скрине видно выделенный «Event-Driven»), чтобы соблюдать однородность терминологии. Прямо сейчас пока работают на простых регулярках, ищут точное соответствие, но на стейдже уже лежит версия со стеммером для европейских языков, чтобы искалось с учётом словоформ
  • машинные переводы. Пока только Яндекс, т.к. только они дают бесплатную апиху. Но на уже готовую архитектуру довольно просто в будущем будет добавить любой другой MT-движок
  • переводы от других людей, участвующих в проекте
  • словари. Сделаны всплывающий окном, отображаются не постоянно, потому что нафиг надо.

Из того, что не видно на скриншоте, но оно есть под капотом:

  • история правок сегментов
  • тёмная тема для настоящих красноглазов
  • мобильная версия. Функционально полностью аналогична десктопной, но в силу ограниченного рабочего пространства, увы, не так удобна. Со временем планирую добавить управление жестами, что должно будет снять часть анальных болей
  • учитывая упор на кроссплатформенность - не важно, где, как и с какого девайса вы заходите каждый из разов - при открытии документа, над которым вы работали раньше, вы будете сразу перемещены к тому сегменту, на котором остановились
  • превьюхи сегментов и их переводов в социалках/чатах, чтобы можно было что-то обсудить не переходя внутрь сервиса
  • система ролей для проектов - владелец, редактор, переводчик, наблюдатель. С соответствующими ограничениями на спектр возможных манипуляций с данными
  • базовая болванка под организации - надмножество над проектами, в которое можно добавлять переводчиков с распределёнными ролями и они будут автоматом раскидываться во все внутренние проекты. Впоследствии будет так же организован шаринг баз памяти перевода и глоссариев

Ближайшие планы - подключить Languagetool для QA переводов, расширенный поиск, как в какой-нибудь IDE, чтобы можно было осуществлять сложный поиск по паттернам + поиск и замена, расширить набор поддерживаемых языков перевода, сделать редактор баз памяти перевода.

>>> Просмотр (3000x2000, 595 Kb)

★★★

Проверено: Zhbert ()
Последнее исправление: mega_venik (всего исправлений: 2)

Весьма и весьма неплохо. А как рабочий процесс выглядит? Можно создать проект, накидать DOCX, HTML, ODT, LaTeX, SRT перевести и сгенерировать переведенные файлы? А загрузить или выгрузить базу переводов?

Поддержу веб. Все-таки Multitran, Lingee, ReversoContext ничто не заменит, и из браузера их открывать проще, чем из десктопного ПО. Либо нужно десктопное ПО со встроенным браузером, хотя бы текстовым (к сожалению, OmegaT Browser роняет OmegaT по крайней мере на моей системе).

Bagrov ★★★★★
()
Ответ на: комментарий от Bagrov

Можно создать проект, накидать DOCX, HTML, ODT, LaTeX, SRT перевести и сгенерировать переведенные файлы?

Ага, всё так. Вся вёрстка и внутрянка различных документов от переводчика спрятана от греха подальше. Только HTML’а и LaTeX’а пока среди форматов нет:( Вот что есть на данный момент:

  • Офисные форматы: DOCX, DOC, XLSX, XLS, ODT, RTF
  • Субтитры: SRT, ASS
  • Интерфейсы: POT, PO, MO
  • И обычные TXT

А загрузить или выгрузить базу переводов?

Загрузить можно, выгрузить пока нельзя. Там пока мешает то, что оно сделано прямым блокирующим запросом к бекенду вместо неблокирующего с фоновой генерацией. Очередь задач уже есть, осталось перевешать туда подобные процессы.

Поддержу веб. Все-таки Multitran, Lingee, ReversoContext ничто не заменит, и из браузера их открывать проще, чем из десктопного ПО

Вот тут по мере сил хотелось бы все эту классные полезняшки запихать в одно окно, чтобы не отрываться от контекста перевода. И если с мультитраном ещё как-то решаемо, то вот у реверсо публичного апи я что-то не нашёл, видимо, придётся парсить веб-вывод

mega_venik ★★★
() автор топика
Последнее исправление: mega_venik (всего исправлений: 1)
Ответ на: комментарий от mega_venik

И если с мультитраном ещё как-то решаемо,

Я так понимаю, через готовые парсеры? Упоминаний API на их сайте не нашел.

Bagrov ★★★★★
()
Ответ на: комментарий от Bagrov

Я так понимаю, через готовые парсеры? Упоминаний API на их сайте не нашел.

Они торгуют своими базами целиком, без API

mega_venik ★★★
() автор топика

слушай, а прикольно, мне нравится

Kompilainenn ★★★★★
()
Ответ на: комментарий от Kompilainenn

у французов в online.net. Странно, что медленно, из питера всё тип-топ:)

mega_venik ★★★
() автор топика

Офигенно, чувак. Это вам не очередной плеер гита. А какие там словари? Мультитран прикручивается?

no-such-file ★★★★★
()

А можно один документ переводить на несколько языков с одного, не загружая исходники заново?

Kompilainenn ★★★★★
()
Ответ на: комментарий от kirill_rrr

Но оно же онлайн! Это не инструмент, это сервис.

и это круто, как по мне. Я могу откуда угодно потихоньку переводить, не таская за собой проект в ОмегаТ или ОмегаТ, настроенный для подключения к Git, на внешнем диске.

Kompilainenn ★★★★★
()

Не только полезная штуковина, но и прохладная история!

Крутяк.

Nervous ★★★★★
()
Ответ на: комментарий от no-such-file

Это вам не очередной плеер гита

А может, он там есть под капотом? %)

Nervous ★★★★★
()
Ответ на: комментарий от Kompilainenn

А можно один документ переводить на несколько языков с одного, не загружая исходники заново?

Ага, уже внутри проекта можно добавить новые языки назначения - https://monosnap.com/file/fl9RWNCrUIC8w3r1l8Oj6ZaiNg36Ld

mega_venik ★★★
() автор топика
Ответ на: комментарий от vtVitus

а код то где ? :-) или это не опенсорс ?

Вот тут да. Код в битведре, битведро под замком.

Хотелось бы на нём в итоге всё же заработать, но с монетизацией пока непонятно, как именно пойдёт, получится ли набрать достаточно пользовательской массы, чтобы сервис жил с абонентки или нет. Эбби знатно так подосрали в этом плане, за тра месяца до моего публичного релиза выкатив свой, фактически бесплатный для конечного пользователя, Smartcat.

Интерфейс у них, конечно, лучше чем у традоса, но всё равно дуболомный и перегруженный. Но учитывая их бэкграунд и бюджеты, они довольно быстро стали CAT’ом по умолчанию, кмк.

Возможно, будет иметь смысл играть от опенсорса и монетизироваться на поддержке/установке б2б, как какой-нибудь Elastico. В течение этого года буду пробовать варианты.

mega_venik ★★★
() автор топика
Последнее исправление: mega_venik (всего исправлений: 1)
Ответ на: комментарий от Kompilainenn

Если вы можете настроить эту самую омегуТ на гит на внешнем диске, то почему бы не настроить её же на облачный диск?

kirill_rrr ★★★★★
()
Ответ на: комментарий от kirill_rrr

Саму ометуТ придется все равно таскать с собой! А тут пришел куда угодно, ввел логин/пасс и продолжаешь там, где закончил

Kompilainenn ★★★★★
()
Ответ на: комментарий от Kompilainenn

Не куда угодно, а только туда, где есть дешёвый и стабильный интернет.

По мне, так идеальный софт должен крутиться на легко переносимом в кармане устройстве, подключаемом к любому монитору, выши, клаве. Жаль что нормальной реализации я пока ещё не встречал.

kirill_rrr ★★★★★
()
Последнее исправление: kirill_rrr (всего исправлений: 1)
Ответ на: комментарий от kirill_rrr

Чтобы выбрать несколько не смежных ячеек с помощью режима выделения Добавляемое:

ну это ж идея смарта, как компьютера, который можно подключить к монику/клаве где угодно. Отличная идея, если бы была дешёвая стандартизированная док-станция для всех смартов

Kompilainenn ★★★★★
()

Очередная проприетарщина - да ещё и поддерживаемая не пойми кем, не пойми как: использовать можно только с данными, которые не жалко потерять в любой момент. Правда, не ясно зачем - при наличии прорвы альтернатив. Отдельная ржака что твой адблок на твоём же вебсайте нашёл что заблокировать :-D

zabbal ★★★★★
()
Ответ на: комментарий от zabbal

Очередная проприетарщина - да ещё и поддерживаемая не пойми кем, не пойми как: использовать можно только с данными, которые не жалко потерять в любой момент. Правда, не ясно зачем - при наличии прорвы альтернатив.

Так я ж разве против?:) От каждого по способностям, каждому по потребностям)

А вот про адблок не распарсил, если честно. Какой ещё «мой» адблок?🤔

mega_venik ★★★
() автор топика
Ответ на: комментарий от mega_venik

Жена попользовалась, но сказала, что

" Посмотрела Tolma.ch. Пока слабоват по сравнению с тем инструментом, который я использую.

а у тебя какой?

https://freetm.com/

"

такие пироги с котятами :-)

vtVitus ★★★★★
()
Ответ на: комментарий от mega_venik

Какой ещё «мой» адблок?

На иконку ADB в твоём браузере на скрине глянь.

zabbal ★★★★★
()
Ответ на: комментарий от Kompilainenn

usb mhl + bluetooth mouse/kb, я это еще на galaxy s2 проворачивал

а сейчас и подавно есть куча универсальных решений - usb type-c же

другое дело, что ведроид не очень готов к работе через kb+mouse по сей день, да и серьёзного софта для создания контента как-то не завезли - либо linux в контейнере, либо венда по rdp

Ford_Focus ★★★★★
()
Последнее исправление: Ford_Focus (всего исправлений: 1)
Ответ на: комментарий от Kompilainenn

@kirill_rrr

По мне, так идеальный софт должен крутиться на легко переносимом в кармане устройстве, подключаемом к любому монитору, выши, клаве. Жаль что нормальной реализации я пока ещё не встречал.

Отличная идея, если бы была дешёвая стандартизированная док-станция для всех смартов

У самсунга есть Dex. Первые версии были с док-станцией, но сейчас работает просто через специальный переходник с usb на hdmi. Одно время они даже Linux on Dex поддерживали, сейчас закрыли. Все есть, только софта нет и мало кто пользуется.

another ★★★★★
()
Ответ на: комментарий от another

Логично что мало кто пользуется, софта ведь нет. Про ДЕКС я знаю, в таком виде это не интересно. К тому же это для околотоповых смартфонов.

kirill_rrr ★★★★★
()
Последнее исправление: kirill_rrr (всего исправлений: 1)
Ответ на: комментарий от another

Linux on Dex мог бы стать хорошим решением, ведь для десктопного режима нужен десктопный софт. Для начала.

kirill_rrr ★★★★★
()
Ответ на: комментарий от kirill_rrr

Я пользовался андроидом в режиме DeX. Но не на телефоне, подключенном к монитору, а на планшете от самсунга, в котором DeX без внешнего монитора включается. Но суть одна и та же, просто экран маленький.

Но я работал через виртуализацию от Parallels. В таком режиме вполне годно и даже DeX не нужен, без него все работает. В отпуске без таскания с собой ноута вполне можно было посмотреть задачи и чего-то несложное поделать.

Так что, если все уйдет в облака, то вполне может настать тот день, когда все, что тебе нужно будет - это телефон, монитор, клавамышь и интернет. Все остальное - в облаке.

another ★★★★★
()
Ответ на: комментарий от Kompilainenn

Как всегда. Пока не выйдут из него, ничего не поплывет. Линукс уже вон сколько лет не может из него выйти. :)

another ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.