LINUX.ORG.RU

RTranslator 2.0.0 и 2.0.1

 , , ,


3

1

После почти трёхлетней паузы состоялись выпуски 2.0.0 и 2.0.1 оффлайн-переводчика для Android RTranslator, написанного на языках C++ и Java и распространяемого по лицензии Apache 2.0.
Для работы приложению необходим достаточно быстрый смартфон с, как минимум, 6GB памяти.
Поддерживаемые языки: арабский, болгарский, каталонский, китайский, чешский, датский, немецкий, греческий, английский, испанский, финский, французский, хорватский, итальянский, японский, корейский, голландский, польский, португальский, румынский, русский, словацкий, шведский, тамильский, тайский, турецкий, украинский, урду и вьетнамский.

После установки приложение загружает примерно 1.2GB данных.

Программа работает в трёх режимах:

  • перевод введённого текста;
  • распознавание речи и её перевод в режиме реального времени;
  • режим разговора – соединение по Bluetooth с другим устройством, где тоже установлен RTranslator.

В новых версиях:

  • использование AI-моделей Meta NLLB для перевода, и OpenAI Whisper для распознавания речи вместо использования Google API;
  • добавлен классический режим перевода текста;
  • улучшен поиск устройств Bluetooth LE;
  • улучшена обработка отсутствующих TTS (преобразование текста в речь);
  • устранены некоторые ошибки.

>>> Подробности

★★★★★

Проверено: hobbit ()
Последнее исправление: hobbit (всего исправлений: 2)

Впервые написал новость со смартфона, и свой скриншот загрузить не удалось. Поэтому вот такой.

dataman ★★★★★
() автор топика

Хорошо переводит-то? Вообще хоть какой-то прогресс в этом плане есть в последнее время?

unDEFER ★★★★★
()
Ответ на: комментарий от unC0Rr

Там сложно: https://github.com/niedev/RTranslator/issues/34

Is it possible to add languages?

Using fine tuning yes, here is a tutorial.

I don’t know how long it would take since I’ve never done fine tuning (in the article it says that it takes about 24 hours of computing time, but it definitely takes more time to find the right data, set everything up and more).

For now though I’m avoiding fine tuning because I don’t think I’ll keep the NLLB models for too long, but as new translation models come out I’ll replace them.

However I’m thinking of adding more languages in the future ​​simply by separating the list of WalkieTalkie and Conversation languages ​​from the text translation ones (since for now the list of languages ​​is unique, so it only contains those compatible with both NLLB and Whisper).

Перевод сабжем:

Используя финальный настройка да, вот учебник. Я не знаю, сколько времени потребуется, так как я никогда не делал финальный настройка (в статье говорится, что это занимает около 24 часов вычислительного времени, но это определенно занимает больше времени, чтобы найти правильные данные, настроить все и многое другое). Однако я думаю добавить больше языков в будущем, просто разделяя список языков WalkieTalkie и Conversation от текстовых переводов (поскольку на данный момент список языков уникален, поэтому он содержит только те, которые совместимы с NLLB и Whisper).

dataman ★★★★★
() автор топика
Ответ на: комментарий от unDEFER

Хорошо переводит-то?

Удовлетворительно. :)

dataman ★★★★★
() автор топика
Ответ на: комментарий от dataman

Перевод говно, я думаю ты и сам понимаешь. Гугл переводчик работает куда лучше, там есть кнопка «микрофон» нажав на которую, он слушает речь и пишет перевод сразу. И работает на любом литералли на любом устройстве, а не 6+гб.

Еще одно доказательство, что нейронки в 2024 все еще говно, которое может только имитировать что-то, но не выполнять задачи.

artemlinux
()
Ответ на: комментарий от mydibyje

Я не проверял, но он вроде умеет в оффлайн перевод (но не голосовой конечно), но это неважно. В 2024 году интернет есть повсюду, бесплатные wifi и т.д. Если учесть, что нужна в переводчике скорее всего возникнет если я, например, буду в другой стране, то скорее всего у меня будет симкарта местного оператора, связь и интернет в телефоне один хрен нужны для навигации, мессенжеров и все такое. Например в Молдове, симкарту можно купить в любом киоске за 50 лей (примерно 2 бакса), там гигов 20 или уже даже больше дают (moldcell).

artemlinux
()
Ответ на: комментарий от artemlinux

Я понимаю, что мой ответ звучит в духе «проблемы гномеров, ставьте кде», но это так.

artemlinux
()

Автор добавил версию 2.0.2:

  • возможность использования любой установленной TTS;
  • теперь языки, не поддерживаемые текущей TTS, остаются доступными при переводе;
  • исправлена ошибка TTS для некоторых смартфонов.
dataman ★★★★★
() автор топика
Ответ на: комментарий от artemlinux

Гугл переводчик работает куда лучше

Еще одно доказательство, что нейронки в 2024 все еще говно

А в Гугле переводами занимаются 100500 переводчиков-людей?

dataman ★★★★★
() автор топика
Ответ на: комментарий от artemlinux

Как это не важно, когда это один из столпов философии ГНУ? Дело не столько в доступности интернета, а в самом Гугле, который может быть недоступен даже если интернет есть, а если и доступен то зачем давать ему доступ к вашей личной переписке?

mydibyje ★★★
()
Ответ на: комментарий от unDEFER

Хорошо переводит-то?

Классический тест циклического перевода (ru –> lng1 –> lng2 –> … –> ru) все переводчики не осиливают.

Вообще хоть какой-то прогресс в этом плане есть в последнее время?

Придумывают новые метрики качества машинного перевода 1, 2, 3
без ориентира в виде эталонного перевода, выполненного человеком.

quickquest ★★★★★
()
Ответ на: комментарий от I-Love-Microsoft

Оперативки?

Да, но могло быть и больше.

I converted both models to onnx format and quantized them in int8 (excluding some weights to ensure almost zero quality loss), also I separated some parts of the models to reduce RAM consumption (without this separation some weights were duplicated at runtime consuming more RAM than expected).

dataman ★★★★★
() автор топика
Ответ на: комментарий от artemlinux

Я не проверял
вроде умеет
но не голосовой
но это неважнo

:)

В 2024 году интернет есть повсюду

Повсюду, где он есть, да. :)

то скорее всего у меня будет

А не слишком ли много допущений, предположений, и прочего незнания?..

Somebody
()
Последнее исправление: Somebody (всего исправлений: 1)
Ответ на: комментарий от artemlinux

на любом литералли на любом устройстве, а не 6+гб.

В комментариях не нуждается. 2ч-ушки видны невооруженным взглядом

На любом литералли
На любом литералли
На любом литералли на любом
Литералли устройстве
serg002 ★★★
()
Последнее исправление: serg002 (всего исправлений: 1)
Ответ на: комментарий от serg002

Ты глупый, потому что всем известно, что ЛОР это тот же двач, мы с тобой в одном болоте варимся, а ты пытаешься потешить свое эго за мой счет.

artemlinux
()
Ответ на: комментарий от artemlinux

Это ты щас всех лоровцев оскорбил? Быстро сноси линукс, ставь винду и иди на свой двач. Фу прям!

hibou ★★★★★
()
Ответ на: комментарий от unC0Rr

Странно, что датский со шведским есть, а норвежского нет.

Их несколько штук, и носителей кратно меньше.

question4 ★★★★★
()

Классная вещь должна быть, но по-моему 6ГБ ОЗУ многовато вы не находите?

xwicked ★★☆
()
Ответ на: комментарий от avgust23

Т.е. туда встроены 2 нейросетки?

«У ей внутре неонка». (c)…

qwe ★★★
()
Ответ на: комментарий от qwe

Ещё был «Сократ», но про память уже не помню. :)

dataman ★★★★★
() автор топика
Ответ на: комментарий от artemlinux

Я не проверял, но он вроде умеет в оффлайн перевод

Не все языки поддерживаются оффлайн.

AP ★★★★★
()
Ответ на: комментарий от artemlinux

В 2024 году интернет есть повсюду, бесплатные wifi и т.д.

Дитя урбана во всей красе. Электрмчество далеко не везде, не говоря уже о проводной связи.

utanho ★★★★★
()
Ответ на: комментарий от dataman

Google офлайн-перевод:

Использование тонкой настройки Да, вот учебник. Я не знаю, сколько времени это займет, так как я никогда не делал точную настройку (в статье написано, что это занимает около 24 часов вычислительного времени, но для поиска нужных данных, настроить все и многое другое требуется больше времени). На данный момент я избегаю тонкой настройки, потому что не думаю, что буду держать модели NLLB слишком долго, но по мере поступления новых моделей перевода я заменю их. Однако я подумываю добавить больше языков в будущем, просто отделив список языков WalkieTalkie и бесед от текстовых переводов (поскольку список языков уникален, поэтому он содержит только те, которые совместимы как с NLLB, так и с Whisper).

Yandex офлайн-перевод:

Используя тонкую настройку да, вот учебник. Я не знаю, сколько времени потребуется, так как я никогда не делал тонкого настроения (в статье он говорит, что требуется около 24 часов вычисления времени, но это определенно требует больше времени, чтобы найти правильные данные, настроить все и многое другое). Пока я избегаю тонкого настроения, потому что я не думаю, что я буду держать модели NLB слишком долго, но, как новые модели перевода, я заменю их. Однако я думаю о добавлении большего количества языков в будущем просто разделяя список языков WalkieTalkie и языков разговоров из текстовых переводов (так как на данный момент список языков уникален, поэтому он содержит только те, совместимые с NLB и шепотом).

DeepL:

Использование тонкой настройки - да, вот учебник. Я не знаю, сколько времени это займет, поскольку никогда не занимался тонкой настройкой (в статье говорится, что это занимает около 24 часов вычислительного времени, но это определенно требует больше времени на поиск нужных данных, настройку всего и прочее). Пока что я избегаю тонкой настройки, потому что не думаю, что буду использовать модели NLLB слишком долго, но по мере появления новых моделей перевода я буду их заменять. Однако я думаю добавить больше языков в будущем, просто отделив список языков WalkieTalkie и Conversation от списка языков перевода текста (поскольку сейчас список языков уникален, и в нем только те, которые совместимы с NLLB и Whisper).

dataman ★★★★★
() автор топика
Ответ на: комментарий от Vudod

m-translate

Если это от Microsoft, то вот:

Использование тонкой настройки Да, вот учебник. Я не знаю, как долго это займет, поскольку я никогда не делал тонкой настройки (в этой статье говорится, что она занимает около 24 часов вычислительного времени, но это определенно занимает больше времени, чтобы найти правильные данные, установить все и многое другое). В настоящее время, хотя я избегая тонкой настройки, потому что я не думаю, что я буду держать NLLB моделей слишком долго, но, как новые модели перевода вышли я заменить их. Однако я думаю о добавлении нескольких языков в будущем, просто разделив список WalkieTalkie и разговорные языки от текста перевода из них (поскольку в настоящее время список языков является уникальным, поэтому он содержит только те, совместимые с обеих NLLB и Whisper)

dataman ★★★★★
() автор топика
Ответ на: комментарий от dataman

Вот не уверен. Я имел в виду вот этот: m-translate.com.ru Я им для перевода статей пользуюсь иногда, потому что он термины лучше берёт, чем Яндекс.

Vudod ★★★★★
()
Для того чтобы оставить комментарий войдите или зарегистрируйтесь.