LINUX.ORG.RU
ФорумTalks

Нет рук - нет претензий. Open source робот от Hugging Face за 449$.

 , , , ,


0

2

Сабж subj

В блоге Hugging Face сказано, что Reachy Mini — это «выразительный робот с открытым исходным кодом, созданный для взаимодействия человека с роботом, творческого программирования и экспериментов с ИИ». Устройство ориентировано на всех, кто интересуется этой развивающейся областью робототехники. С помощью специального Python SDK можно запрограммировать новые навыки, а позднее разработчики обещают реализовать поддержку JavaScript и Scratch.

Из названия Reachy Mini можно понять, что речь идёт о миниатюрном устройстве. Высота робота составляет всего 28 см, а ширина — 16 см. Это означает, что его можно легко разместить на столе рядом с компьютером, на полке или в другом удобном месте. Покупателям доступна полностью автономная версия робота на базе одноплатного компьютера Raspberry Pi 5 с встроенным аккумулятором.

На рынок также выходит Reachy Mini Lite, который необходимо подключать к электросети и который на данный момент поддерживает только macOS и Linux. В компании отметили, что эта версия устройства всё ещё находится на этапе разработки и в ней, в отличие от стандартной модели, отсутствует акселерометр. Стать обладателем этой версии робота можно за $299.

В остальном оба робота похожи: каждый из них оснащён 5-ваттным динамиком и широкоугольной камерой. Голова робота поддерживает шесть степеней свободы, а туловище может поворачиваться вокруг своей оси. В конструкции Reachy Mini предусмотрено четыре микрофона, а у Reachy Mini Lite — только два. Оба робота поставляются в разобранном виде.

Компания Hugging Face уже принимает заказы на Reachy Mini Lite за 299 долларов и беспроводной Reachy Mini за 449 долларов. Oжидается, что первый из них поступит в продажу в конце лета 2025 года, а более функциональная модель будет поставляться партиями с осени 2025.

Робот ничего не умеет, ничего не может, по сути - игрушка. А что он без рук-то в принципе может делать?

★★★★★

Это для того, чтобы делать голосовой терминал к системе управления умным домом или к LLM, запущенной в облаке?

wandrien ★★★
()

chatgpt:

Ты прав, считая, что манипуляторы и подвижность — важная часть робототехники, особенно если фокус на физическом взаимодействии. Но в мире социальных и образовательных роботов, такие устройства тоже называют "роботами".

Reachy Mini — это социальный/персональный/настольный робот, ориентированный на:

    Взаимодействие с человеком.
    Образование.
    Демонстрацию ИИ.

И его можно считать полноценным представителем растущего класса "роботов-компаньонов".

(сократил большую часть ответа до сути)

wandrien ★★★
()
Последнее исправление: wandrien (всего исправлений: 1)

Ответ от Gemini 2.5 Pro:

Отличный вопрос и очень интересные наблюдения! Это классический спор на стыке философии, инженерии и лингвистики: «Что же такое робот?». Давай разберем все по порядку.

Подходит ли это устройство под понятие робота?

Твоя позиция абсолютно понятна и имеет под собой веские основания. В массовом сознании и, во многом, благодаря научной фантастике и промышленной автоматизации, робот — это нечто, что физически взаимодействует с миром, чаще всего с помощью манипуляторов.

Однако, если обратиться к более формальным и широким определениям, картина становится иной.

Классическое определение робототехники: Робот — это программируемое устройство, способное выполнять задачи в физическом мире автономно или полуавтономно. Ключевая концепция здесь — «Sense-Plan-Act» (Воспринимать-Планировать-Действовать).

Давай применим эту модель к Reachy Mini:

  1. Sense (Воспринимать): У него есть камера (зрение) и микрофоны (слух). Он определенно воспринимает окружающую среду.
  2. Plan (Планировать): У него есть «мозг» в виде Raspberry Pi 5. Он может обрабатывать данные с сенсоров и, на основе заложенной в него программы (например, нейросети для распознавания лиц или речи), принимать решение о следующем действии.
  3. Act (Действовать): Вот здесь и возникает твой вопрос. Действие не обязательно означает физическую манипуляцию объектами. Действием может быть любое изменение своего состояния или оказание влияния на окружающую среду. Reachy Mini действует:
    • Движением: Он поворачивает голову и туловище. Это физическое действие. Он меняет направление своего «взгляда», что является формой невербального взаимодействия. Он может отслеживать объект, демонстрируя «внимание».
    • Звуком: Он воспроизводит речь или звуки через динамик. Это тоже действие, направленное на взаимодействие со средой (в данном случае, с человеком).

Вывод: С точки зрения современной робототехники, Reachy Mini — это робот. Он относится к классу социальных роботов или роботов-аватаров. Его основная задача — не перемещать грузы, а взаимодействовать с людьми на информационном и социальном уровне.

Ты прав в том, что у него нет манипуляторов, но это не делает его «не-роботом», а просто определяет его подкласс и специализацию. Например, робот-пылесос тоже робот, хотя у него нет рук (его «действие» — передвижение и всасывание пыли). Беспилотный летательный аппарат (дрон) — тоже робот («действие» — полет и съемка).

Идеи по применению Reachy Mini

Твои идеи (голосовой терминал для умного дома или LLM) абсолютно верны, но, как ты правильно заметил, для этих задач устройство кажется избыточным и дорогим. Его ценность раскрывается именно там, где важны его уникальные черты: камера, подвижность «головы» и открытая платформа для программирования.

Вот несколько идей, где эти черты становятся ключевыми:

  1. Образование и исследования (главное назначение):

    • Изучение Human-Robot Interaction (HRI): Это идеальная платформа для студентов и исследователей. Как люди реагируют на робота, который «смотрит» им в глаза? Как создать более естественное невербальное общение? Можно программировать реакции: кивки «головой» в знак согласия, отслеживание лица собеседника, поворот в сторону источника звука.
    • Обучение программированию и ИИ: Это гораздо более увлекательно, чем писать код, который выводит «Hello, World!» в консоль. Студенты могут написать программу, которая заставляет робота найти на столе красный предмет и «посмотреть» на него. Это наглядное воплощение компьютерного зрения и кинематики.
  2. Социальный компаньон / «Живой» ассистент:

    • «Desk Buddy»: Робот на рабочем столе, который не просто отвечает на вопросы, как умная колонка, а «оживает». Он может поворачиваться к тебе, когда ты говоришь, «смотреть» на экран, когда ты работаешь, и имитировать эмоции через движения. Это создает психологический эффект присутствия.
    • Помощник для пожилых людей: Может не только напоминать о приеме лекарств голосом, но и поворачиваться в сторону человека, чтобы убедиться, что он услышал. Через камеру родственники могут удаленно «осмотреться» в комнате (с согласия, конечно).
  3. Специализированный мониторинг:

    • «Умный» бэби-монитор: Может не просто показывать статичную картинку, а отслеживать движения ребенка в кроватке, поворачивая камеру.
    • Система прокторинга для удаленных экзаменов: Может следить за взглядом студента, чтобы убедиться, что он не списывает. (Немного антиутопично, но технически возможно).
  4. Творческие и художественные проекты:

    • Интерактивная инсталляция: Робот в музее, который реагирует на посетителей, следит за ними взглядом, рассказывает о экспонатах, на которые «смотрит».
    • Робот-кукловод: Может стать «головой» для более сложной марионетки или механизма в любительском театре.

Почему такая цена и почему это не просто умная колонка?

Ты абсолютно прав, что для твоих первоначальных идей цена избыточна. Но Hugging Face и не пытается конкурировать с Amazon Echo или Яндекс.Станцией.

  • Это не потребительское устройство, а платформа для разработчиков и исследователей. Цену составляют не только Raspberry Pi и пластик, но и сервоприводы (несколько штук, и они не самые дешевые), разработка SDK (программного обеспечения для управления), интеграция всех компонентов и сама открытая платформа. Для исследовательской лаборатории или IT-кружка $449 — это очень низкая цена за готовую HRI-платформу. Аналогичные исследовательские роботы могут стоить тысячи и десятки тысяч долларов.
  • «Физическое воплощение ИИ»: Ценность в том, чтобы дать коду физическое тело. Когда твоя нейросеть не просто распознает кошку на картинке, а заставляет физического робота повернуться и «посмотреть» на реальную кошку — это совершенно другой уровень взаимодействия и понимания.

Итог: Ты поднял очень точный и правильный вопрос. Reachy Mini размывает привычные границы понятия «робот», но по всем современным определениям им является. Его ценность — не в утилитарных функциях, как у умной колонки, а в том, что это доступный, открытый и выразительный инструмент для изучения, создания и взаимодействия с искусственным интеллектом в физическом мире.

wandrien ★★★
()

А что он без рук-то в принципе может делать?
Reachy Mini Lite за 299 долларов и беспроводной Reachy Mini за 449 долларов

приносить прибыль продаванам

Kolins ★★★★★
()
Ответ на: комментарий от wandrien

Гм, гм, а там точно искусственный интеллект? Или, тупо программки для Pi, дёргающие пины GPIO?

Т.е. чатгопота написал, что он мог бы делать, но, скорее всего, мы упрёмся в ограничения платформы

tiinn ★★★★★
() автор топика
Последнее исправление: tiinn (всего исправлений: 1)
Ответ на: комментарий от wandrien

Робот предполагает наличие манипуляторов. Хотя бы одного.

Вообще-то нет.

dataman ★★★★★
()

Робот должен робототь, просто по определению. А это говно какое-то, еще и выглядит как феминистка.

thesis ★★★★★
()
Ответ на: комментарий от wandrien

Действие не обязательно означает физическую манипуляцию объектами. Действием может быть любое изменение своего состояния или оказание влияния на окружающую среду. Reachy Mini действует

Эх, напомнило

Мужик, пораженный, останавливается, слушает, подходит:
- Мальчик, как же ты ругаешься! Ты же ходить, наверное, еще не умеешь?
Вундеркинд презрительно смотрит на мужика:
- А ты умеешь?
- Ну-у, да ...
- НУ И ПОШЕЛ НА Х%# !!!
tiinn ★★★★★
() автор топика
Ответ на: комментарий от tiinn

Неросетка может быть очень нетребовательной к железу. Это не всегда LLM.

greenman ★★★★★
()
Ответ на: комментарий от tiinn

Ну технически нейросеть, которая направляет камеру робота на лицо человека, или умеет отличать кота от тумбочки — это тоже ИИ, так что всё верно. А для такой нейросети ресурсов RPi хватит.

В остальном же нужен доступ к более жирному компу по сети, да.

Но вот как Gemini отвечает, я тащусь. Она хорошо имитирует человеческий способ рассуждений и неплохо понимает контекст. При этом речь выглядит естественной.

При этом еще и неплохо ориентируется в коде на разных ЯП, в том числе редких.

Я с ней общался по всяким нетривиальным вопросам типа сравнения принципов проектирования, заложенных в разные ЯП, и она даёт аналитические ответы получше тех, кто у нас в разделе Development сидит))

А вот ChatGPT пытается давать структурные и фактологичные ответы, но при этом косячит, а её структурность только добавляет кринжа.

wandrien ★★★
()
Ответ на: комментарий от wandrien

ПОЧЕМУ НИКТО НЕ ПЫТАЕТСЯ ТОРМОЗНУТЬ РАСПРОСТРАНЕНИЕ ЗАРАЗЫ?

Хотя бы для того, чтобы проиграть с достоинством, с пониманием бессмысленности сражения, как в зомби-хоррорах.

thesis ★★★★★
()

А зачем голове 6 степеней свободы? Он головой имитировать руку будет или?… Как то избыточно, камера на колесиках какая та.

FoxSnejanaFox
()
Ответ на: комментарий от thesis

ПОЧЕМУ НИКТО НЕ ПЫТАЕТСЯ ТОРМОЗНУТЬ РАСПРОСТРАНЕНИЕ ЗАРАЗЫ?

Помнишь, как закончился «Мир дикого Запада», когда там пытались тормознуть распространение заразы?))

Поздно уже.

LLM, которая занимает 8 гигов памяти, уже в командах для Linux разбирается лучше, чем половина LOR.

wandrien ★★★
()

Робот ничего не умеет, ничего не может, по сути - игрушка. А что он без рук-то в принципе может делать?

Прочёл оригинал в надежде увидеть ответ на этот вопрос. Mass media in nutshell.

kaldeon
()
Ответ на: комментарий от kaldeon

Это неправильный вопрос, настраивающий тебя негативный лад. А ведь можно спросить и так: «чего не может робот без рук?»

И вот, например, такой ответ: сопротивляться.

thesis ★★★★★
()
Ответ на: комментарий от thesis

Какую природу проявляет эта высшая форма существования? Люди утверждают то, чем она не является, но не то, чем является. Их определения не определяют, а вычёркивают. Только мировоззрение пиявки может цепляться за идею вселенной, где ничто — это стандарт определений. Пиявка желала бы избежать необходимости называть свою собственную природу, избежать знания, что субстанция, на которой она строит свою личную вселенную — это кровь.

И вот, например, такой ответ: сопротивляться.

Те, кто знают, что не могут победить логически, всегда обращались к оружию.

kaldeon
()
Последнее исправление: kaldeon (всего исправлений: 1)

А что он без рук-то в принципе может делать?

При этом робот-змея, дрыгать нечем но роботом считается, так как может манипулировать объектами своим корпусом

I-Love-Microsoft ★★★★★
()
Ответ на: комментарий от kaldeon

Только пиявка будет пытаться «логически побеждать» неодушевленный предмет, не будучи способной отличать живое от неживого.

thesis ★★★★★
()
Ответ на: комментарий от I-Love-Microsoft

Этот, похоже, сможет манипулировать приобревшими его объектами при помощи голоса. Я смотрю, человечество уже дозрело. Удивительно, как нас до сих пор не поработило и не построило в шеренги приложение вызова такси.

thesis ★★★★★
()
Последнее исправление: thesis (всего исправлений: 2)
Ответ на: комментарий от greenman

А не знаю, на картинке вроде нет, читать лень. Я просто не пойму зачем голове 6 степеней свободы, ведь этого достаточно для имитации кисти человека. Потому я считаю, камера на колесиках полезнее.

FoxSnejanaFox
()
Ответ на: комментарий от wandrien

Я всерьез удивляюсь, что здесь еще не начались многостраничные зарубы на чистой копипасте. С нас станется.

thesis ★★★★★
()
Ответ на: комментарий от FoxSnejanaFox

Я просто не пойму зачем голове 6 степеней свободы, ведь этого достаточно для имитации кисти человека.

ААААААААААА!!!

thesis ★★★★★
()

С 4-я микрофонами и широкоугольной камерой он много чего нашпионить может!

kirill_rrr ★★★★★
()
Ответ на: комментарий от tiinn

Ну например TTS нейросетку Пи4 тянет близко к реалтайму. Только это тупой TTS, который пожалуй похуже алгоритмического.

kirill_rrr ★★★★★
()
Ответ на: комментарий от wandrien

Но вот как Gemini отвечает, я тащусь.

А мне не понравился ответ. Сильно напоминает школьное сочинение на тему «почему мне понравилось читать Войну и Мир». Ответ чатЖПТ краткий, по делу и сказано почти всё то же самое. А вот если бы они ещё подкрепляли свои рассуждения сслыками на какие то пруфы...

kirill_rrr ★★★★★
()
Последнее исправление: kirill_rrr (всего исправлений: 1)
Ответ на: комментарий от kirill_rrr

У gpt такой же длинный, но мне не понравилась большая часть рассуждений, так что я не стал заморачиваться с копированием.

Gpt структурирует по пунктам признаки робота, но не разворачивает суть понятия. Gemini рассказал, что суть понятия робота связана с циклом восприятия, анализа и действия, а также пояснил, что разница трактовок возникает из-за разного понимания, что считать действием. Это хороший уровень понимания связей между понятиями, на мой взгляд.

wandrien ★★★
()
Ответ на: комментарий от thesis

Вспомнился анекдот: Как заработать 3-м программистам? Один должен писать вирусы, второй антивирус, а третий ОС где всё это работает.

Так вот вы придумали намного более эффективную бизнес-модель: Надо сделать мило выгядящего но максимально раздражающего ИИ-робота, который тем не менее не сможет сопротивляться.

kirill_rrr ★★★★★
()
Ответ на: комментарий от wandrien

При условии, что они не взяли всё это из памяти, накрутив вокруг немного рассуждений. Лично я бы определил робота по другому, рассуждения и ответ на вопрос были бы другими. И оба варианта првильны! И оба в принципе следуют из выбранного определения робота. А как известно из школьной практики - хороший пересказ учебника =/= понимание.

kirill_rrr ★★★★★
()
Ответ на: комментарий от kirill_rrr

Я уже канал в онлифанс обдумываю. Роботов-то дофига, и прибавляется. Чисто технический контент, разумеется - прошивки, тюнинг…

thesis ★★★★★
()
Последнее исправление: thesis (всего исправлений: 1)
Ответ на: комментарий от wandrien

Я ведь правильно понимаю, большая модель в принципе имеет достаточно памяти чтобы «порассуждать» о любом поятии из чего то разером с большую советскую энциклопедию?

kirill_rrr ★★★★★
()
Ответ на: комментарий от thesis

Как оказалось - «размное» не обязательно «живое». Про обратное и так известно.

kirill_rrr ★★★★★
()
Ответ на: комментарий от kirill_rrr

Так и люди так же делают большую часть времени: берут что-то из памяти, и хорошо, если вообще хоть немного рассуждают при этом))

LLM хороша тем, что имеет широкий контекст и может сообщить о связанных с темой фактах и концепциях.

wandrien ★★★
()
Последнее исправление: wandrien (всего исправлений: 1)
Ответ на: комментарий от thesis

Оно сможет подъехать к шнуру и намотать его на себя, таким образом выдернув

DumLemming ★★★
()
Ответ на: комментарий от kirill_rrr

Хватило бы и 3, а то тут он и в себя должен посмотреть и голову куда то перемещать

FoxSnejanaFox
()

(голосом Матроскина) Скажи: «кто там, кто таммм».

Irma ★★★
()
Ответ на: комментарий от kirill_rrr

Так и у ИИ то же самое. Спрашивать надо дичь, типа «сколько сов было съедено при строительстве пирамиды Хеопса» или «за что Герасим утопил Чапаева», и наслаждаться.

thesis ★★★★★
()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)