Столкнулся с простой вроде бы задачей. У меня есть картинка с текстом, хотелось чтобы нейросетка написала возле каждого слова размер шрифта в пикселях. Они все отказываются. Несмотря на то что способны вынуть все слова и указать у каждого из них размер пикселях, но добавить ещё один слой с нужными обозначениями на картинку они не могут. Чем можно такое сделать автоматически?
ЗЫ. Нанобанана почти смогла.












