LINUX.ORG.RU

Велосипед (частотный анализ текста)

 ,


0

1

Отговорите от создания велосипеда. Пользователь выделяет текст, нажимает горячую клавишу, появляется pop-up с уникальными словами и их частотами. Полезно, например, для изучения языка и чтения текстов на оном. Есть ли готовые реализации, если нет, не ли бойцов, желающих принять учатие в разработке?

нет ли бойцов, желающих принять участие в разработке?

После 1991-го года мы все тойдарианцы («но деньги вперёд»).

Shushundr ★★★★★
()
Ответ на: комментарий от Shushundr

Барыги пытаются компенсировать запрещенный windows? А до 91 практиковалась цельнотянутость с богомерзких коммерческих юниксов?

anon1984
() автор топика
Последнее исправление: anon1984 (всего исправлений: 1)

не ли бойцов, желающих принять учатие в разработке?

Обязательно на сишке? Почему не расте? Это ведь работа с текстом, а значит юникод, эмодзи и прочая. Топик звучит, как задача на часик скриптописания в какой-нибудь приблуде для автоматизации типа AutoKey или AHK_11.

mydibyje ★★★★
()
Ответ на: комментарий от mydibyje

Люблю сишечку и GTK. Юникод есть в Glib, написать можно довольно быстро. Время старта - почти моментально.

anon1984
() автор топика

Подозреваю, что есть какой-нибудь готовый модуль для пайтона, потому что видела не меньше двадцати книжек про обработку текстов на пайтоне. Пайтон, пайтон, мой пайтон.

Irma ★★★
()

Отговорите

Не буду. Делой. На расте.

apt_install_lrzsz ★★★
()

Пользователь выделяет текст, нажимает горячую клавишу, появляется pop-up с уникальными словами

и сразу, слёту - каким таким образом по системному хот-кею, текст выделенный в неизвестном/произвольном прикладе попадёт в оный pop-up ?

после ответа на этот вопрос, можно писать на чём угодно. Причём C & gtk будет как из пушки по воробьям. На скриптоте быстрее и будет сразу ясно востребовано/нет, а может ну его нах :-)

MKuznetsov ★★★★★
()
Ответ на: комментарий от MKuznetsov

Из искового выделения. Вопрос в другом, запускать ли тулзу по хоткею, или пусть висит в трее как в windows.

anon1984
() автор топика
Последнее исправление: anon1984 (всего исправлений: 1)

Пока обсуждал, давно бы уже написал =)

  • Взять текст
  • Разбить на токены
  • Выкинуть дубли попутно их считая
  • Вывести что осталось с счётчиками сколько выкинул + 1
  • Всё :D
LINUX-ORG-RU ★★★★★
()

Отговариваю ( по твоей же просьбе ):

  1. Конечная реализация займет примерно 1 рабочий день, сама задача подсчета частоты слов часто встречается на собеседованиях, т.е. максимально простая.
  2. К изучению языков это все отношения не имеет, практического смысла - ноль. Чтобы в этом убедиться достаточно самостоятельно сделать симуляцию: ручками выделить и подсчитать.
alex0x08 ★★★
()

их частотами

Что за частоты у слов? Ка минимум у женского и мужского голоса частоты будут разными.

nvl ★★★★
()

Этот мир сошёл с ума! Нагруженные приложения пишут на скриптовых языках, а скриптовые задачи на Си!

ТС, открой для себя Tcl, например.

zx_gamer ★★★
()
6 октября 2023 г.
Ответ на: комментарий от zx_gamer

Довольно уродски вышло:

sed 's/.*/\L&/' | tr "   .,?:-" '\n' | sort | uniq -c | sort -n

anon1984
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.