LINUX.ORG.RU

Велосипед (частотный анализ текста)

 ,


0

1

Отговорите от создания велосипеда. Пользователь выделяет текст, нажимает горячую клавишу, появляется pop-up с уникальными словами и их частотами. Полезно, например, для изучения языка и чтения текстов на оном. Есть ли готовые реализации, если нет, не ли бойцов, желающих принять учатие в разработке?

Ответ на: комментарий от Shushundr

Барыги пытаются компенсировать запрещенный windows? А до 91 практиковалась цельнотянутость с богомерзких коммерческих юниксов?

anon1984
() автор топика
Последнее исправление: anon1984 (всего исправлений: 1)

не ли бойцов, желающих принять учатие в разработке?

Обязательно на сишке? Почему не расте? Это ведь работа с текстом, а значит юникод, эмодзи и прочая. Топик звучит, как задача на часик скриптописания в какой-нибудь приблуде для автоматизации типа AutoKey или AHK_11.

mydibyje ★★★
()

Подозреваю, что есть какой-нибудь готовый модуль для пайтона, потому что видела не меньше двадцати книжек про обработку текстов на пайтоне. Пайтон, пайтон, мой пайтон.

Irma ★★
()

Пользователь выделяет текст, нажимает горячую клавишу, появляется pop-up с уникальными словами

и сразу, слёту - каким таким образом по системному хот-кею, текст выделенный в неизвестном/произвольном прикладе попадёт в оный pop-up ?

после ответа на этот вопрос, можно писать на чём угодно. Причём C & gtk будет как из пушки по воробьям. На скриптоте быстрее и будет сразу ясно востребовано/нет, а может ну его нах :-)

MKuznetsov ★★★★★
()

Пока обсуждал, давно бы уже написал =)

  • Взять текст
  • Разбить на токены
  • Выкинуть дубли попутно их считая
  • Вывести что осталось с счётчиками сколько выкинул + 1
  • Всё :D
LINUX-ORG-RU ★★★★★
()

Отговариваю ( по твоей же просьбе ):

  1. Конечная реализация займет примерно 1 рабочий день, сама задача подсчета частоты слов часто встречается на собеседованиях, т.е. максимально простая.
  2. К изучению языков это все отношения не имеет, практического смысла - ноль. Чтобы в этом убедиться достаточно самостоятельно сделать симуляцию: ручками выделить и подсчитать.
alex0x08 ★★★
()
6 октября 2023 г.