fselect 0.9.1

find, fselect, rust, sql, от автора

fselect — это консольная утилита для поиска файлов с помощью выражений, напоминающих SQL. В некоторых случаях может заменить традиционный find и написание развесистых скриптов с его использованием.

Преимущества:

возможность создания сложных запросов с помощью скобок и операторов SQL
использование подзапросов для поиска и сравнения результатов сразу в нескольких директориях
множество функций (агрегации, статистические, работа с датой и временем и т.д.), заимствованных из SQL
поиск внутри zip-архивов
поиск с учетом .gitignore
поиск по ширине/высоте изображений, метаданных EXIF
поиск по метаданным MP3-файлов
поддержка расширенных файловых атрибутов в Linux
поиск по хэшам содержимого файлов
интерактивный режим
форматирование вывода в CSV, JSON и null-terminated строки

Релиз 0.9.1 ознаменовался расширенной поддержкой подзапросов в операторах IN и EXISTS. Таким образом, теперь стало возможным искать файлы и сравнивать результаты поиска сразу в нескольких директориях.

Пример запроса (поиск файлов формата Markdown из директории content, для которых не были сгенерированы соответствующие HTML-файлы в директории public):

SELECT path
  FROM /content AS content
 WHERE NOT EXISTS (
       SELECT * FROM /public AS public
       WHERE public.dir = content.dir AND public.name = CONCAT(content.filename, '.html')) 
   AND name = '*.md'

>>> Репозиторий проекта на GitHub

Ссылка

← Ubuntu 25.10: обнаружена уязвимость в sudo-rs

Выпуск свободной платёжной системы GNU Taler 1.1 →

поиск файлов формата Markdown из директории content, для которых не были сгенерированы соответствующие HTML-файлы в директории public

Попробовал решить эту задачу стандартными утилитами и получилось довольно многословно и развесисто. Корректность не проверял.

comm -23 \
   <{
      find content -type f |
      grep '\.md$' |
      sed 's!^[^/]*!!' |
      sort
   } \
   <{
      find public -type f |
      sed -n '/\.md\.html$/ s/.....$//p' |
      sed 's!^[^/]*!!' |
      sort
   } |
sed 's!^!content/!'

kaldeon ★★
(16.11.25 01:19:44 MSK)

Ответ на: комментарий от kaldeon 16.11.25 01:19:44 MSK

Ии выдал такое :)

comm -23 \
  <(find content -name "*.md" | sed 's|^content/||; s|\.md$|.html|' | sort) \
  <(find public -name "*.html" | sed 's|^public/||' | sort) | \
  sed 's|\.html$|.md|'

И много других вариантов. :)))

pethead
(16.11.25 10:05:31 MSK)

Ссылка

Навело на мыслю, а знает ли кто о проектах ФС, устроенной внутри как реляционная БД, представляющей иноды и иерархию как view, причем представимая и как объектное хранилище с тэгами, где классическая иерархия вторична, как в BTRON.

Хотя хз зачем это нужно, когда можно написать скрипт на tcl, складывающий информацию о файлах и директориях в sqlite в удобном виде, а там селектить не переселектить.

lealxe ★
(16.11.25 10:30:50 MSK)

Не каноничная новость, где в тексте указание, что утилита написана на расте? Чо как не растоман?)

ptah_alexs ★★★★★
(16.11.25 11:13:25 MSK)

Ответ на: комментарий от ptah_alexs 16.11.25 11:13:25 MSK

Он в тегах указал, заинтересованные уже оповещены

irton ★★★★★
(16.11.25 11:16:22 MSK)

Ссылка

Ответ на: комментарий от lealxe 16.11.25 10:30:50 MSK

WinFS, наверно.

unC0Rr ★★★★★
(16.11.25 11:43:52 MSK)

Ссылка

Ответ на: комментарий от lealxe 16.11.25 10:30:50 MSK

https://github.com/yoogottamk/sqlfs

Pinkbyte ★★★★★
(16.11.25 12:15:00 MSK)

Ссылка

И там, и там выглядит вырвиглазно. Иногда хочется просто быстрый интерактивный поиск, как в эксплорере. Для этого, конечно, нужны индексирующие службы, как в грамотно спроектированной десктопной системе.

seiken ★★★★★
(16.11.25 13:14:37 MSK)

А если таки нужна автоматизация, проще скрипт на питоне написать. Ещё и кроссплатформенно будет, а не эти юникс-вей портянки с седами.

seiken ★★★★★
(16.11.25 13:21:12 MSK)
Последнее исправление: seiken 16.11.25 13:26:47 MSK (всего исправлений: 1)

Ссылка

Меня больше интересует, почему на твоей аватарке 12.5 байт?

mord0d ★★★★★
(16.11.25 13:28:07 MSK)

Ответ на: комментарий от seiken 16.11.25 13:14:37 MSK

А про канонічный locate все благополучно забыли?

Не нужны для этого никакие "десктопные системы".

mord0d ★★★★★
(16.11.25 13:29:21 MSK)

Ответ на: комментарий от mord0d 16.11.25 13:29:21 MSK

Не нужны для этого никакие «десктопные системы».

Тебе не нужны, а 99% пользователей нужны.

seiken ★★★★★
(16.11.25 13:31:20 MSK)

Ответ на: комментарий от ptah_alexs 16.11.25 11:13:25 MSK

Он её начал писать когда ещё раст не пытались везде насильно присунуть (первая новость в 2018 году на лоре), так что выбор языка был не по фанатским причинам скорее всего.

firkax ★★★★★
(16.11.25 13:39:38 MSK)

Ссылка

Ответ на: комментарий от kaldeon 16.11.25 01:19:44 MSK

Не, надо модно-молодёжно:

mapfile -t md < <(basename -a content/*.md);\
mapfile -t htm < <(basename -a public/*.html);\
for f in "${md[@]}"; do
[[ ${htm[@]} == *${f%.*}* ]] || echo $f; done

🙂

papin-aziat ★★★★★
(16.11.25 13:40:49 MSK)

Ссылка

Это все примеры, а юзкейс-то какой? Пока все это выглядит как вещь в себе.

С поиском по содержимому неплохо gtags/global справляется, поиск по хэшам содержимого даже и не знаю кому кроме гита нужно, дубликаты файлов в разных местах редко когда нужно искать и, скорее всего, на хардлинки нарвёшься :)

gns ★★★★★
(16.11.25 14:57:41 MSK)

Ссылка

Ответ на: комментарий от seiken 16.11.25 13:31:20 MSK

Ну десктопные системы такое внутри себя хранят, выдавать «пользователям десктопа» такой интерфейс поиска, — так только над ними издеваться.

gns ★★★★★
(16.11.25 14:59:12 MSK)

Ссылка

Ответ на: комментарий от lealxe 16.11.25 10:30:50 MSK

Какое-то время назад я положил один git сервер, далее будет понятно чьей разработки, который внутри из себя представлял MSSQL кринж данных.

Всего-то надо было залить туда репозиторий на десять гигов.

a1ba ★★★★
(16.11.25 17:10:09 MSK)

Ссылка

Ответ на: комментарий от kaldeon 16.11.25 01:19:44 MSK

Решить стандартными утилитами это воспользоваться make, вот решение от чатгпт:

# директории
CONTENT_DIR := content
PUBLIC_DIR  := public

# все markdown-файлы
MD_FILES := $(wildcard $(CONTENT_DIR)/*.md)

# соответствующие html-файлы
HTML_FILES := $(patsubst $(CONTENT_DIR)/%.md,$(PUBLIC_DIR)/%.html,$(MD_FILES))

# цель по умолчанию — сгенерировать недостающие HTML
all: $(HTML_FILES)

# правило генерации html из md
$(PUBLIC_DIR)/%.html: $(CONTENT_DIR)/%.md
	@mkdir -p $(PUBLIC_DIR)
	@echo "Generating $@ from $<"
	# 👉 здесь можно поставить свою команду:
	pandoc $< -o $@

# удобная цель для проверки
missing:
	@echo "Missing HTML files:"
	@for html in $(HTML_FILES); do \
		if [ ! -f $$html ]; then echo $$html; fi; \
	done

.PHONY: all missing

necromant ★★★
(16.11.25 18:22:46 MSK)

оно реально лучше чем updatedb/locate ?

splinter ★★★★★
(17.11.25 09:17:38 MSK)

Ссылка

Ответ на: комментарий от necromant 16.11.25 18:22:46 MSK

Для одноразовой операции make не пишут. И в этом решении не учитываются вложенные директории.

kaldeon ★★
(17.11.25 11:31:25 MSK)

Ссылка

Ответ на: комментарий от kaldeon 16.11.25 01:19:44 MSK

Слишком много вызовов sed/grep, можно проще:

find ./content -type f -name '*.md' -printf '%f\n' | sort | comm -23 - <(find ./public -type f -name '*.md.html' -exec basename -a -s .html {} + | sort) | sed 's,^,./content/,'

juan-pablo-segundo
(18.11.25 06:24:53 MSK)

Ответ на: комментарий от juan-pablo-segundo 18.11.25 06:24:53 MSK

А можете такое «ls», которое бы примерно такое:

$ superls . --with_content_details

dir1 (folders: 2, files: 222)
dir2 (folders: 0, files: 1)
dir3 (folders: 33, files: 0)
file1 (size: 1MB)
file2 (size: 111B)

Toxo2 ★★★★★
(18.11.25 07:01:27 MSK)

Чёрт, а я то ж самое на сях пишу, ток назвал fql

PPP328 ★★★★★
(18.11.25 07:57:13 MSK)

Ответ на: комментарий от Toxo2 18.11.25 07:01:27 MSK

За деньги да)

Тут уже не так просто, придется использовать awk

find . -printf '%d %y %s %p\n' | awk -f superls.awk

Значимые пробелы только в строках и после function, остальные для читаемости

function newdir(d){
    if(dir){
        printf("%s (folders: %d, files: %d)\n", dir, dirs, files)
    }
    dir=d
    dirs=0
    files=0
}
$1~0 {next}
$1~1 && $2~"d" {newdir($4)}
$1~1 && $2~"f" {
    newdir(0)
    printf("%s (size: %d)\n", $4, $3)
}
$2~"d" {dirs++}
$2~"f" {files++}

juan-pablo-segundo
(18.11.25 08:44:00 MSK)
Последнее исправление: juan-pablo-segundo 18.11.25 08:44:57 MSK (всего исправлений: 1)

Ссылка

AND name = ‘*.md’

Вообще по правилам SQL тут должно быть like ‘%.md’

PPP328 ★★★★★
(18.11.25 12:52:01 MSK)

Ссылка

Ответ на: комментарий от mord0d 16.11.25 13:28:07 MSK

хороший вопрос. попробовал декодировать, получилось: I Y ' i ^ N

flant ★★★★
(18.11.25 13:00:08 MSK)

Ответ на: комментарий от flant 18.11.25 13:00:08 MSK

попробовал декодировать

Там и без попыток видно, что в виде текста это мусор. Двенадцать с половиной байт как бы намекает что это что-то бинарное. (=

mord0d ★★★★★
(18.11.25 21:09:34 MSK)

Ссылка

Ответ на: комментарий от juan-pablo-segundo 18.11.25 06:24:53 MSK

grep в первом <{} и sed во втором можно объединить. Достоинство (хотя для кого-то недостаток) моего решения в том, что оно полностью основано на обработке текста, чего нельзя сказать даже про find: -name '*.md' применяется только к файлам.

kaldeon ★★
(19.11.25 06:51:16 MSK)

Ссылка

Ответ на: комментарий от lealxe 16.11.25 10:30:50 MSK

знает ли кто о проектах ФС, устроенной внутри как реляционная БД,

Какую проблему должна решать подобная ФС?

Psilocybe ★★★★★
(19.11.25 07:26:15 MSK)

Ответ на: комментарий от Psilocybe 19.11.25 07:26:15 MSK

Не знаю. Объекты по тэгам доставать должно быть удобно. Индексы делать по желанию. Версии. Отображения.

lealxe ★
(19.11.25 08:33:28 MSK)

Ссылка

Ответ на: комментарий от PPP328 18.11.25 07:57:13 MSK

на сях пишу, ток назвал fql

Занято! :-D

https://github.com/dccmx/fql:

fql is a tool that use SQL like query to manipulate files.

fql "select time, size, name from ../"
fql "select time, size, name from abc -r"  # scan abc recursivly
fql "select * where name = fql.cc"
fql "select * where not name = fql.cc"
fql "select time, size, name from . where size > 2.5k and size < 3k order by size desc"
echo "select * from . " | fql
or run fql to query intractivly

dataman ★★★★★
(19.11.25 11:25:27 MSK)