LINUX.ORG.RU

Дублирующиеся теги

 , ,


5

8

Некоторые, наверное, уже заметили, что я начал войну с ветряными мельницами дублирующимися тегами. Извините, если вам вдруг придёт десяток уведомлений по какому-нибудь невезучему тегу. Не хочу повторить историю с cetjs2.
Кидайте в эту тему дублирующиеся теги, которые нужно почистить.
Например, были теги «параноя», «паранойа», «паранойя», остался только «паранойя», «rubyonrails» -> «ruby on rails» и т.д.

★★★★★

Так уже пофиксили. Уведомлений на древние треды не будет, а на новые и должны приходить. Не думаю, что кто-нибудь обидится.

vurdalak ★★★★★ ()

Кидайте в эту тему дублирующиеся теги, которые нужно почистить.

tags, теги, тэги

vurdalak ★★★★★ ()

А почему просто не сделать теги-синонимы?

serkhay ()
Ответ на: комментарий от serkhay

Это так же бесполезно, как «коррекция» тегов. Не спасает от появления новых и новых тегов в каждом треде.

vurdalak ★★★★★ ()

Кидайте в эту тему дублирующиеся теги, которые нужно почистить.

Открывай www.linux.org.ru/tags/ и просматривай все теги подряд.

i-rinat ★★★★★ ()
Ответ на: комментарий от talksonly

Там больше пяти тегов. Раньше ограничения на количество тегов не было, а теперь оно вряд ли сохранится.
UPD: а, не, всё хорошо.

CYB3R ★★★★★ ()
Последнее исправление: CYB3R (всего исправлений: 1)

что я начал войну с дублирующимися тегами.

Но зачем?

zorg ★★ ()

mlp, пони -> pony

P.S. И решите уже, на каком языке должны быть теги: anime, аниме.

aidan ★★★★ ()
Последнее исправление: aidan (всего исправлений: 1)

править прошлое - одно, а как предотвратить эту кашу в будущем?

dib2 ★★★★ ()

Кидайте в эту тему дублирующиеся теги, которые нужно почистить.

ебилд → ебилды
езернет → ethernet
електрика → электрика
ёмкость → емкость
dexpl ★★★★★ ()
Ответ на: комментарий от dexpl

ебилд, ебилды → ebuild
езернет → ethernet
електрика → электрика

Done.

CYB3R ★★★★★ ()
Ответ на: комментарий от CYB3R

Её больше нет. Плохой был тег.

То-то я смотрю и не вижу ни ёмкости, ни емкости :)
Благодарю.
dexpl ★★★★★ ()
Ответ на: комментарий от CYB3R

ебилд, ебилды → ebuild

Плохая, неправильная замена. «ебилд» это слово с оттенком юмора, а «ebuild» — просто техническое название, тег к треду с вопросом о написании ебилдов.

vurdalak ★★★★★ ()
Ответ на: комментарий от vurdalak

Учитывая, что в сумме теги «ебилд» и «ебилды» были использованы в четырёх тредах, ни в одном из которых я не уловил юмора, ты не прав.

CYB3R ★★★★★ ()
Ответ на: комментарий от CYB3R

Моя правота не зависит от того, где они были использованы.

vurdalak ★★★★★ ()
Ответ на: комментарий от vurdalak

Суть в том, что теги «ебилд» и «ебилды» синонимичны тегу «ebuild».

CYB3R ★★★★★ ()
Ответ на: комментарий от CYB3R

Синонимичны, но не равны. Это как «красный», «алый» и «кровавый».

vurdalak ★★★★★ ()
Ответ на: комментарий от vurdalak

все оттенки ебилдов ^^ а чего вы этим добиваетесь? дубли лучше?

talksonly ()

Добро пожаловать в реальный мир. Мы всего лишь пользователи. Я игнорю cetjs2. И это происходит уже очень давно.

ziemin ★★ ()

Вот еще:
«хочется странного» и «хочу странного»

qzxcvbnm ()
Ответ на: комментарий от qzxcvbnm

Done. Параллельно ещё слил «мобилы» в «мобильные телефоны».

CYB3R ★★★★★ ()
Ответ на: комментарий от CYB3R

«вакансии» и «вакансия»
«вахтерам» и «вахтеры» (?)

И целый список:
велогаджет (?)
велотред (?)
велосипед
велосипедизация на марше
велосипедисты
велосипедостроение
велосипедостроительство
велосипеды

qzxcvbnm ()

anonymos -> anonymous

anroid -> android

antialias -> antialiasing

aoe -> Age of Empires

0ad -> 0 a.d.

apache2 proxy -> 2 тега

arch glibc locale -> 3 тега

arch linux games -> 3 тега

arch pacman -> 2 тега

archlinux debian gentoo -> 3 тега

archlinux kernel linux -> 3 тега

archlinux wi-fi usb -> 3 тега

екб -> екатеринбург

жетский диск -> жесткий диск

жёсткий диск -> жесткий диск

загру -> /dev/null

выбрать из дублей:

arch, archlinux

аватары, аватарки, аватарка, аватар

задача, задачи, задачка

задолбало, задолбал, задолбали, задрало

Psych218 ★★★★★ ()
Последнее исправление: Psych218 (всего исправлений: 1)
Ответ на: комментарий от qzxcvbnm

Это, конечно, хороший список, но у меня уже рука устала. Нужно кастануть сюда ещё корректоров, которым нечего делать.

CYB3R ★★★★★ ()

столлманоугодничество, столманоугодность превратите в просто «столман»

Jopich ()
Ответ на: комментарий от CYB3R

А что в базе ЛОРа сделать order by религия не позволяет ?

Jopich ()
Ответ на: комментарий от Jopich

быдлокодер, быдлокодерство, быдлокодинг, быдлокод

Jopich ()
Ответ на: комментарий от Jopich

А ещё очень много дублирующихся тегов во множественном числе. Типа «ноутбук» и «ноутбуки».

CYB3R ★★★★★ ()

Уважаемые корректоры!

Если вам небезразлично безобразие, творящееся сейчас в тегах, приглашаю подписаться на этот тред и расставить теги по своим местам (естественно, на добровольной основе).
cast AP, lodin, shahid, shimon, Wizard_, INFOMAN, Binary, tazhate, Zhbert, unfo, DoctorSinus, Dmitry_Sokolowsky, cetjs2, CYB3R, ymn.

CYB3R ★★★★★ ()
Ответ на: Уважаемые корректоры! от CYB3R

Например, нужно оставить что-то одно из списка:

  • avatar
  • аватар
  • аватары
  • аватарки
  • аватарка

И оставшиеся четыре тега изменить на выбранный.

CYB3R ★★★★★ ()

Я вот что-то не понимаю, зачем столько кликать по темам и тыкать «редактировать» в куче разных мест, когда это правится одним запросом в СУБД на каждый тег. Ну, формочку можно нарисовать под это дело, раз прямого доступа к СУБД давать всем нельзя.

Wizard_ ★★★★★ ()
Ответ на: комментарий от Wizard_

Да, было бы классно разруливать подобное простым SQL-запросом, только кто же даст? Другое дело — сваять патчик, добавляющий соответствующий интерфейс для корректоров и модераторов. Но этим же нужно заниматься...

CYB3R ★★★★★ ()
Ответ на: комментарий от Wizard_

Наваял сейчас прекрасный пример, как не нужно писать однострочники:

curl -s www.linux.org.ru/tags | sed -e '1,/tags-first-letters/d' -e '/div/,$d' -e 's/^.\+>\([^.]\)<.\+$/www.linux.org.ru\/tags\/\1/g' | xargs -L1 curl -s | grep '<a href="/tag/' | sed -e 's/^.\+>\(.\+\)<.\+$/www.linux.org.ru\/tag\/\1/g' -e 's/ /%20/g' | xargs -L1 curl -vs 2>&1 | grep '> GET \|<title>\|Всего сообщений\|Кол-во пользователей, добавивших в избранное' | sed -e 's/^.\+>\(.\+\)<.\+$/\1/g' -e 's/^.\+: \(.\+\)<.\+$/\1/g' -e 's/> GET \(.\+\) HTTP\/1.1/\nhttp:\/\/www.linux.org.ru\1/g'
Выводит по четыре строки на каждый тег: линк, сам тег, количество наблюдающих и количество сообщений. Можно вывод в виде таблицы оформлять, а потом сортировать, как угодно.
Парсить HTML регулярками плохо, потому однострочник может внезапно сломаться.

CYB3R ★★★★★ ()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)