LINUX.ORG.RU

Новый сайт о пакетах OpenBSD — ports.su

 ,


0

1

Несколько лет назад появился первый сайт о пакетах OpenBSD — ports.openbsd.nu, ныне известный как OpenPorts.se. У OpenPorts.se есть одна проблема: поиск очень часто не выдаёт никаких результатов (т.к. по-умолчанию идёт исключительно по названию пакетов, не включая описания), а поиск через все поисковые системы заблокирован через robots.txt.

Представляем вашему вниманию ports.su. Проект является статическим сайтом на базе ports-readmes, и, в отличии от OpenPorts.se, обладает полнотекстовым поиском через Google (проиндексированы почти все 8 тыс страниц). Так как используются оригинальные интерпретаторы и официальная база данных OpenBSD ports тов. Marc Espie — sqlports — то у ports.su отсутствуют ошибки интерпретации, и каждый пакет может быть представлен сразу в нескольких категориях, и дополнительно имеет список всех зависимостей от других пакетов. Исходные скрипты сайта доступны на GitHub.

Подробности на undeadly.org

>>> http://ports.su/



Проверено: beastie ()

Яндекс, Гугл

Кстати, Яндекс до сих пор за два месяца ни одной страницы не включил в индекс — я одинаково добавил сайт и в Google, и в Yandex, числа эдак 2013-02-28. Очевидно, YandexBot'а не устраивает наличие большого количества внутренних ссылок на заглавной странице. Гугл начал индексирование где-то в самом начале марта, и уже с середины марта в индексе находятся более 7,5 тыс. страниц, всего за две недели с момента оригинального открытия сайта (и у меня тогда даже sitemap'а не было).

Не особенно понятно, как в Яндексе представляется использование site-search (Яндекс.Поиск для сайта, http://site.yandex.ru/) для новых сайтов, если никакой индексации для новых сайтов не предусмотрено.

cnst ()

Вон как опенбзд пиарят, будет на что перейти, если что...

unt1tled ★★★★ ()
Ответ на: комментарий от unt1tled

поинтересуйся как там у них с юникодом? недавно где-то (хз) читал о каких-то проблемах по настройке юникода в терминале

anonymous ()
Ответ на: комментарий от d_Artagnan

А разве зону su не прикрыли?

не раньше чем Ленина вынесут из мавзолея

Umberto ★☆ ()
Ответ на: комментарий от anonymous

Да что юникод, я когда последний раз ставил, клавиатура в консоли вместо 1 символа печатала 3-4 с задержкой в 5 секунд, даже залогиниться не сумел. Я так понял это у них secure login фича или игра ninja typer сразу после загрузки для поднятия морали. Выкинул, короче. RIP.

unt1tled ★★★★ ()

Не то, чтобы я такой большой специалист и не то, чтобы меня спросили, но вот так, мне кажется, будет лучше: These pages have been generated with/using a... Generated тоже как будто бы режет глаза, но не могу понять причину.

anonymous ()
Ответ на: Яндекс, Гугл от cnst

Сейчас придет Reset и скажет, что все замечательно индексируется, а под твой сайт яндекс.бот не обязан подстраиваться :-D

gh0stwizard ★★★★★ ()
Ответ на: комментарий от anonymous

«were» и «have been», вроде как, практически одно и тоже.

«with a ... fork» смотрится странно, в данном контексте.

Мне кажется, что текущий вариант, «These pages were generated by a databases/ports-readmes fork, available at bitbucket and github.», вполне пригоден.

Хотя, хз. Действительно довольно странное предложение. :-)

cnst ()

OpenBSD

undeadly.org

Ну сами же палитесь.

Quasar ★★★★★ ()

Две новости в мае про опёнка. Это «жжжжж» неспроста. (с)

Stalin ★★★★★ ()

Сделано, конечно, по-спартански.

dukzcry ()
Ответ на: комментарий от d_Artagnan

А разве зону su не прикрыли?

Специально для БСДшников оставили.

cipher ★★★★★ ()
Ответ на: комментарий от dukzcry

Сделано, конечно, по-спартански.

А не по-спартански, а в стилистике OpenBSD.

cipher ★★★★★ ()
Ответ на: комментарий от cnst

«These pages were generated by a databases/ports-readmes fork, available at bitbucket and github.»

Да, вполне пригоден. Только если это статика — «were». Если «генерация» происходит, страницы обновляются, то лучше поставить «are».

whiskydotjar ()

а как можно еще до установки определить - потянет мое железо пня или нет? :

i5-3570K / HD4000
Ethernet controller: RTL8111/8168 PCI Express Gigabit Ethernet controller (rev 06)

science ★★☆ ()
Ответ на: комментарий от anonymous

поинтересуйся как там у них с юникодом? недавно где-то (хз) читал о каких-то проблемах по настройке юникода в терминале

Ты часто терминал то видишь?

Ygor ★★★★★ ()
Ответ на: комментарий от cipher

в стилистике OpenBSD

Я не сколько про дизайн, сколько про исполнение. Сами OpenBSD'шники не чураются использования динамических скриптов у себя на сайте: manpages и cvsweb.

dukzcry ()
Ответ на: комментарий от science

а как можно еще до установки определить - потянет мое железо пня или нет?

Момент установки - это точка невозврата? Попробуй, расскажешь.

anonymous ()
Ответ на: комментарий от cnst

«were» и «have been», вроде как, практически одно и тоже.

Не надо было прогуливать.

These pages were generated

These pages are generated

anonymous ()
Ответ на: комментарий от anonymous

Сайт — статика (генерация раз в день), так что «were» как раз правильно, «are» — нет.

А «were» и «have been» чем так сильно отличаются в данном контексте?

cnst ()
Ответ на: комментарий от rezedent12

Страны нет, а доменная зона осталась.

Вот куда надо Pirate Bay переносить. Попробуйте пожаловаться на несуществующую страну.

anonymous ()
Ответ на: комментарий от Ygor

если ты решил прицепиться к словам, тогда пусть будет «эмулятор терминала». если это обычный вопрос - да, я и сейчас им пользуюсь ;-)

anonymous ()

Хорошее дело делаете! Хоть опенком и не пользуюсь, будет куда перейти в случае скатывания линуксов в СГ.

Посмотрел по списку пакетов - Warzone2100 и Sauerbraten есть. Значит, годно для нетбука!

anonymous ()
Ответ на: комментарий от anonymous

Вот куда надо Pirate Bay переносить. Попробуйте пожаловаться на несуществующую страну.

Дело не в домене, в хостере.

rezedent12 ☆☆☆ ()
Ответ на: комментарий от d_Artagnan

Формально это вроде как Судан, но таки да — не прикрыли, ибо пишу из зоны su.

Evgueni ★★★★★ ()
Последнее исправление: Evgueni (всего исправлений: 1)
Ответ на: комментарий от Ygor

А ты нет? Как же ты с компьютером разговариваешь? Или у тебя есть волшебная кнопка?

Evgueni ★★★★★ ()
Ответ на: комментарий от Evgueni

Формально это вроде как Судан

Вроде как с 1990 года это домен бывшего Советского Союза, у судана же .sd

science ★★☆ ()

pant.su ? Вы извращенцы!

anonymous ()
Ответ на: комментарий от science

Значит то была городская легенда. В любом случае su никуда деваться не собирается.

Evgueni ★★★★★ ()
Ответ на: комментарий от anonymous

тогда пусть будет «эмулятор терминала». если это обычный вопрос - да, я и сейчас им пользуюсь ;-)

С иксовыми эмуляторами терминалов и utf8 проблем в опёнке не было.

Ygor ★★★★★ ()
Ответ на: комментарий от Evgueni

А ты нет?

Я предпочитаю работать в X-ах и пользоваться эмуляторами терминала.

Другой вопрос, все троллеги разной толщины упустили из вида - а поддерживает ли реализация ufs utf8 в опёнке.

P.S. 5 лет пользовался FreeBSD - системная локаль koi8-r никогда не напрягала.

Ygor ★★★★★ ()
Ответ на: комментарий от Ygor

Ну вот ты и ответил на мой предыдущий вопрос - с юникодом там все в порядке.

anonymous ()
Ответ на: комментарий от Ygor

Время таки движется и unicode — это таки неизбежно, как движение ледника. Это всеобщий процесс — нравится это или нет. С другой стороны если десктоп не нужен или особо не важен, то английской локали достаточно.

P.S. Поддержка koi8 и utf-8 — это совершенно разные печенюшки.

Evgueni ★★★★★ ()
Последнее исправление: Evgueni (всего исправлений: 1)
Ответ на: Яндекс, Гугл от cnst

аналогично, тоже сайт добавлял в яшу около полугода назад, проиндексировали тока главную страницу

insider ★★★ ()
Ответ на: комментарий от rezedent12

Интересно, а у Югославии и других исчезнувших стран остались зоны из двух букв?

Deleted ()
Ответ на: комментарий от insider

Так у меня Яндекс даже главную страницу в индекс включать не стал! Уже несколько раз загружал, ещё несколько недель назад, а в индексе до сих пор ноль страниц.

Я, конечно, понимаю, что это всё из-за спама и спамного SEO, но в чём смысл поисковой системы, если она, по сути, работает только как каталог популярных ресурсов?

От Гугла, кстати, уже несколько недель как идёт полно трафика на ports.su.

cnst ()
Ответ на: комментарий от Deleted

.yu

не, у них, между прочим, отобрали, или, скорее всего, они сами отказались, так как, возможно, поделить просто не сумели.

http://en.wikipedia.org/wiki/.yu

cnst ()
Ответ на: комментарий от anonymous

Re: master/CVS/Entries

upstream, типа. В чём проблема? Закоммитил специально, дабы можно было просто обновиться, если нужно.

cnst ()
Ответ на: комментарий от cnst

раньше Яндекс лучше работал, зазнались ребята. Ну зато есть куча других поисковиков, так что не гуглем единым

insider ★★★ ()
Ответ на: комментарий от cnst

these pages ARE(?) generated WITH databases/ports-readmes fork _ available at bitbucket and github.

~~ Ъ

MyTrooName ★★★★★ ()
Ответ на: комментарий от MyTrooName

раз в день - это уже are. когда перестанет генериться, тогда будет were.

MyTrooName ★★★★★ ()
Ответ на: комментарий от cnst

Я, конечно, понимаю, что это всё из-за спама и спамного SEO

Да нету для яндекса никакой проблемы с фильтрацией SEO спама...
Проблема твоего сайта в том, что он выглядит как листинг директорий нагенеренный автоматом, при этом контент ну ни разу не уникальный.

Советы:
1 - Добавь хоть какой то текст на русском/английском на главную, например как в этой новости.
2 - Пропиши в robots.txt crawl-delay.
3 - Сделай sitemap.xml полноценным, с датами модификации и приоритетами.
4 - Пол мегабайта это очень дофига. Выкинь из sitemap пакеты, оставь только категории. Или как вариант разбей sitemap на 2-3 менее толстых файла.
5 - Можешь так же поставить Яндекс.Метрику на некоторое время, если у тебя там правда есть посетители, то это вероятно ускорит попадение в индекс.

Любовь к минимализму это отлично, но Яндекс эту любовь точно не разделяет.

winddos ★★★ ()
Ответ на: комментарий от winddos

Да нету для яндекса никакой проблемы с фильтрацией SEO спама...

Разумеется у них никаких проблем нет, они просто нифига ничего нового не индексируют.

1 - Добавь хоть какой то текст на русском/английском на главную, например как в этой новости.

У меня вон над одной строчкой в конце страницы как придираются. Можешь себе представить, что будет, если будет размещено целых несколько предложений текста на русском/английском? :-)

2 - Пропиши в robots.txt crawl-delay.

Зачем? Т.к. спамеры — не прописывают?

3 - Сделай sitemap.xml полноценным, с датами модификации и приоритетами.

И какие приоритеты выставлять? 0.5 просто так всем? В чём смысл?

К сожалению, дата модификации пока не поддерживается, я об этом сам уже давно баг написал: https://github.com/cnst/ports-readmes/issues/2

4 - Пол мегабайта это очень дофига. Выкинь из sitemap пакеты, оставь только категории. Или как вариант разбей sitemap на 2-3 менее толстых файла.

Это уже очень неправильный и необоснованный совет, сайтмапы могут быть до десяти мегабайтов, так что здесь у меня вообще крошки. И вообще, там логически разбивать нечего, до пределов ещё долго идти.

Смысла оставлять только категории вообще никакого нет — все категории и так уже указаны на заглавной странице. Как раз полезно указывать все сами порты. Я делаю ping на Google каждый день, и он очень быстро индексирует новые страницы. mosh только недавно (пару дней назад) появился, и уже доступен в поиске (кстати, только сама страница /net/mosh, но не категория /net, так как last-modified в сайтмапе не поддерживается).

5 - Можешь так же поставить Яндекс.Метрику на некоторое время, если у тебя там правда есть посетители, то это вероятно ускорит попадение в индекс.

Есть какие-либо официальные заявления по этому поводу? В данный момент разумеется полно посетителей идёт с ЛОРа и undeadly.

Есть ли возможность использовать метрику без JavaScript?

cnst ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.