LINUX.ORG.RU

Сообщения C

 

Подробности о грядущей блокировке YouTube

Ростелеком предложил сотрудникам протестировать «сервис доступа к YouTube» — письмо ведомство обнаружил профильный канал ЗаТелеком. YouTube им предложили смотреть не напрямую, а через специально созданный Ростелекомом сайт ytonline.ru, на котором возможна фильтрация контента. Это похоже на тест фильтра для цензуры YouTube, рассказал «Можем объяснить» исполнительный директор Общества защиты интернета и автор канала «ЗаТелеком» Михаил Климарев.

Еще в пятницу сайт был доступен для всех российских пользователей, через него можно было посмотреть любое видео на американском видеохостинге. Сейчас ytonline.ru закрыли — зайти на него невозможно, браузер пишет: «подключение отклонено».

Климарев разъясняет, как, по мысли цензоров, будет работать новый сервис. «Прямой доступ к YouTube заблокируют, но смотреть видео с него можно будет через «прокладку» — этот портал Ростелекома, — говорит эксперт. — Только уже не все: котиков и кулинарию – пожалуйста, а крамольный с точки зрения власти контент он не пропустит».

Это может быть компромиссный сценарий между полной блокировкой (как Facebook и Instagram) и нынешним YouTube без цензуры – «он власть, очевидно, не устраивает», делает вывод Климарев.

После принятия политического решения на запуск такого фильтра понадобится около двух месяцев, технических сложностей тут нет, серьезных финансовых затрат не потребуется, указывает эксперт.

https://t.me/zatelecom/26259

Наверное теперь те, кому YouTube необходим, будут сидеть через vpn/proxy.

Как думаете, будет ли море проблем с сервисами Google для Android? (По причине ковровой блокировки гугловских подсетей РКН)

 , , ,

C
()

Как Китай построил полицейское государство с помощью IT

По данным правозащитных организаций, в Синьцзян-Уйгурском автономном районе Китая построена современная антиутопия, где граждане находятся под постоянным наблюдением камер, а людей принуждают доносить друг на друга. Атмосферу усугубляет то, что правила действуют произвольно, а отличить врагов от друзей и правду от вымысла почти невозможно. Как эта система устроена — в отрывке из книги американского журналиста Джеффри Кейна «Государство строгого режима. Внутри китайской цифровой антиутопии»

Женщин могут принудительно стерилизовать или заставить терпеть у себя в доме «соглядатая» мужского пола, если мужа отправили в лагерь. Специальные чиновники проводят с обычными гражданами регулярные воспитательные беседы и тестируют их на верность коммунистическим идеалам. К признакам неблагонадежности относят наличие в доме религиозных книг или опыт жизни за рубежом и даже посещение мечети — если его зафиксировали камеры наблюдения. Вся информация о семье записывается на ID, который необходимо сканировать, перед тем как зайти в магазин или заправить автомобиль — и если охранники увидят на мониторе «не заслуживает доверия», человеку не разрешат войти, а после дополнительной проверки могут и арестовать. Кроме того, в Китае действует «программа предиктивного полицейского контроля», в которой искусственный интеллект с помощью накопленного массива информации о человеке предсказывает насколько тот способен на преступление в будущем — как в фильме «Особое мнение».

«Общество быстро разрушается», — продолжал он. Отгороженные от фактов и правды, постоянно находящиеся под наблюдением, большинство людей не могут отличить врагов от друзей и не обладают информацией, которая необходима, чтобы бросить вызов режиму. Друзья предают друзей, начальники доносят на подчиненных, учителя сдают своих учеников, а дети — родителей. Каждый вынужден обращаться за защитой к государству.

Итак, технологии, используемые таким образом, больше не высвобождают лучшее, что в нас есть. Они становятся тюрьмой, потворствующей самым темным нашим побуждениям. А люди, контролирующие технологии, в Китае контролируют и народ.

https://www.forbes.ru/society/494418-sovremennyj-panoptikon-kak-kitaj-postroil-policejskoe-gosudarstvo-s-pomos-u-it

Вопрос тем, кто знает - действительно ли это настолько ужасно или просто приукрашено?

 , ,

C
()

Нормальный полнотекстовый поиск по книгам - существует ли?

Не могу найти, из какой книги цитата:

«Никто уже не смеётся, но цирк не уезжает. Клоуны становятся злее, а билеты дороже.»

Полнотекстовый поиск Флибусты не помог, books.google.ru тоже. Сколько же информации находится за пределами индексации поисковиков?

 ,

C
()

Китайцы заполонили зону .РФ доменами с вредоносным софтом

Согласно последним данным КЦ, в июне в зоне .РФ произошёл резкий скачок числа доменов, распространяющих вредоносное ПО. Если в мае 2023 года было заблокировано 226 таких доменов, то в июне этот показатель увеличился до 2600.

Ярослав Каргалёв, руководитель центра кибербезопасности F.A.C.C.T. (ранее Group IB), акцентирует внимание на китайских APT-группировках, описывая их как наиболее активные прогосударственные хакерские группы в сфере кибершпионажа. Эти группы олицетворяют идею «продвинутой устойчивой угрозы» (Advanced Persistent Threat), являясь примером долгосрочной, сложной и целенаправленной кибератаки.

https://3dnews.ru/1090079/v-zone-rf-uvelichilos-kolichestvo-domenov-rasprostranyayushchih-vredonosnoe-po

Интересно, какой именно софт имеется в виду? И зачем такие сложности, если 95% железа и так китайское.

 ,

C
()

41% кода на GitHub генерируется AI

В недавнем интервью Эмад Мостак (основатель компании, выпустившей Stable Diffusion) рассказал о текущем состоянии индустрии ИИ, а также о своём видении по её развитию. Он признал, что сложно прогнозировать дальше, чем на пять лет вперед, однако заявил, что «через пять лет программистов уже не будет». По крайней мере, в классическом понимании этой профессии. Будущее для «человеческих кодеров» не слишком радужное, считает Мостак. Его аргументы подтверждаются данными с GitHub, которые показывают, что «41% всего кода сейчас генерируется ИИ». И эта тенденция явно лишь будет набирать обороты в будущем.

https://www.securitylab.ru/news/539580.php

Примерно то же самое говорил в сентябре 2022 CEO GitHub. https://the-decoder.com/github-ceo-thinks-ai-will-write-majority-of-code-in-just-five-years/

Понятно, что они поднимают хайп ради повышения продаж своих продуктов, но возникает один вопрос. Если уже почти половина кода генерируется Copilot - может эта половина и не нужна и пора переходить на более высокий уровень описания систем?

 , ,

C
()

Кино, которое обязательно нужно посмотреть

Пишите, что по вашему, стоит того, чтобы потратить на это условные полтора часа, сидя перед экраном.

Возможные критерии, хотя бы по одному из которых фильм можно считать годным:

  1. Нетривиальный сюжет, который захватывает от начала и до конца - обычно это характерно для динамичных драм, но не только.
  2. Выдающиеся кинематография и работа оператора. Так, чтобы кадры из фильма можно было вешать на стену, а сцены пересмативать по много раз.
  3. Звуковая дорожка - если в кино такая музыка, что можно его полюбить только за это.
  4. Экспериментальная и новаторская составляющая. Например - нелинейность повествования, как в «Расемон» Куросавы или в «Лола, беги».
  5. Актерская работа. Если по вашему, игрой актеров можно наслаждаться, несмотря на предсказуемость сюжета.
  6. Историческая ценность. Например, какой-нибудь немецкий художественный фильм, снятый в Берлине 1945 года.
  7. Актуальность - фильм демонструирует ценный жизненный опыт. Сомнительный критерий, но пусть будет.

Если ни один из критериев не подходит, а фильм вы считаете достойным - пишите, я возможно что-то упустил.

Фильмы из широкого проката, а особенно коммерческое голливудское кино начиная с 1980-го не рассматриваем. Сериалы не рассматриваем. Документальное кино пойдет, если вы считаете его произведением искусства.

 ,

C
()

Литература 21 века. Что стоит читать?

Интересна художественная литература, написанная после 2000 года. Не только российская или англоязычная. Научная фантастика пойдет, но должно быть что-то еще. Яркие, необычные идеи, форма - то, что вдохновляет, или заставляет задуматься.

Или рок-н-ролл мертв?

 ,

C
()

Импортозамещение HR

Уехавших из России айтишников хотят заменить специалистами из Индии и Китая

https://www.banki.ru/news/lenta/?id=10983925

 ,

C
()

А вам за 40? (тест)

Just for fun, по ссылке ребята из buzzfeed наклепали тест с картинками, а больше ли ваш возраст, чем 40 лет: https://www.buzzfeed.com/daves4/over-40-quiz?bfsource=bfocompareoff&bfsource=bfocompareoff

Английский на лоре знают более-менее хорошо, поэтому проблем с тестом не должно быть. Тестируйтесь и отписывайте в комментариях свои результаты.

К сожалению, там нет вопросов про Linux, поэтому в комментариях можете подкидывать свои вопросы, по ответам на которые можно определить, а больше ли сорока тестируемому линуксоиду.

Например, как назывался файл конфигурирования X-ов до xorg.conf?

 ,

C
()

Фильтрование выбросов (аномальных значений) числового ряда с pandas

Помогите реализовать метод отфильтровывания слишком больших значений числового ряда (это котировки акций). Пример значений 2018-09-09, 2018-09-17

               value
timestamp
2018-09-01  0.000206
2018-09-02  0.000217
2018-09-03  0.000212
2018-09-04  0.000209
2018-09-05  0.000212
2018-09-06  0.000235
2018-09-07  0.000267
2018-09-08  0.000271
2018-09-09  0.050000
2018-09-10  0.000277
2018-09-11  0.000252
2018-09-12  0.000243
2018-09-13  0.000261
2018-09-14  0.000291
2018-09-15  0.000303
2018-09-16  0.000292
2018-09-17  0.080000
2018-09-18  0.000352
2018-09-19  0.000389
2018-09-20  0.000359
2018-09-21  0.000350
2018-09-22  0.000350
2018-09-23  0.000350
2018-09-24  0.000335
2018-09-25  0.000341
2018-09-26  0.000355
2018-09-27  0.000358
2018-09-28  0.000357
2018-09-29  0.000352
2018-09-30  0.000333
тут находится полный csv с данными https://file.io/TINyWl существующий код для фильтрования (можете запускать на скачаннном файле)
import pandas as pd

df = pd.read_csv("254.csv")
df["timestamp"] = pd.to_datetime(df["timestamp"])
df.set_index('timestamp', inplace=True)

df["data_pct"] = df["value"].pct_change(1)
df["data_pct_norm"] = (df["data_pct"] - df["data_pct"].mean())/df["data_pct"].std()
df["data_pct_norm"].fillna(0, inplace=True)
index = df["data_pct_norm"].between(-7, 7)
df = df[index]

data_res = df["value"].resample('24H')
data_int = data_res.interpolate(method='linear')

data_int.to_csv("254_cleaned.csv")

Проблемы с существующим кодом: он не может фильтровать два подряд идущих аномальных значения (так как ищет относительное изменение значения в ряде) и иногда отфильтровывает реальные пики в данных. Посоветуйте алгоритмы, альтернативные подходы к подобной задаче (можно использовать scipy, что-либо еще)

 , ,

C
()

vps benchmark - проверь свой vps

Взял недавно эккаунт digitalocean на 1GB ram.
А когда начал настраивать систему, показалось, что уж очень долго софт ставится.

В общем, запускал несколько тестов для CPU/IO/RAM. Результаты ниже.

# dd bs=1M count=512 if=/dev/zero of=test conv=fdatasync
512+0 records in
512+0 records out
536870912 bytes (537 MB) copied, 12.8017 s, 41.9 MB/s

#  sysbench --test=cpu --cpu-max-prime=20000 run
sysbench 0.4.12:  multi-threaded system evaluation benchmark
Test execution summary:
    total time:                          95.6198s

# sysbench --test=memory --memory-total-size=1G run
sysbench 0.4.12:  multi-threaded system evaluation benchmark
Test execution summary:
    total time:                          6.2309s

# ioping . -c 10
10 requests completed in 9057.0 ms, 639 iops, 2.5 mb/s
min/avg/max/mdev = 1.2/1.6/2.4/0.3 ms

# ioping -RD .
2237 requests completed in 3000.5 ms, 1302 iops, 5.1 mb/s
min/avg/max/mdev = 0.3/0.8/2.8/0.2 ms

# ioping -RL .
872 requests completed in 3001.7 ms, 443 iops, 110.9 mb/s
min/avg/max/mdev = 1.1/2.3/4.0/0.6 ms

# ioping -RC .
4979 requests completed in 2999.9 ms, 17653 iops, 69.0 mb/s
min/avg/max/mdev = 0.0/0.1/0.4/0.0 ms

# wget cachefly.cachefly.net/100mb.test
100%[======================================>] 104,857,600 13.5M/s   in 7.0s    

Попробуйте потестить свой vps хостинг, было бы интересно сравнить производительность.

C
()

youtube сортировка результатов по дате

привык там искать новости по ключевым словам, а сейчас чего-то никак не могу найти старые опции...

подскажите, как теперь вы включаете там сортировку?

C
()

распознавание 3д образов + речи (opencv+sphinx)

есть идеи, каким образом тут обучение работает с однократным показом объекта? неужели фэйк?

http://www.youtube.com/watch?v=fQ59dXOo63o

C
()

программирование под нанотехнологии - как?

На чем будут писаться программы для нанороботов? Будут ли там вообще языки программирования, компиляторы, операционные системы, драйверы,соединение с интернетом? А как будет происходить апгрейд софта?

C
()

python regex findall проблема

Как быть? регулярка не хочет ловить все совпадения

>>> re.compile('(?:^|\W)(one|two|three|four|five)(?:\W|$)').findall('one two three four five')
['one', 'three', 'five']

C
()

Chrome и заголовки страниц

Сегодня столкнулся с тем, что в хроме __невозможно__ увидеть тайтл страницы целиком (только первые 20 символов).

Вывод - одна из целей создания хрома - исключение заголовка страницы как фактора ранжирования.

Более того , выяснилось что у народа, использующего хром, стали пропадать тайтлы страниц в избранных, оставались одни иконки.

Интересно, они что, хотели весь механизм поиска перекроить с этим хромом?

C
()

Что творится с Pochta.ru?

Не могу проверить почту (на домене land.ru) - Thunderbird выдает сообщение «Login to server imap.land.ru failed»,

При попытке доступа через веб-интерфейс (на qip.ru) получаю «Пользователь заблокирован».

При открытии страниц поддержки выдается 404... (http://mail.qip.ru/support/faq)

Я конечно понимаю, что в августе много чего ломается.. Но тут же владелец - РБК, неужели там тоже бардак...

Если у кого есть почта на этих серверах, проверьте - работает ли у вас?

C
()

Системный кэш мешает работе программ

На debian сервере с 512Mb памяти крутится несколько программ, и в том числе apache+nginx.

Там же есть скрипт, при запуске которого требуется около 150 метров свободной памяти. Его работа контролируется с помощью таймаутов, и в случае нехватки свободной памяти скрипт просто не в состоянии запуститься - т.к. пару минут происходит ее освобождение от кэша.

Вероятно, кэш загромождают картинки, около 400 штук которых (500кб в среднем на каждую) доступны через веб-сервер. Посетителей у страницы нет, но гугл ее регулярно индексирует и в этом момент размер кэша прилично возрастает.

Правда, там же крутится приложение на django с базой mysql около 30Mb.

Возникает следующая проблема - скрипт, для которого требуется память, удается запустить только, если выполнить очистку системных кэшей # echo 3 > /proc/sys/vm/drop_caches (при этой команде высвобождается около 250 метров)

Подскажите, как ограничить использование памяти под кэши ? (с помощью настроек ядра, apache , или еще как-нибудь)

C
()

RSS подписка на новые темы