LINUX.ORG.RU

Сообщения EVFR

 

Посоветуйте список русских научных ключевых слов

Необходимо для примитивного самодельного текстового анализатора считать слова, явно имеющие отношение к научным дисциплинам для оценки того, как часто в объекте попадаются тексты из научных источников. Списки стоп-слов русского языка существуют, наверняка с такой задачей для мелких проектов сталкивались люди и такие списки составляли кустарно. Кто может поделиться? Со стеммингом разберусь сам.

 , , ,

EVFR
()

Удобный софт для работы с контактами в формате сети

Есть необходимость ведения миниатюрной «базы данных» контактов (контент вносится и редактируется только в ручную и объёмы не будут превышать пары сотен человек), но классические контакт-менеджеры (и, тем более, CRM) здесь не будут удобны, тупое ведение электронной таблицы тоже не вариант. Стоит задача ведения сети контактов именно в виде сети, какой более-менее адекватный вариант, исключая тривиальный FreeMind (который не для этого вообще), можно подобрать? Gephi ?

 , ,

EVFR
()

Реализация широкоформатного скрининга для знакомств

Ранее концепция такого инструмента уже была описана https://www.linux.org.ru/forum/talks/10280719, затем было планирование инструмента, после чего итеративно выполнялись запуски для получения данных, проведения отладок, исправления багов и рассылки. Историю WSS можно прочитать здесь http://pikabu.ru/profile/Widescreen , там-же можно увидеть обзорные статистические данные и почитать Суть, сами коды (но не в самом актуальном состоянии) на GitHub https://github.com/evfratov/widescreen-screening . На данный момент инструмент недалёк до достижения физического проедела платформы vk.com и в нём почти не осталось багов, также достигнута эффективность позитивного ответа на запрос до 50%, хотя таким образом было получено всего 5 кандидаток. В процессе работы мне никто так и не помог и не приводил примеры своих инструментов.

 , ,

EVFR
()

Задача реверс-инжиниринга биологической системы

При выполнении кандидатской по молекулярной биологии встала задача реверс-инжиниринга биологической системы (конкретнее - аппарат биосинтеза белка у бактерий) с целью разбирательства в тонкостях механизмов и созданию количественного предиктора. Встал вопрос: какие не_спекулятивные дисциплины (типа теории управления, системной инженерии, теории сложных систем) тут полезны, если с молекулярной биологией и биоинформатикой нормально?

 ,

EVFR
()

Широкоформатный скрининг для знакомств

Сейчас хорошо распиарены примеры того, как люди с навыками в IT применяли эти навыки для знакомств, например http://on.ted.com/AmyWebb и http://habrahabr.ru/post/210198/ . В силу высокоспецифических требований есть необходимость широкоформатного скрининга, чтобы максимизировать вероятность успеха. Технически единственным подходящим источником данных является ресурс vk.com, его и предполагается использовать. Вопрос: кто из русскоязычной аудитории выполнял подобные скрининги и каковы результаты (и наработанный опыт) ?

 , ,

EVFR
()

Прикладной Scientific Text Mining - с чего начать?

Основная работа - научная деятельность в life science, в том числе и биоинформатика, потому встаёт задача автоматизации обработки научной периодики. Дополнительно есть прикладные задачи, требующие стат. анализа текстов, потому появилась необходимость освоения методов Text Mining - потому вопрос: с чего начать изучение?

 text mining, ,

EVFR
()

Кросс-пост: Обработка данных высокопроизводительного сканирования

Кросс-пост из Multimedia, пусть разрешат его админы.

Делается «сбор» инструментов для автоматизированной обработки выдачи поточного сканирования (в данный момент фотографий): к массиву сканов необходимо применить

  • удаление ложноположительных (пустые листы/обратные стороны фото)
  • поворот криво отснятых
  • обрезка белых границ и выходов за пределы бумаги
  • детекция дубликатов с нечувствительностью к повороту, терпимостью к шуму, вариации контраста/яркости и, желательно, масштабу и фрагментации (имеются фрагменты копий и уменьшенные фото)

Который OpenSource/Free софт, пусть даже требующий самостоятельной связки для автоматизации, мог-бы быть пригоден для построения такого пайплайна для поточного сканирования?

 , ,

EVFR
()

Обработка данных высокопроизводительного сканирования

Делается «сбор» инструментов для автоматизированной обработки выдачи поточного сканирования (в данный момент фотографий): к массиву сканов необходимо применить

  • удаление ложноположительных (пустые листы/обратные стороны фото)
  • поворот криво отснятых
  • обрезка белых границ и выходов за пределы бумаги
  • детекция дубликатов с нечувствительностью к повороту, терпимостью к шуму, вариации контраста/яркости и, желательно, масштабу и фрагментации (имеются фрагменты копий и уменьшенные фото)

Который OpenSource/Free софт, пусть даже требующий самостоятельной связки для автоматизации, мог-бы быть пригоден для построения такого пайплайна для поточного сканирования?

 , ,

EVFR
()

Подбор доступного высокопроизводительного сканера

Выбирается высокопроизводитльный (поточный) цветной сканер, в первую очередь для сканирования фотографий (с учётом реального качества обычных плёночных цветных и старых чёрно-белых особых требований к качеству тут нет), во вторую для печатных бумаг. Основное для оптимизации - производительность/стоимость, лимит цены ~15 000р, NetDesk не предлагать.

 ,

EVFR
()

Настольное хранилище к настольной «рабочей станции»

К ранее завершённой теме Посоветуйте мать для «рабочей станции» добавлен вопрос о сборке бюджетного хранилища <10к, ожидаемое количество винтов не превышает десятка. Нужны рекомендации по оптимальному типу конструкции (полка в корпусе/отдельный ящик), контроллеру (недорогой -RAID или просто «много SATA»), питанию (собственный БП или от PC - запас хороший) и охлаждению (волнует проблема терморегуляции - зимой холодно, а летом греется). NAS/SAN пока не предлагать.

 ,

EVFR
()

Посоветуйте BT решение - уши-гарнитура + BT-адаптер

Которое сочетание BT-ухогарнитуры с USB BT-адаптером для декстопа гарантированно работает с минимальными траблами и сексом для наиболее распространённых дистрибутивов (в качестве ушей и микрофона, но гарантированная работа с линуксовым скайпом не требуется), причём сама ухо-гарнитура нормально дружит с мобилами на неновом android?

 ,

EVFR
()

Ищу проверенный универсальный аккумулятор

Подбирается универсальный портативный аккумулятор-зарядник для подзарядки всякой мелкой техники в роде мобильников - устройство такого типа: пример, то есть коробка, выдающая некое более-менее стандартное напряжение, укомплектованное набором распространённых разъемов и ёмкостью в районе 8-10 Ah.

При гуглеже утоп в числе вариантов, потому нужно узнать вариант с наиболее достоверной эмпирической проверкой - по стабильности, по надёжности, по заявленной ёмкости, по скорости деградации.

 ,

EVFR
()

Подскажите видеорегистратор с выносным видео/аудио

Подбирается устройство - в общем типовой видеорегистратор, но:

а) необходима возможность подключения внешней камеры и внешнего микрофона через вменяемые интерфейсы, в предельном случае собственные средства захвата могут отсутствовать.

б) необходимо верифицированное нормальное качество как записи, так и стабильности работы - на популярных ресурсах, типа яндекс.маркет очень противоречивые описания, не внушающие доверия.

Особых требований в роде очень длительной автономной работы, высокоэффективных мультимедиа-кодеков и очень большого storage нет (пункт б должен давать им уровень не ниже среднего), но желательна возможность внешнего питания.

telesys не предлагать (т.к. это пока основные кандидаты), HDD DVR Archos тоже не предлагать (они были основными кандидатами).

EVFR
()

Посоветуйте мать для «рабочей станции»

Задача: собрать из десктопного железа рабочую машину с мощным CPU (i7 ivy bridge, очевидно) с поддержкой большого объёма RAM (многие материнки не держат выше 16Гб) и возможностью хорошего масштабирования (ещё больше RAM и HDD в RAID). Разгон не предполагается, не забыть про встроенное видео (подразумевается в ivy) - видеокарты не надо, остальных приблуд как можно меньше. Нужно для биоинформатической работы, потому дофига памяти реально необходимо.

Есть неясности с требуемой мощностью БП. И можно-ли такое (в «нормальной» конфигурации, без всех забитых слотов RAM) уложить в ~25к руб. ?

EVFR
()

Сбой ресайза раздела NTFS

Вопрос из-за важности восстановления данных. Работал с разделом NTFS (понятно, что зря) - уменьшал без сдвига (отодвигал правую границу). На каком-то из начальных этапов был сбой, в результате получился нечитаемый NTFS раздел (под вендой вообще RAW) желаемого размера устройства (120Гб). GParted читает что это NTFS и даже кластер, но текущий объём раздела ~150Гб, а текущий размер устройства ~120Гб (старый размер), несовпадение: размер раздела > размера устройства - нельзя считать данные. Осложняется тем, что всё это на extended разделе в середине диска, а после незанятого куска (принадлежал убитому разделу) лежит загрузочный раздел.

Каковы шансы на восстановление данных? (могло быть хуже - были данные и ценнее) И как это лучше делать?

 ,

EVFR
()

BD-резак + BD-R или Стопка 2,5" HDD для бэкапов

Что лучше использовать из названного для оптимального массового бэкапа при ограниченном бюджете? Конкретнее: нужно нечасто сохранять пару сотен Гб (сейчас 200Гб, рост около 5Гб/месяц) на одном или небольшом числе носителей адекватными методами и скоростями (в смысле разбить на 100 DVD не вариант, сохранение каждый месяц нового - не вариант). Старые бэкапы не сильно важны, но изменения касательно всех предыдущих данных возможны (потому нужен именно полный бэкап). Есть варианты периодического бэкапа на BD-R SL/DL/TL/FL BD-резаком И на один-два, или даже три 2,5 HDD (3,5 кирпичи не вариант). Ограничения: денег на датацентры, RAID'ы и терабайты в облаках отсутствуют. Основной комп - ноут, всё оборудование - только внешнее. Большие объёмы и массы не допустимы. UPD: Данные шифрованные и бэкап требует сохранения шифрования.

Что лучше - резак или пара винтов? Или кто предложит ещё вариант?

EVFR
()

Авто-скриншотер на Fedora с Гномом

Имеется RFRemix 14.1, на ней Гном. Надо автоматический скриншотер с настройкой (периоды времены и активность), автозапуском и стабильностью (GUI и всякие примочки не особо требуются).

Shutter не катит - глючный и без автоматизации.

EVFR
()

open source аналог MyLifeBits

Тема ранее уже поднималась. Надо и ищется (в смысле на разработку) аналог проекта Microsoft Research «MyLifeBits», по аппаратной и программной (преимущественно) части. Предварительный вопрос - кто что думает и может предложить из существующего (подразумевается ознакомение с проектом)? Есть организация, заинтересованная в разработке такого проекта.

EVFR
()

Не ставится GROMACS на Fedora 14

Стандарной GUI установкой/удалением GROMACS на реппозиториях находится легко и вместе с кучей компонетов (и FFTV и GCC, которые тоже с реппозиториев ставятся). Загрузка и установка проходят как и должно, но по завершению программа не появляется нигде, (начиная от графики, заканчивая отсутсвием результатов поиска по файловой системе), только man находится и полусправочные файлы в /usr/share да и результат по /var/lib/yum/yumdb/g . Консоль не знает что такое GROMACS. Вопрос относится к тем, кто знает что есть GROMACS.

EVFR
()

RSS подписка на новые темы