LINUX.ORG.RU

Выборки номеров

 


0

2

Здравствуйте! Имеется задача: Существуют системы, которые распознают номера, каждый номер сохраняется в виде: <номер>, дата распознования, время распознования (после преобразований etc), ближайший населенный пункт. Номера могут иметь произвольную форму, которая включает в себя цифры и буквы в любой последовательности. Необходимо организовать выборку номеров со всех систем с поправкой на ошибки распознования. Причем система должна отсортировывать очевидно ложные (с точки зрения логики) номера и предоставлять выборку. Из входных данных только приблизительное время когда тот или иной номер записанный в системах. Что я сделал: 1 - ошибки распознования; «приблезительный» поиск номера Что требуют: Поиск неизвестного номера с возможными ошибками распознования. Что есть у меня в голове: - перебор всех возможных значений с учетом ошибок распознования. Что я хотел бы получить от вас: рекомендации, идеи итд.


Ответ на: комментарий от Bell

Требование простое, найти пересечения неизвестного (который был считан, возможно неправильно, возможно вообще не был считан, но запись о проходе этого номера осталась... вообщем единорога) номера, на 9 точках считывания этого номера, притом, по времени он точно был (хотя последнее «точно» временной промежуток около 3 недель (и 6 мил записей))...

X286
() автор топика
Ответ на: комментарий от Bell

Условий поиска нет, кроме «я помню этот номер, он был толи 18 толи 30 числа толи мая толи апреля»

X286
() автор топика
Ответ на: комментарий от Bell

А описание номера примерно такое - «ну он точно был красный, с буквами, но может быть и синий», может ... а может быть и грязно-зеленый.

X286
() автор топика
Ответ на: комментарий от Bell

контейнер, который контейнеровоз привозит морем, потом они отгружаются на поезда и отправляются по разным маршрутам. каждая ветка имеет точки контроля. Иногда контейнеры теряются, иногда «очень» теряются. Вот этот случай как раз из «Очень» разряда.

X286
() автор топика
Ответ на: комментарий от X286

Получается, что потерянный номер и цвет известен. В твоем первоначальном условии ищется что-то неизвестное.

Bell
()
Ответ на: комментарий от X286

Так, я попробую расшифровать твоё сообщение.

Ты работаешь в какой-то компании, занимающейся перевозкой грузовых контейнеров. На каждом контейнере написан номер, состоящий из произвольного набора букв и цифр. В каждой контрольной точке, куда прибывает контейнер по пути следования, этот номер регистрируется: фотографируется камерой, автоматически распознаётся и заносится в базу данных, причём если при OCR происходят ошибки, их никто не корректирует. Иногда номера по небрежности вообще не считываются, и контейнер проходит через контрольный пункт без внесения в базу данных вообще.

Иногда контейнеры теряются, и тогда их приходится искать. При этом точного номера контейнера никто не знает, точных дат, когда и где он мог проходить, тоже, искать приходится по приблизительному номеру, приблизительной (с погрешностью в несколько месяцев) дате, приблизительному (с точностью до континента) маршруту следования и приблизительному цвету контейнера.

Задача: написать систему, которая из всех полученных логов прохождения контейнеров выудит по заданным признакам вхождения, соответствующие искомому контейнеру, и отсортирует по релевантности. Алгоритм определения релевантности тоже нужно разработать.

Вопрос: с какой стороны за это взяться?

-----

Я правильно понял?

proud_anon ★★★★★
()
Последнее исправление: proud_anon (всего исправлений: 2)
Ответ на: комментарий от proud_anon

Ты работаешь в какой-то компании

Я обслуживаю контрольные точки, и доступа к исходникам программе OCR не имею доступа. OCR обладает такой фичей - определять примерно 70%. На какой то черт, моё руководство приняло на себя хранение данных. Поскольку заказчик избавился от админа ввиду такой халявы, разбираться приходится с этим мне.

При этом точного номера контейнера никто не знает, точных дат, когда и где он мог проходить, тоже, искать приходится по приблизительному номеру, приблизительной (с погрешностью в несколько месяцев) дате, приблизительному (с точностью до континента) маршруту следования и приблизительному цвету контейнера.

Это я уже написал. Написал программку которая ищет по любым имеющимся данным контейнер. Задача такая - написать программу, которая ищет контейнеры путем «магии» ищет контейнер конкретных данных у которого нет. Неизвестен (потерян и не помнится номер, цвет, направление). Даже если имеется направление - то это не сильно помогает, контейнер может быть сгружен между точками контроля.

X286
() автор топика
Ответ на: комментарий от X286

Так задача найти все неучтенные контейнеры включая те, которые никто не ищет и про которые неизвестно, что они потеряны?

Bell
()

взять все номера за промежуток
убрать все гарантированного доставленные
убрать все, что прошли контроль по правильному для них маршруту (отличному от искомого), но ещё не доставлены
сколько остаётся? если много - то почему?
если больше одного, выявить почему их не один потерявшийся, а дофига
поправить алгоритм, на основе предыдущего вывода
в оставшихся искать?

system-root ★★★★★
()
Ответ на: комментарий от X286

Генеральный спонсор сумбура в голове Почта России..

expelled ★★
()
Ответ на: комментарий от Bell

Моя поставленная задача такая: Надо найти контейнер, но больше нет никаких данных. Компания которая перевозит контейнеры ничего больше не говорит. Просто пропал контейнер с 9 мая по сегодня. Груз - текстиль. Транспортная компания, обычно пишет номер, цвет, время, сейчас только время и все. Ни направления, ни массы ни откуда - куда - ничего. Вот что сам сейчас знаю - рассказал.

X286
() автор топика

Ты где работаешь то, слатенький? Надо бы твоему шефу намекнуть, что ты, во-первых NDA нарушаешь, во-вторых не работаешь, а все свои задания на третьих лиц спихнуть хочешь. А потом удивляемся ещё, почему логистика в РФ в глубокой коме находится.

cherry-pick
()
Ответ на: комментарий от cherry-pick

ты, во-первых NDA нарушаешь

Ты серьёзно считаешь, что мы тут должны помогать неизвестно кому затыкать людям рты и бороться со свободой слова?

во-вторых не работаешь, а все свои задания на третьих лиц спихнуть хочешь

Он просто попросил совета.

А потом удивляемся ещё, почему логистика в РФ в глубокой коме находится.

Логистика находится в жопе не столько из-за программиста, сколько из-за того, что никто не знает, сколько контейнеров ушло, сколько пришло, какие они были, и все считают, что это вполне нормальная ситуация.

proud_anon ★★★★★
()
Ответ на: комментарий от cherry-pick

во-первых NDA нарушаешь

ничего я не нарушаю. нет ни мест ни координат. но вам там с пальмы виднее.

во-вторых не работаешь, а все свои задания на третьих лиц спихнуть хочешь

я не просил готового решения, я спросил совета. Если ваша «интеллектуальная» собственность настолько ценна - устройтесь в Apple.

А потом удивляемся ещё, почему логистика в РФ в глубокой коме находится.

Да у нас все люди, которые так или иначе работают вблизи дорог - логисты *сарказм*. Ладно, умерьте пыл. Я уже понял что вы дороГОй специалист.

X286
() автор топика
Ответ на: комментарий от system-root

Спасибо большое, ваш совет мне очень помог.

X286
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.