Тестирующие системы для структур данных и алгоритмов

алгоритмы, практика, структуры данных, тестирование, тесты

0

4

Может кто-нибудь подсказать, есть ли в открытом доступе тестирующие системы к структурам данных и алгоритмам или хотя бы просто тестовые данные?

Язык - с++

Хотелось бы подтянуть структуры разные, например: хеш таблицы, кольцевой буфер, бинарные деревья поиска, алгоритмы: сортировки, обход деревьев и т.д.

Чтобы себя проверить, хочется использовать какие-нибудь тестирующие системы, которые проверяют на правильность и скорость. Можно и самому написать, но есть страх не учесть какой-нибудь случай из-за которого можно пропустить ошибку.

Сколько не ищу, ничего найти не могу. Есть сайты, в которых предлагается дописать код к уже готовому классу, мол, допишите методы , а потом запустите run и проверьте, но хотелось бы, конечно, просто загружать реализацию куда-нибудь или запускать все на локалке.

Буду благодарен за какие-нибудь советы и помощь по этому вопросу

Ссылка

← Модуль nginx

Метапрог-прототип 34 + СУВТ по логическому типу →

hackerrank.com leetcode

anonymous
(24.07.20 19:27:29 MSK)

Ответ на: комментарий от anonymous 24.07.20 19:27:29 MSK

Я еще этот сайт находил freecodecamp.org/learn/

Там в самом низу coding interview prep. Но, опять же, хотелось бы целую систему какую-нибудь и желательно на локалке…

Спасибо за ссылки, про leetcode не знал

wh75per
(24.07.20 19:48:50 MSK) автор топика

Ссылка

Если знаешь, какая сложность по времени / памяти должна быть, просто наваливаешь данных и строишь графики. Для пропущенных случаев прикрути фаззер какой-то, в общем случае - property-based testing, тебе это будет ещё и полезно для того, чтобы научиться выражать свойства алгоритмов в терминах их апи, а не кишок.

cdshines ★★★★★
(24.07.20 21:24:51 MSK)

Возможно, вам подойдёт что-то типа https://leetcode.com/

ugoday ★★★★★
(24.07.20 21:36:49 MSK)

Ссылка

Из вопросов/ответов есть https://github.com/teivah/algodeck, хоть и не в особо удобной форме (более удобную надо покупать или как-то распарсить).

Задачи из соревнований вместе с тестовыми наборами данных есть только в двух местах (год назад других не находил; вроде, даже с какими-то специфичными лицензиями или вовсе без них, их просто не выкладывают):

http://2014.nwerc.eu/ (за другие годы тоже сайты есть)
https://ipsc.ksp.sk/archive

Оффлайн-аналогов сайтов по типу codility и т.д. по сути нету (только пару огрызков видел, либо же идут онлайн-системы для проведения соревнований). Я себе кое-как навелосипедил, но задач особо не надобавлял. Если есть желание поковырять, могу прилепить лицензию и дать ссылку, оно на C++ с Qt, но сыровато (в частности ищет sqlite-базы в текущем каталоге).

xaizek ★★★★★
(25.07.20 00:13:10 MSK)

https://informatics.msk.ru/

см. «структуры данных и алгоритмы»

Tanger ★★★★★
(25.07.20 02:16:23 MSK)

Ссылка

тестирующие системы к структурам данных и алгоритмам или хотя бы просто тестовые данные?

Тестовые данные лучше либо самому генерить (и тогда будешь знать метод генерации и потом поймешь, если где-то накосячил именно с тестовыми данными, и не будешь зависеть от всяких хакерсранков). Либо, если генерация очень трудоемкая (типа всяких датасетов для тренировки распознавателей образов), есть уже собранные научным сообществом и общедоступные датасеты, с которыми разные алгоритмы тестируются.

seiken ★★★★★
(25.07.20 06:04:04 MSK)

Ответ на: комментарий от seiken 25.07.20 06:04:04 MSK

есть уже собранные научным сообществом и общедоступные датасеты, с которыми разные алгоритмы тестируются.

Например?

anonymous
(25.07.20 06:19:26 MSK)

Ответ на: комментарий от anonymous 25.07.20 06:19:26 MSK

https://en.wikipedia.org/wiki/List_of_datasets_for_machine-learning_research

seiken ★★★★★
(25.07.20 06:33:53 MSK)

Ответ на: комментарий от seiken 25.07.20 06:33:53 MSK

Спасибо!
Для меня big data в виде xml, … интересны для тестирования производительности алгоритмов.

anonymous
(25.07.20 06:38:11 MSK)

Ответ на: комментарий от anonymous 25.07.20 06:38:11 MSK

Для меня big data в виде xml, … интересны для тестирования производительности алгоритмов.

Хотя конечно big data в виде xml - очень уныло.
Интересны URL с которых можно скачать большие базы /Firebird, …/.

anonymous
(25.07.20 06:43:42 MSK)

Ссылка

Хотелось бы подтянуть структуры разные, например: хеш таблицы, кольцевой буфер, бинарные деревья поиска, алгоритмы: сортировки, обход деревьев и т.д.

Можно просто случайно генерировать большое количество элементов и проверять результат а также замерять время. Для указанных структур данных генерация и проверка случайных данных не составляет проблем. Можно ещё добавить тестовые случаи для пустых данных и одного элемента для проверки граничных случаев.

X512 ★★★★★
(25.07.20 06:50:52 MSK)

Ответ на: комментарий от X512 25.07.20 06:50:52 MSK

Можно просто случайно генерировать большое количество элементов и проверять результат а также замерять время.

Как сказать.
Нагенерили мусора … и какой критерий того, что алгоритм отработал правильно?

anonymous
(25.07.20 07:29:41 MSK)

Ответ на: комментарий от anonymous 25.07.20 07:29:41 MSK

Для сортировки можно отсортировать входные данные заведомо рабочим алгоритмом (например из стандартной библиотеки) и сравнить результат.

X512 ★★★★★
(25.07.20 08:01:28 MSK)

Ответ на: комментарий от X512 25.07.20 08:01:28 MSK

Для сортировки можно отсортировать входные данные заведомо рабочим алгоритмом (например из стандартной библиотеки) и сравнить результат.

Это не ответ.
С таким же успехом можно взять первый том «Война и Мир» … - «и сравнить результат.».

anonymous
(25.07.20 08:06:20 MSK)

Ответ на: комментарий от anonymous 25.07.20 08:06:20 MSK

Это не ответ.

Речь идет о новых алгоритмах, а не реализации кем-то ранее разработанных.

anonymous
(25.07.20 08:22:22 MSK)

Можно и самому написать, но есть страх не учесть какой-нибудь случай из-за которого можно пропустить ошибку.

Вы бы посмотрели трекер багов любого популярного проекта …

Владимир

anonymous
(25.07.20 09:19:42 MSK)

Ссылка

Ответ на: комментарий от anonymous 25.07.20 08:22:22 MSK

Речь идет о новых алгоритмах, а не реализации кем-то ранее разработанных

сортировки, обход деревьев

ага

~~vedowi6419~~ ★
(25.07.20 10:40:01 MSK)

Ответ на: комментарий от vedowi6419 25.07.20 10:40:01 MSK

А зачем ему тестирующие алгоритмы для поднятия «уровня»?

ТС пишет

Хотелось бы подтянуть структуры разные, например: хеш таблицы, кольцевой буфер, бинарные деревья поиска, алгоритмы: сортировки, обход деревьев и т.д.

То бишь бери пять чисел и пробуй их готовой функций отсортировать …
Он то что хочет - понять как использовать это API.
Так что пяти чисел достаточно.

anonymous
(25.07.20 10:45:27 MSK)

Ссылка

Ответ на: комментарий от anonymous 25.07.20 07:29:41 MSK

Нагенерили мусора … и какой критерий того, что алгоритм отработал правильно?

Никакой, естественно. Тестируется не алгоритм, а его реализация.

seiken ★★★★★
(25.07.20 10:56:52 MSK)

Ссылка

Так нет никаких эталонных api и реализаций. Скорость дело такое себе, в той же самой хеш таблице ты можешь реализовать кеширование наиболее часто запрашиваемых данных или просто кеширование, коллизии разруливать просто листами или деревьями или листами и деревьями, а может ещё чем, а может вообще не разруливать хранение указателей, а хранить индексы на другие хештаблицы в которых уже по типам разложены данные.

Хотя можно брать например алгоритм и его популярную реализацию, потом писать своё и просто сравнивать результаты.

Но если где то есть прям то что ты описал… Подпишусь, тоже интересно. Но я очень сомневаюсь что такое существует что-бы прям всё из коробки

LINUX-ORG-RU ★★★★★
(25.07.20 11:20:51 MSK)

Ссылка

Ответ на: комментарий от cdshines 24.07.20 21:24:51 MSK

просто наваливаешь данных

Вот тут тоже интересно. Нужно подготовить хорошие данные понятное дело первое это рандом, затем данные в повторяющимися последовательностями через равный/рандомный промежуток, затем рандомные данные с повторяющимися последовательностями через рандомный/постоянный промежуток данных или статичный поток данных с рандомными блоками через рандомные/статичные промежутки и так далее и так далее. Разнообразные алгоритмы учитывающие всё это или нет могут быть интересны в одних случаях и бесполезны в других. Тут тоже надо подойти с умом и растаропностью. Чаще всего проверяют на откровенном рандоме для некого общего случая выдавая среднюю температуру по больнице их которой нихрена не понятно

LINUX-ORG-RU ★★★★★
(25.07.20 11:28:53 MSK)

Ссылка

Ответ на: комментарий от xaizek 25.07.20 00:13:10 MSK

Всем спасибо большое за предложения и советы. Для себя, пожалуй, решил использовать следующий способ - буду писать тесты для общих случаев, а потом дорабатывать фаззингом, как здесь предлагали. Такой тест-дривен легкий)

Благодарю за ссылки, буду смотреть)

Странно, конечно, что нет никаких общих тестов для структур хотя бы. Я понимаю, что реализации могут различаться как и интерфейсы, но все же… Они много где используются, неужели нет какого-нибудь стандарта. В общем отсутсвтие каких-то наборов данных для тестов структур меня удивляет.

wh75per
(26.07.20 00:52:41 MSK) автор топика
Последнее исправление: wh75per 26.07.20 00:54:37 MSK (всего исправлений: 1)