Помню мелькало в новостях что открытый код использовался в проприетарном продукте нарушая лицензию. Обнаружили по паттернам в бинарнике. Точнее знали/подозревали что используется, ковыряние бинарника лишь подтвердило. Вроде бы даже до суда доходило, но не берусь утверждать, не помню деталей.
Можно скомпилировать код разными компиляторами с разными флагами и сопоставлять со сторонним бинарником собранным с твоим кодом. Не каждый будет таким заниматься конечно.
Да, на хостингах через поиск. Он должен знать, что искать. Вот гугление вряд ли что даст, куски кода редко бывают в индексе. Ещё зависит от стиля и прочих нюансов - вставленные куски легко опознать, если они не были серьёзно изменены.
Гугл индексирует веб, а не гит. Если код доступен через веб-интерфейс, гугл его может проиндексировать.
А перетирать копирайты - это зашквар. Так делать не надо. Повесь на свой проект совместимую лицензию, после чего тащи уже себе чужой код сколько влезет.