Разработчики проекта Debian представили новый сервис Debian Code Search (codesearch.debian.net), в рамках которого создана поисковая система по исходному коду доступных в дистрибутиве приложений и библиотек. В поисковой системе проиндексировано около 18 тысяч пакетов, в сумме содержащих более 140 Гб кода открытых проектов. В индекс включены только пакеты из репозитория "main", репозитории "non-free" и "contrib" не участвуют в индексации. При выполнении поисковых запросов поддерживается использование регулярных выражений, допустима фильтрация по типам файлов (например, filetype:perl) и пакетам (например, package:linux).

Поисковый движок Debian развивается как открытый проект, но код будет публично опубликован только в январе 2013 года, одновременно с научной работой создателя проекта (раньше опубликовать код не получится, так как возникнут проблемы с доказательством оригинальности разработки). Работа сервиса организована с использованием наработок, применённых в написанной на языке Go утилите CodeSearch, специально оптимизированной для поиска по большому объему кода с использованием регулярных выражений RE2 и использующей индексы Trigram, разработанные компанией Google для сервиса Google Code Search.

Из других систем поиска по исходным текстам можно отметить opensearch.krugle.org, koders.com и codase.com.

Источник: http://www.opennet.ru/opennews/art.shtml?num=35251