Июль 2011 года стал месяцем, который можно по праву назвать: “Месяц – утечки конфиденциальной информации в Яндексе”. Наверно многие активные пользователи сети интернет уже успели узнать о нашумевших появившихся в открытом поиске Яндекса данных: о смсках Мегафона, личных данных заказов из секс-шопов и других различных сервисов и интернет-магазинов. Так же в поиск Яндекса попали и покупатели ЖД-билетов. Что самое интересное, вся эта утечка информации произошла буквально в течении нескольких дней.
18 июля, когда отправленные через сайт Мегафона смс и телефонные номера отправителей, попали в выдачу поисковика, представители поисковой системы Яндекс почти сразу же объяснили почему это произошло. Пресс-секретарь Яндекса рассказал, что на сайте www.sendsms.megafon.ru попросту отсутствовал файл robots.txt. Что такое файл robots.txt рассказано здесь: Как сделать файл robots.txt.
Странно как то получается, наверно любой вебмастер знает что такое robots.txt и как его использовать. А на таком популярном ресурсе, как megafon.ru этот файл куда то испарился. Можно конечно предположить то, что файл robots.txt просто удалили по невнимательности или намеренно. В общем загадка какая то получается.
Опять же по словам пресс-секретаря Яндекса, это случилось от некорректного использования файла robots.txt.
26 июля в выдаче Яндекса оказались электронные железнодорожные билеты, купленные через сайт RailwayTicket.ru. По определенным поисковым запросам в Яндексе можно было лицезреть фамилия, имена и отчества пассажиров, номерах поездов, датах их отправления, пунктах назначения и отправления. Яндекс комментирует случившееся как некорректное использование файла robots.txt.
27 июля в поиске Google можно было обнаружить документы российских государственных ведомств. Среди этих документов такие как: документы Федеральной антимонопольной службы, Счетной палаты, Минэкономразвития и другие. Всего около 200 файлов. Официальных комментариев от Google, пока вроде бы не поступало.
Пока трудно судить почему произошла утечка информации. Главное чтобы это не выработалось в систему. Теперь будем ждать, чем в следующий раз нас удивят поисковые системы :).