[Jacek Śliwerski]
(rzyjontko)Autor
Chłopak z Bałut (Dołów), po uniwerku i stypendium. Wiecznie zestresowane, przemądrzałe bezguście. Więcej na stronie domowej.
Adresy e-mail web developerów z Polski
Dzisiaj, w sposób zupełnie przypadkowy, znalazłem sposób na sporządzenie listy adresów e-mail web developerów z Polski. Oczywiście nie wszystkich. Ale w ciągu kilkunastu minut udało mi się ich znaleźć ponad 500. Zanim pokażę, jak to zrobić, krótka dygresja.
Google, jak wiadomo, bardzo dba o to, żeby adresy e-mail użytkowników ich serwisów nie dawały się zbyt łatwo wydobyć przy pomocy zautomatyzowanych harvesterów. I tak na przykład w wynikach wyszukiwania Google Groups adresy e-mail pojawiają się zapisane w taki oto sposób:

Jakby tego było mało, adresy są również ukrywane w treści wiadomości:
I to właśnie wydaje mi się fascynujące - jak wiele wysiłku można włożyć w zabezpieczenia, żeby potem inna grupa pracowników firmy wydała adresy e-mail twórców gadgetów Google... ot tak:
Około piętnastu minut zajęło mi przygotowanie skryptu, który przy pomocy wgeta (tu trzeba pamiętać o ustawieniu User-Agent), grepa, seda, pythona (urllib) i tr'a (strona wyników nie zawiera znaków nowego wiersza) wybiera listę 550 adresów e-mail. A to próbka, na dowód:
Mój adres również się wśród nich znajduje - tak właśnie na to trafiłem. Ciekaw jestem, czy kreatywny pracownik firmy, który wpadł na "genialny" pomysł dodania zlokalizowanych rekordów do bazy adresowej Google Maps, zgarnął za to premię :)
17 maja 2009, 13:00:38
Komentarze
Nie żebym był na liście, ale nie podobałoby mi się, gdyby ktoś mój adres publikował, nawet jako obrazek.
siefca, 17 maja 2009, 13:52:00on nie publikuje, on cytuje coś co już jest opublikowane przez Google’a
Co nie zmienia faktu że troche chamskie jest takie publikowanie, mógł ocenzurować kawałek adresów, bo teraz sobie ktoś szybciutko tylko OCRem bo tym obrazku przejedzie ;)
remiq, 17 maja 2009, 15:10:58I najlepiej żeby jeszcze poprzestawiał litery. A potem opublikował hashe tych adrestów, najlepiej sha1 z tylko sobie znanym kluczem. A że napisał, jak można wyciągnąć wszystkie maile w kilka minut? Nie, przecież każdy wolałby użyć OCRów, zamiast pisać pięciominutowy skrypt, right? :>
Google google’ami, ale jeśli chodzi o grupy nntp, to jest wiele innych serwisów, które nic nie robią w celu zabezpieczenia adresów e-mail. Jeśli samemu się o to nie zadba, to w niedługim czasie możemy być (jeśli skorzystamy)szczęśliwymi posiadaczami zegarka albo powiększyś sobie o 40%... objętość włosów :)
Coolm@x: Myślę, że dosyć powszechnie wiadomo, że inni nie ukrywają w żaden sposób adresów e-mail. Ot taki przykład prosto z brzegu – Debian. Sytuację Googli chciałem uwypuklić (choć przyznaję, że nie mam zbyt wielkiego talentu pisarskiego), żeby pokazać, jak w głupio prosty sposób można zaprzepaścić dorobek współpracowników.
Bakus, 17 maja 2009, 18:35:15Nie potrzeba wielkich filozofii by zdobyć adresy email … wystarczy lekko zmodyfikować skrypty z cvs.php.net i uruchomić preg_match_all dla każdej wiadomości. Przy szybkim łączu po godzinie ma się do dyspozycji tysiące adresów…