Skip to: Site menu | Main content

Autor

Chłopak z Bałut (Dołów), po uniwerku i stypendium. Wiecznie zestresowane, przemądrzałe bezguście. Więcej na stronie domowej.

Adresy e-mail web developerów z Polski

Czepianie, Klepanie, Techblog

Dzisiaj, w sposób zupełnie przypadkowy, znalazłem sposób na sporządzenie listy adresów e-mail web developerów z Polski. Oczywiście nie wszystkich. Ale w ciągu kilkunastu minut udało mi się ich znaleźć ponad 500. Zanim pokażę, jak to zrobić, krótka dygresja.

Google, jak wiadomo, bardzo dba o to, żeby adresy e-mail użytkowników ich serwisów nie dawały się zbyt łatwo wydobyć przy pomocy zautomatyzowanych harvesterów. I tak na przykład w wynikach wyszukiwania Google Groups adresy e-mail pojawiają się zapisane w taki oto sposób:
Google Group Search
Jakby tego było mało, adresy są również ukrywane w treści wiadomości:
Google Groups e-mail obfuscation

I to właśnie wydaje mi się fascynujące - jak wiele wysiłku można włożyć w zabezpieczenia, żeby potem inna grupa pracowników firmy wydała adresy e-mail twórców gadgetów Google... ot tak: Google Gadget search

Około piętnastu minut zajęło mi przygotowanie skryptu, który przy pomocy wgeta (tu trzeba pamiętać o ustawieniu User-Agent), grepa, seda, pythona (urllib) i tr'a (strona wyników nie zawiera znaków nowego wiersza) wybiera listę 550 adresów e-mail. A to próbka, na dowód:
adresy e-mail

Mój adres również się wśród nich znajduje - tak właśnie na to trafiłem. Ciekaw jestem, czy kreatywny pracownik firmy, który wpadł na "genialny" pomysł dodania zlokalizowanych rekordów do bazy adresowej Google Maps, zgarnął za to premię :)

17 maja 2009, 13:00:38

Komentarze

Wasacz, 17 maja 2009, 13:08:29

Nie żebym był na liście, ale nie podobałoby mi się, gdyby ktoś mój adres publikował, nawet jako obrazek.

siefca, 17 maja 2009, 13:52:00

on nie publikuje, on cytuje coś co już jest opublikowane przez Google’a

pecet, 17 maja 2009, 13:56:48

Co nie zmienia faktu że troche chamskie jest takie publikowanie, mógł ocenzurować kawałek adresów, bo teraz sobie ktoś szybciutko tylko OCRem bo tym obrazku przejedzie ;)

remiq, 17 maja 2009, 15:10:58

I najlepiej żeby jeszcze poprzestawiał litery. A potem opublikował hashe tych adrestów, najlepiej sha1 z tylko sobie znanym kluczem. A że napisał, jak można wyciągnąć wszystkie maile w kilka minut? Nie, przecież każdy wolałby użyć OCRów, zamiast pisać pięciominutowy skrypt, right? :>

Coolm@x, 17 maja 2009, 17:31:14

Google google’ami, ale jeśli chodzi o grupy nntp, to jest wiele innych serwisów, które nic nie robią w celu zabezpieczenia adresów e-mail. Jeśli samemu się o to nie zadba, to w niedługim czasie możemy być (jeśli skorzystamy)szczęśliwymi posiadaczami zegarka albo powiększyś sobie o 40%... objętość włosów :)

rzyjontko, 17 maja 2009, 18:16:51

Coolm@x: Myślę, że dosyć powszechnie wiadomo, że inni nie ukrywają w żaden sposób adresów e-mail. Ot taki przykład prosto z brzegu – Debian. Sytuację Googli chciałem uwypuklić (choć przyznaję, że nie mam zbyt wielkiego talentu pisarskiego), żeby pokazać, jak w głupio prosty sposób można zaprzepaścić dorobek współpracowników.

Bakus, 17 maja 2009, 18:35:15

Nie potrzeba wielkich filozofii by zdobyć adresy email … wystarczy lekko zmodyfikować skrypty z cvs.php.net i uruchomić preg_match_all dla każdej wiadomości. Przy szybkim łączu po godzinie ma się do dyspozycji tysiące adresów…

Treść komentarza można formatować zgodnie ze składnią Markdown.
Odpowiedzi śledzić można przy pomocy RSS RSS .