Lemat, strona prywatna

Spam guestbookowy

Internet jest dzisiaj zaczepiście popularny, każdy dzieciak chce mieć teraz własną stronę (albo dostał takie zadanie domowe). A do strony najlepiej mieć guestbooka, aby ziomale mogli się wpisywać. Guestbooka najlepiej ściągnąć z sieci, jest kilka gotowców, tu kliknąć, tam kliknąć i już gotowe.

Niestety, spamerzy dostrzegli w tym swoją szansę i zaczeli wykorzystywać guestbooki do nabijania sobie rankingu strony. Jak szukacie czegoś w googlach, to rezultat wyszukiwania najpierw jest dobierany na podstawie dopasowania tego, co chcecie wyszukać z tym, co jest prezentowane na stronie. A następnie wynik jest sortowany według rankingu strony (ang. page rank). Ta strona, która ma najwyższy ranking jest na pierwszym miejscu. Ranking jest tym wyższy im więcej linków prowadzi do tej strony. Są jeszcze inne kryteria, ale o nich nie będę tu pisał.

Guestbooki przeważnie umożliwiają użytkownikom na wpisywanie adresów swoich stron www. I właśnie to wykorzystują spamerzy.


Jak się przed tym bronić?

Spamerzy wykorzystują wyszukiwarki aby znaleźć podatne guestbooki. Dlatego też należy robotom zabronić indeksowania naszego guestbooka. Można to zrobić na 2 sposoby:

1) umieścić robots.txt w katalogu głównym serwisu o zawartości

User-agent: *
Disallow: /guestbook

2) w sekcji HEAD dokumentu HTML umieścić specjalne meta tagi:

<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">


Jeżeli nasz guestbook już padł ofiarą spamerów to należy zmienić nazwę katalogu oraz nazwy skryptów odpowiedzialnych za dodawanie nowych pozycji i zabronić robotom indeksowania tych katalogów / plików.

Fajnie by było jakby wysłać do abuse@ ISP danego spamera informację, że taki a taki drań spamuje załączając kopię tych wpisów.

Jeżeli piszemy własnego guestbooka to należy pamiętać o kilku rzeczach:

1) zabronić umieszczania kodu HTML w treści wiadomości, w PHP służy do tego funkcja strip_tags()

2) wszelkie linki dodawać z parametrem rel="nofollow"

3) wymusić moderację - wiadomość zanim się pojawi musi zostać obejrzana i zaaprobowana przez właściciela guestbooka.

4) ewentualnie dodać test Turinga - "wpisz tekst z obrazka" lub "rozwiąż problem" np. (1+5=?) - tak aby tylko człowiek mógł ten test przejść.

5) Należy zapisywać numer IP (łącznie z tym, co poda serwer proxy) - łatwiej wtedy dotrzeć do spamera.

6) zrobić listę adresów IP oraz listę domen z gatunku "tych panów tu nie przyjmujemy"

7) pomimo tego, że niektórzy wyłączają sobie w przeglądarkach wysyłanie tzw. referera oraz, że tą zmienną można łatwo sfałszować - należy go sprawdzać - zapobiega to jednej z form ataku kiedy to niewinny user przebywając na spamerskiej stronie spamuje guestbooki osób trzecich. Tym typem ataku posługuje się Dmitriy Soldatenko lub Sid Wongvorakul (trudno powiedzieć co jest jego prawdziwym nazwiskiem)

Apropos tego spamera - google wskazuje około 18 tysięcy zaspamowanych przez niego guestbooków.

Data utworzenia : 2005-05-18, data aktualizacji :2008-06-07

Skomentuj ten tekst

Komentarze:

lolo
2009-05-20 21:20:52
Istnieje spam zarówno guestbookowy jak i komentarzowy. :-)
Istnieje spam zarówno guestbookowy jak i komentarzowy. :-) Przykładem może być gdybym teraz wpisał coś na temat stron typu redtube i wiele innych. Po jakimś czasie i ta strona będzie się pojawiać po wpisaniu w google redtube.
Odpowiedź Lemata:
taaa, na szarym końcu 12 milionów wyników...
an0nim
2007-09-03 15:04:06
spam guestbookowy
Wpisujesz (zapewne) automatem swój URL do 40 000 guestbooków? I mówisz, że spam guestbookowy nie istnieje? Nie wpisuję URL, tylko piszę że strona mi się podoba, dziękuję za informacje itp. a przy okazji podaję URL w polu formularza do tego przeznaczonym (nie w treści wiadomości). W Google to za bardzo nie pomaga (cały czas PR0), ale w Live i Yahoo strona pozycjonowana w ten sposób jest na pierwszym miejscu. A tak w ogóle to skąd ci się to wzięło, że spam poznaje się tylko i wyłącznie po przytoczonej treści? A po czym innym poznaje się spam? Moja wiadomość wygląda tak samo jak każda inna w guestbooku. Przecież nie można twierdzić że wiadomość jest spamem bo została wysłana z adresu IP x.x.x.x albo bo pole URL tej wiadomości nie jest puste. Pisanie ogłoszeń w komentarzach blogowych, wiki, postach na forum uważam za spam. W guestbookach czy w userprofilach nie. Mój automat ma program do parsowania bazy (Hrefer) i wszystko co nie jest guestbookiem usuwam.
Odpowiedź Lemata:
I byłeś na każdej z tych 40k stron, i każda ci się podobała? Wiesz co? Ja chyba dziś za mało kawy piłem, czy ty usiłujesz mi wmówić, że twój spam nie jest tak naprawdę spamem?
an0nim
2007-09-01 17:08:37
guestbook spam
Nie znalazłem nigdzie definicji "guestbook spam", ale według mnie wiadomości o treści "Your website is great" itp. nie są spamem. Spam to np. "visit my website (adres)" czy używanie html/bbcode w guestbooku, który ma to wyłączone. Zresztą w tych czasach nikt na sensownej stronie nie robi guestbooka, tylko system komentarzy albo forum dyskusyjne. Na ten honeypot /guestbook/addentry.php na subdomenie guestbook. w ogóle coś dostajesz? Bo np. XRumer wysyła GET przed POST i wyświetla tylko "not a guestbook".
Odpowiedź Lemata:
tak, dostaję. A tak w ogóle to skąd ci się to wzięło, że spam poznaje się tylko i wyłącznie po przytoczonej treści?
an0nim
2007-09-01 14:11:50
spam guestbookowy nie istnieje
Coś takiego jak spam guestbookowy nie istnieje. Ja wpisuję na przykład "your website has a very good design" w 40k guestbookach, przecież do tego guestbooki zostały stworzone. Pole URL jest po to, żeby tam podać adres swojej strony, więc podaję tam adres.
Odpowiedź Lemata:
załóż może sobie jakiegoś guestbooka to pogadamy. Wpisujesz (zapewne) automatem swój URL do 40 000 guestbooków? I mówisz, że spam guestbookowy nie istnieje?
Mr
2005-07-14 16:05:31
blad merytoryczny :-)
"Ta strona, która ma najwyższy ranking jest na pierwszym miejscu." tak bylo moze jakis rok temu :-) Szanowny Autor ma nieaktualne informacje. Strona moze miec nawet PR=6 i nie byc nr 1 pod dane slowo lub fraze. Co wiecej - pod to samo haslo pierwsza moze byc strona np. PR=3.
Odpowiedź Lemata:
Szanowny gość nie przeczytał zdania wcześniej "rezultat wyszukiwania najpierw jest dobierany na podstawie dopasowania tego, co chcecie wyszukać z tym, co jest prezentowane na stronie"
wszystkie opinie »
określ jak bardzo twoje strony trzymają się standardu w3c:
Protected by spf
[Nospam-PL.NET]
Seti@Home
www.php.net
© Lemat 2004 - ∞
Cookie Bullshit
Mapa strony
engine: lem.. at lemat·priv·pl