สมัครสมาชิก   เข้าระบบ  
note by wwibul
อ่าน: 211
เว็บ ดอท โครม

เรื่องเริ่มต้นตอนผมเขียน Spam Test-Kit แบบบ้าน ๆ  ในวง share.psu.ac.th เล่าว่า เรามีวิธีสร้างระบบตรวจจับปัญหาช่องโหว่การโพสท์เนื้อหาไม่เหมาะสมเข้าในเว็บที่เราเกี่ยวข้องอยู่ ได้อย่างไร


ทำให้นึกขึ้นได้ว่า search engine อย่าง google นี้ อาจช่วยให้เราสร้างตัวชี้วัด ให้เราก้าวไปถึงขั้น เว็บหกดาว  ได้อย่างไร

สรุปสั้น ๆ วิธีคือ ใช้ google ค้นวลีที่เป็นสแปมยอดนิยม (ดูในรูป - ผมจะไม่พิมพ์วลีดังกล่าวเป็นข้อความไว้ จะได้ไม่ทำให้ gotoknow โดนปนเปื้อนไปด้วย) เจาะแต่ในโดเมนที่สนใจ

รายละเอียดยาวกว่านี้ ลองไปอ่านตาม link ที่ใส่ไว้เองนะครับ

ผมเปรียบเทียบโดเมน .or.th, .co.th, .ac.th และ .go.th ได้ผลดังภาพที่แสดงไว้

หน้าเว็บไหน มีวลีดังกล่าว (ชื่อยาที่โฆษณาขายผ่านเว็บ) แสดงว่า โดนสแปมปนเปื้อนไปเรียบร้อย

 

ข้อสรุปน่าสนใจครับ

.or.th (organization domain) สะอาดกว่าเพื่อน

แต่ .co.th (commercial domain) ก็จี้ติด ๆ ตามมา พร้อม .ac.th (academic domain) แบบติด ๆ เส้นยาแดงผ่าแปด

แต่ .go.th (government domain) ดูเหมือนจะถูกปล่อยทิ้งไว้แบบไม่ใส่ใจ มีสแปมเข้มข้นแพร่ไปรุนแรงกว่าโดเมนอื่น (วัดตาม % ที่ปนเปื้อน) ถึง 15 เท่า

 

สร้าง: ศ. 25 ก.ค. 2551 @ 21:20   แก้ไข: ศ. 25 ก.ค. 2551 @ 21:30   ขนาด: 2906 ไบต์
ความคิดเห็น
P
1. ภูสุภา
เมื่อ ศ. 25 ก.ค. 2551 @ 21:26
758497 [ลบ]

ยาจรุงใจอีกตัว x_a_n_a_..

เข้าข่ายด้วยใช่มั้ยคะ

P
2. wwibul
เมื่อ ศ. 25 ก.ค. 2551 @ 21:30
758510 [ลบ]

สวัสดีครับ คุณหมอ P จริยา

 

  • นั่นก็ด้วยครับ แต่ไม่บ่อยเท่าสองตัวแรก
  • ถ้าใช้วลีขยะยาวมากแล้วเจอ แสดงว่า อาการเว็บนั้น น่าเป็นห่้วงมาก
ชื่อ:
อีเมล:
IP แอดเดรส: 38.103.63.56
  เรียกใช้งานตัวจัดการข้อความ
ข้อความ:
 
รหัสสุ่ม: (ใส่รหัสสุ่มที่แสดงไว้ด้านบน)
  ยกเลิก
บันทึกอื่นๆ
สัพเพเหระ บันทึกเรื่องเบา ๆ เรื่องไร้สาระ บันทึกผ่อนคลายอารมณ์ บันทึกเรื่องตลกขบขัน บันทึกโรแมนติก บันทึกบันเทิงใจแกมไร้สาระ ก็พอจะมีอยู่บ้างนิดหน่อย พอเป็นน้ำจิ้ม ที่เหลือ มักจะหนัก ถึงหนักมาก