﷯ ﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯﷯ ﷯﷯﷯﷯Easy Install Instructions:﷯﷯﷯1. Copy the Code﷯﷯2. Log in t
o your Blogger account and go to "Manage Layout" from the Blogger Dashboard﷯﷯3. Click on the "Edit HTML" tab.﷯﷯4. Delete the code already in the "Edit Template" box and paste the new BLOGGER TEMPLATES AND TWITTER BACKGROUNDS ?

วันเสาร์ที่ 28 พฤศจิกายน พ.ศ. 2552

How search engine works




How search engine works
ข้อดีของอินเทอร์เน็ตก็คือการมีเว็บเพจต่างต่างนานา ให้เราได้เข้าไปดูได้เป็นร้อยๆ ล้านเว็บเพจ ในแต่ละเว็บเพจก็จะแสดงข้อมูลจำนวนมากมายของหัวข้อต่างๆ แต่ทว่าการที่มีหน้าเว็บเพจจำนวนมากมายนี้ ก็กลับกลายเป็นข้อเสียที่มากมายยิ่งเช่นกัน ข้อเสียที่กกล่าวถึงข้างต้นก็คือมันเป็นการยาก และลึกลับ ซับซ้อนที่จะเข้าถึงหัวข้อเอกสาร หรือสิ่งที่เราสนใจโดยเฉพาะ วิธีการหนึ่งที่จะสามารถช่วยให้เราเข้าถึงข้อมูลเฉพาะที่ต้องการได้ก็คือการใช้บริการของ Search Engine ต่างๆ นั่นเอง

Search Engine คืออะไร

คือ เว็บไซต์พิเศษบนเว็บ ซึ่ง Search Engine นี้ได้รับการออกแบบมาเพื่อช่วยในการค้นหา หรือเข้าถึงข้อมูลซึ่งถูกเก็บอยู่ในไซต์ต่างๆ วิธีการทำงานของ Search Engine ก็จะแตกต่างกันออกไป ขึ้นอยู่กับระบบของ Search Engine แต่ละตัว แต่โดยรวมๆ แล้วจะดำเนินการ 3 อย่างหลักๆ ได้แก่
1) ค้นหาข้อมูลจากอินเตอร์เน็ต โดยยึดพื้นฐานจากคำที่เราใส่ลงไป
2) แสดงดรรชนีข้อมูลที่ได้จากการค้นหาคำที่พิมพ์ลงไป รวมทั้งแสดงที่อยู่ (URLs หรือ Address) ของหน้าที่ค้นหามา
3) ผู้ใช้สามารถเข้าไปดูลิงค์ต่างๆ ที่เกี่ยวข้องได้

การเริ่มต้นของ Search Engine

ในตอนเริ่มแรกนั้น Search Engine ครอบคลุมเพียงแค่หนึ่งแสนเพจของแต่ละเอกสารเท่านั้น และยอมรับเพียงหนึ่งหรือสองพันการค้นหาต่อวัน ในปัจจุบันนี้ Search Engine ได้มีประสิทธิภาพ จะสามารถแสดงดรรชนีข้อมูลที่ได้จากการค้นหาคำที่พิมพ์ลงไปจำนวนหลายร้อยล้านหน้า และตอบสนองการค้นหาได้ถึงสิบล้านความต้องการต่อวันเลยทีเดียว
ในที่นี้กลุ่มของข้าพเจ้าขอนำเสนอการทำงานของ Search Engine ต่างๆ ว่า มีหลักการทำงานอย่างไร และมันทำอย่างไรจึงทำให้เราสามารถเข้าไปค้นหาข้อมูลที่ต้องการจากเว็บต่างๆ ได้
เมื่อเราพูดถึง Search Engine ก็คงจะหมายถึง World Wide Web Search Engine นั่นเอง ก่อนที่เว็บ Search Engine จะเป็นอย่างที่เราเห็นในปัจจุบันนี้ ได้มีการพัฒนาระบบ Search Engine มาเรื่อยๆ เพื่อที่จะช่วยให้ผู้ใช้อินเตอร์เน็ตในการค้นหาข้อมูล โปรแกรมที่ใช้ก็เช่น Gopher, Archie แสดงดรรชนีของไฟล์ ซึ่งถูกเก็บอยู่ใน server ที่อยู่บนอินเตอร์เน็ต ทำให้สามารถลดระยะเวลาที่ใช้ในการค้นหาข้อมูลได้อย่างน่าทึ่งใจ

ในที่นี้เราขอจำกัดขอบเขตของเนื้อหาไว้เพียงแค่การทำงานของ Search Engine และ Search Engine ตัวต่างๆ ที่น่าสนใจเท่านั้น



An Itsy – Bitsy Beginning

ก่อนที่ Search Engine จะสามารถบอกเราได้ว่าไฟล์ หรือข้อมูลที่เราต้องการอยู่ที่ไหน มันต้องทำการค้นหาข้อมูลก่อน และการที่จะค้นหาข้อมูลบนเว็บเพจที่มีเป็นร้อยๆ ล้านเพจนั้น Search Engine จึงต้องใช้ซอฟต์แวร์พิเศษที่มีชื่อว่า ‘Spiders’ เพื่อที่จะสร้างรายการของคำที่ค้นหาได้บนเว็บไซต์ เมื่อซอฟต์แวร์พิเศษนี้กำลังสร้างรายการของมันด้วยกระบวนการทำงานที่เรียกว่า “Web Crawling” (ซอฟต์แวร์พิเศษนี้ยังมีข้อด้อยบางประการคือ การที่ต้องเสียเวลาส่งข้อมูลที่ค้นหาได้จากส่วนขาของแมงมุมไปที่ส่วนตัว ซึ่งทำหน้าที่เหมือนศูนย์กลางของการประมวลผลนั่นเอง)
เพื่อที่จะบำรุงรักษาให้รายการที่สร้างขึ้นมาใช้ได้อย่างมีประโยชน์ ซอฟต์แวร์พิเศษจะเริ่มต้นปฏิบัติการจากไซต์ที่ได้รับความนิยมก่อน การแสดงดรรชนีของข้อมูลที่ค้นหาได้บนเพจ และลิงค์ที่เกี่ยวข้อง ซึ่งค้นหาจากภายใน ด้วยวิธีการนี้ซอฟต์แวร์พิเศษนี้จึงเริ่มต้นและค้นหาได้อย่างรวดเร็ว โดยการแพร่กระจายไปยังส่วนต่างๆ ของเว็บนั่นเอง
กูเกิ้ลเป็นเจ้าแรกที่ศึกษาและพัฒนาระบบ Search Engine ขึ้นมา โดยเริ่มต้นศึกษาเกี่ยวกับ Search Engine แผนภาพข้างต้นอธิบายว่าระบบสร้างขึ้นอย่างไร Sergey Brin และ Lawrence Page ยกตัวอย่างง่ายๆ ของการทำงานที่รวดเร็วของซอฟต์แวร์พิเศษนี้ว่า เริ่มต้นด้วยการสร้างระบบที่จะใช้แมงมุมจำนวนมาก (ดโยปกติแล้ว 3 ตัว ต่อครั้ง) และที่การทำงานด้วยประสิทธิภาพสูงสุด จะใช้แมงมุม 4 ตัว แมงมุมแต่ละตัวจะค่อยๆ ครอบคลุม และเข้าถึงข้อมูลที่ผู้ใช้ต้องการ ทำให้สามารถครอบคลุมข้อมูลได้มากกว่า 100 หน้า/วินาที และก่อกำเนิดข้อมูลประมาณ 600 กิโลไบต์/วินาที
เพื่อรักษาไว้ซึ่งความรวดเร็วของการทำงาน การสร้างระบบที่ให้เฉพาะข้อมูลที่จำเป็นและสำคัญกับซอฟต์แวร์พิเศษจึงเริ่มขึ้น ในตอนแรกกูเกิ้ลใช้ server อื่นเป็น URLs แต่ต่อมาเพื่อประสิทธิภาพของการทำงานที่ดีกว่า และรวดเร็วกว่ากูเกิ้ลจึงได้ตั้งโดเมนเป็นของตนเอง เพื่อที่จะใช้เวลาในการค้นหา และเข้าถึงข้อมูลที่ผู้ใช้ต้องการให้น้อยที่สุดนั่นเอง

สิ่งที่กูเกิ้ลแสดง

1) คำที่ผู้ใช้ต้องการค้นหาในหน้านั้นๆ
2) ที่มา (URLs หรือ Address) ของหน้าที่ทำการค้นหามา.

คำที่ถูกค้นหามักจะเป็น ชื่อเรื่อง หัวเรื่อง หน้าที่เกี่ยวข้องซึ่งมีความสำคัญ หรือมีความสัมพันธ์กับคำที่เป็นฐานในการค้นหา ระบบของกูเกิ้ลจะสร้างดรรชนีที่สำคัญๆ เกี่ยวกับคำที่ค้นหาบนหน้าเว็บเพจไว้ด้วย

Mega tag
Meta tag จะอนุญาตให้เจ้าของงานเฉพาะเท่านั้นหรือดูไดแค่สารบัญ มันสามารถช่วยได้แม้ในกรณีมีความหมาย 2-3 วลี meta teg ยังสามารถเป็นตัวชี้นำคำที่มีปัญหาไปสุ่คำตอบที่ถูกต้อง แต่ โปรแกรมนี้ก็ยังพบปัญหาอยู่ที่ความเชื่อมั่นในตัวมันมากๆคือเมื่อมันทำงาน spider จะคลุมไวรัส ทำให้มีปัญหาในส่วนนี้
การสร้างดรรชนี
Spider สามารถค้นหางานต่างๆที่คุณต้องการในเวปต่างๆได้ดี และมีข้อมูลต่างๆที่ผู้ใช้ควรรู้อยู่ 2 หัวข้อ 1. ข้อมูลเกี่ยวกับระบบ 2. กรณีที่ ข้อมูลเป็นดรรชนี
ในกรณีแรก การค้นหา สามารถเก็บคำ และ url ที่ที่มันค้นพบและไม่มีทางที่จะบอกคำที่มีความสำคัญที่ต้องการด้วยเป็นอันดับความสำคัญ
การที่จะใช้ให้ได้ประโยชน์สูงสุด ควรจะกำหนดตัวเลขในการปารกฎ จะได้ความหมายเป็นอันดับ และเรียงตามความสำคัญ
Building a search
การค้นหาผ่านทางหนังสือที่เกี่ยวข้องกับคำที่ต้องการค้นหาของผู้ใช้และ กี่ยอมรับผ่านทาง search engine โดยคำถามที่ถามอาจจะเป็นคำภามง่ายๆ เช่นคำพยางค์ๆเดียวก็ได้ การที่จะค้นหาคำถามที่มีลักษณะซับซ้อนกันมากจำเป็นต้องใช้ประโยชน์ของ Boolean operators เพื่อที่จะขัดเกลาคำถามของคุณให้มีช่วงการค้นหาคำตอบที่กว้างขึ้น
Boolean operators โดยทั่วไปที่มักจะรู้จักก็คือ
And- ทุกๆคำจะถูกให้มีส่วนร่วม โดย AND และจะปรากฏลงบนทุกๆหน้าของเอกสาร
Or- อ อย่างน้อยคำหนึ่งคำในคำถามจะถูกใหม่มีส่วนร่วมกับคำว่า or และจะปรากฏลงบนทุกๆหน้าของเอกสาร
not- คำที่ตามด้วยคำว่า not จะไม่ปรากฏลงในหน้าของเอกสาร
Near- เป็นคำๆหนึ่งที่ต้องถูกกำหนดค่าจำนวนของพยางค์
quotation mark- คำหลายคำๆระหว่าง เครื่องหมายคำถาม จะถูกแทนด้วยวลี และวลีนั้นจะต้องพบในเอกสารด้วย
Searching for sport
เครื่องมือในการช่วยค้นหาได้เข้ามาเป็นส่วนหนึ่งของการดำรงชีวิต อย่างน้อยได้มีเกมๆหนึ่งได้วิวัฒนาการเรื่องมีนี้ใน google คุณพิมคำลงไปใน เซิทร์เอนจิน ด้วยความหวังที่ว่าคุณได้รับในสิ่งที่คุณกำลังค้นหาอยู่นี่คือการพยายามที่แจ่มแจ้งนี่เป็นงานที่ค่อนข้างยาก คุณจะต้องเลือกคำที่ไม่มีความสัมพันกันหรืออย่างอื่น ผลที่ออกมาคือคุณจะได้รับผลการค้นหาที่มากมายและที่แน่นอนคือมากกว่า1ผลการค้นหา แต่ในทางกลับกันด้วยที่คุณพิมพ์คำที่ไม่มีความหมายเหมือนกันเลย ผลที่คุณจะได้ก้อคือ0ถ้าเกิดคุณประสบความสำเร็จคุณสามารถส่งมันไปที่www.googlewhack.com,ที่ที่ประกาศความสามรถให้คนอื่นได้รับรู้
Future search
โปรแกรมค้นหาคำถูกกำหนดรูปแบบโดย Boolean operators ในลักษณะการค้นหาตัวอักษร โปรแกรมจะค้นหาวลีที่เราต้องการหา มันอาจจะมีปัญหาถ้าคำที่เราต้องการหามีหลายความหมาย เช่น ขัน อาจจะหมยถึง ภาชะตักน้ำ แต่บางครั้งก็อาจจะหมายถึง เสียงร้องของไก่ตอนเช้าๆ ถ้าคุณสนใจเพียงแค่ความหมายที่คุณต้องการเพียงสิ่งเดียว บางทีคุณอาจจะไม่ต้องการความหมายที่เหลือ เพราะฉะนั้น คุณอาจจะพิมพ์ตัวอักษรที่ใช้ในการห้อมูลที่เหมาะสมลงไปเพื่อตัดตรงส่วนที่เราไม่ต้องการ แต่มันอาจจะเป็นสิ่งที่ดีมากๆถ้าเครื่องมือค้นหา หรือ search engine นั้นสามารถหาคำที่เราต้องการค้นหาได้เลย

0 ความคิดเห็น: