VIPAVADEE KOKAPAN: การแจกแจงตัวอย่างsample distribution

การแจกแจงตัวอย่างsample distribution

ตัวอย่างโดยใช้ความน่าจะเป็นมี 4 วิธี คือ
2.1 การสุ่มตัวอย่างแบบง่าย(Simple random Sampling)
2.2 การสุ่มตัวอย่างแบบมีระบบ (Systematic sampling)
2.3 การสุ่มตัวอย่างแบบแบ่งชั้นภูมิ (Stratified Sampling)
2.4 การสุ่มตัวอย่างแบบกลุ่ม (Cluster Sampling)

2.1 การสุ่มตัวอย่างแบบง่าย(Simple random Sampling)
เป็นการสุ่มตัวอย่างที่สมาชิกของกลุ่มประชากรทุก ๆ หน่วยมีโอกาสเท่า ๆ กัน และเป็นอิสระต่อกันในการที่จะได้รับ เลือกมาเป็นสมาชิกของกลุ่มตัวอย่าง การสุ่มวิธีนี้อาจจะทำได้โดย

1.การจับสลาก
วิธีนี้ใช้ได้ดีสำหรับประชากรที่มีขนาดเล็ก โดยมีวิธีคือ จะต้องเขียนชื่อหรือหมายเลขแทนหน่วยต่างๆ ของประชากรลงในฉลากให้ครบ จากนั้นนำใส่กล่อง แล้วจับฉลากที่คละกันนั้นตามจำนวนที่ต้องการ เช่น นักศึกษาห้องหนึ่งมี 30 คน ต้องการให้รางวัลปีใหม่กับนักศึกษาห้องนี้จำนวน 5 รางวัล โดยใช้วิธีการจับฉลาก
ถ้าเป็นการสุ่มตัวอย่างแบบใส่คืนจำนวน 5 รางวัล ดังนั้นอาจจะมีนักเรียนบางคนที่ได้รางวัลหลายรางวัล แต่ถ้าเป็นการสุ่มตัวอย่างแบบไม่ใส่คืนจำนวน 5 รางวัล จะมีนักเรียนที่ได้รางวัลดังกล่าวจำนวน 5 คน

2.ตารางเลขสุ่ม (Table of random number)
วิธีนี้เหมาะสำหรับประชากรขนาดใหญ่ และทราบจำนวนที่แน่นอน โดยมีวิธีคือ ให้หมายเลขแก่ทุกหน่วยของประชากร โดยให้จำนวนหลักของหมายเลขเท่ากับหลักของจำนวนประชากร จากนั้นสุ่มหน่วยตัวอย่างโดยการดูหมายเลขจากตารางเลขสุ่ม (ตารางเลขสุ่มเป็นตารางที่ประกอบไปด้วย ตัวเลขที่เรียงแบบไม่เจาะจงตามแถวและคอลัมน์ต่างๆ) โดยที่จะเริ่มที่แถวใดหรือคอลัมน์ใดก็ได้ แล้วแต่ผู้เลือกเป็นผู้กำหนด อ่านค่าไปจนครบตามจำนวนที่ต้องการ

เช่น ถ้าต้องการเลือกตัวอย่างขนาด 10 จากประชากรที่มีขนาด 1,000
ขั้นที่ 1 ให้หมายเลขแก่ประชากร ตั้งแต่ 0001, 0002, . . . , 1000
ขั้นที่ 2 จากนั้นสุ่มเลือกตัวอย่างจากตารางเลขสุ่ม โดยจะเริ่มที่แถวใดคอลัมน์ใดก็ได้ สมมติในที่นี้เริ่มที่แถวที่ 5 คอลัมน์ที่ 1,2 อ่านค่าจากซ้ายมือไปขวามือ แล้วจึงเริ่มเลข 4 หลักของแถวที่ 6 คอลัมน์ที่ 1,2 ต่อไป ตามลำดับจนครบตามจำนวนที่ต้องการ คือ 0474, 0163, 0782, 0130, 0647, 0962, 0792, 0676, 0744, 0273

2.2 การสุ่มตัวอย่างแบบมีระบบ (Systematic sampling)
เป็นการสุ่มตัวอย่างที่หน่วยตัวอย่างของกลุ่มประชากรมีการจัดเรียงไว้แบบสุ่มอยู่แล้ว เช่น รายชื่อของนักศึกษาเรียงตามรหัสนักศึกษาหรือตามตัวอักษร ครัวเรือนเรียงตามเลขที่บ้าน เป็นต้น การสุ่มแบบนี้จะทราบว่ามีขนาดประ ชากรเท่าใดแล้วให้หมายเลขประชากร จากนั้นผู้วิจัยต้องกำหนดขนาดของกลุ่มตัวอย่าง ต่อไปก็หาช่วงของการสุ่ม(Sampling interval)
ซึ่งมีสูตรดังนี้ N/n โดยที่ N คือ ขนาดของประชากรที่สนใจศึกษา และ n คือ ขนาดของกลุ่มตัวอย่าง ดังนั้น หน่วยตัวอย่างที่ตกอยู่ในทุกๆช่วงของการสุ่ม (Sampling interval) จะเป็นสมาชิกของกลุ่มตัวอย่างขั้นต่อไปก็หาหน่วยเริ่มต้น ซึ่งกระทำโดยการสุ่ม

ตัวอย่าง เช่น ขนาดประชากรเท่ากับ 134 จะสุ่มตัวอย่างขนาด 10 ถ้าใช้วิธีการนี้จะมีขั้นตอนคือ
ขั้นที่ 1 คำนวณหาช่วงการสุ่ม ได้จาก 134/10 = 13.4 ประมาณ 13
ขั้นที่ 2ให้หมายเลขแก่ประชากรตามรายชื่อที่เรียงลำดับอยู่แล้วโดยเริ่มจาก 001
ไป จนถึง ประชากรคนสุดท้าย คือ 134
ขั้นที่ 3สุ่มหน่วยเริ่มต้น จากหมายเลข 1 – 13 ซึ่งอาจใช้วีธีสุ่มอย่างง่าย สมมติว่า ได้หน่วยเริ่มต้น เป็น 008
ขั้นที่ 4หาหน่วยตัวอย่างต่อๆไป จนได้ครบตามจำนวนที่ต้องการ (ดังนั้นกลุ่มตัวอย่างที่ได้ คือประชากรที่มีหมายเลข 008,021,034………..125)

2.3 การสุ่มตัวอย่างแบบแบ่งชั้นภูมิ (Stratified Sampling)
เป็นการสุ่มตัวอย่างที่ประชากรมีความแตกต่างกันมาก ดังนั้นจึงแบ่งประชากรเป็นกลุ่มย่อยๆ โดยจะเรียกแต่ละกลุ่มย่อยว่า ชั้นภูมิ (Stratum) โดยมีหลักในการจัดแบ่งชั้นภูมิคือให้ประชากรที่อยู่ในชั้นภูมิเดียวกันจะมีลักษณะที่คล้ายคลึงกันมากที่สุด (Homogeneous) และประชากรที่อยู่ต่างชั้นภูมิกันจะมีความแตกต่างกันมาก (Heterogeneous) และแต่ละหน่วยของประชากรจะต้องอยู่ชั้นภูมิใดชั้นภูมิหนึ่งเท่านั้น โดยการเลือกตัวอย่างจะเลือกจากแต่ละชั้นภูมิอย่างเป็นอิสระกัน และการสุ่มตัวอย่างในแต่ละชั้นภูมิอาใช้วิธีต่างกันก็ได้ เช่นชั้นภูมิที่ 1 อาจใช้การสุ่มตัวอย่างอย่าง่าย ชั้นภูมิที่ 2 อาจใช้การสุ่มตัวอย่างแบบมีระบบก็ได้
ตัวอย่าง ต้องการศึกษาการจัดการเรียนการสอนของโรงเรียนระดับประถมศึกษาในจังหวัดแห่งหนึ่ง จำนวน 100 โรงเรียน โดยแบ่งประชากรออกเป็น 3 ชั้นภูมิ คือโรงเรียนขนาดใหญ่ 30 โรงเรียน สุ่มตัวอย่างมา 3 โรงเรียน, โรงเรียนขนาดกลาง 30 โรงเรียน สุ่มตัวอย่างมา 3 โรงเรียน, และโรงเรียนขนาดเล็ก 40 โรงเรียน สุ่มตัวอย่างมา 4 โรงเรียน ลักษณะแผนภาพของการสุ่มโดยวิธีนี้ คือใช้แผนภาพประกอบ เพื่อให้เกิดความเข้าใจง่ายยิ่งขึ้นดังนี้
การสุ่มตัวอย่างแบบกลุ่ม (Cluster Sampling)
เป็นการสุ่มตัวอย่างที่แบ่งประชากรออกเป็นกลุ่มย่อยโดยให้ประชากรที่อยู่ในกลุ่มเดียวกันมีลักษณะที่ หลากหลายหรือมีลักษณะที่แตกต่างกันมากที่สุด และให้ประชากรระหว่างกลุ่มมีลักษณะที่คล้ายคลึงกันมากที่สุด การเลือกตัวอย่างอาจจะสุ่มเลือกแต่บางกลุ่มย่อยเท่านั้นการสุ่มตัวอย่างวิธีการนี้มีประโยชน์ตรงที่ถ้าการสุ่มตัวอย่างใน แต่ละหน่วยมีค่าใช้จ่ายสูง วิธีนี้จะช่วยลดค่าใช้จ่ายในการเก็บข้อมูล
ตัวอย่าง หน่วยงานของรัฐต้องการศึกษาว่าประชาชนในประเทศไทยนิยมเลี้ยงสัตว์ชนิดใด จึงได้แบ่งกลุ่มประชากรออกเป็น 76 จังหวัด โดยแต่ละจังหวัดประชาชนจะเลี้ยงสัตว์หลายประเภท นั่นคือ 1 จังหวัด คือ 1 กลุ่มย่อย จากนั้นก็สุ่มเลือกแค่บางจังหวัดมาเป็นตัวอย่างเพราะไม่ว่าจะเลือกจังหวัดใดมาก็จะได้ ประชากรทุกลักษณะมาพิจารณาแผนภาพประกอบเพื่อให้เกิดความเข้าใจง่ายยิ่งขึ้นดังนี้

การแจกแจงของฟังก์ชันที่ได้จากกลุ่มตัวอย่าง (Sampling Distribution)

ประชากร (population) คือ เซตของหน่วยตัวอย่าง (sampling unit) ทั้งหมด ในขอบเขตที่ต้อง
การศึกษา

หน่วยตัวอย่าง (sampling unit) คือ หน่วยที่เป็นแหล่งที่ให้ข้อมูล อาจเป็นคน สัตว์ หรือสิ่งของก็ได้

ตัวอย่าง (sample) คือ เซตของหน่วยตัวอย่าง (sampling unit) บางส่วนจากหน่วยตัวอย่างทั้ง
หมด หรือ ส่วนหนึ่งของประชากร

ตัวอย่าง
ถ้าต้องการสุ่มนักศึกษาจากมหาวิทยาลัยเทคโนโลยีราชมงคลธัญบุรีจำนวน 250 คน
ประชากร คือ นักศึกษาทุกคนจากมหาวิทยาลัยเทคโนโลยีราชมงคลธัญบุรี
ตัวอย่าง คือ นักศึกษาบางคน (250 คน) มหาวิทยาลัยเทคโนโลยีราชมงคลธัญบุรี
หน่วยตัวอย่าง คือ นักศึกษาจากมหาวิทยาลัยเทคโนโลยีราชมงคลธัญบุรี 1 คน

การแจกแจงความแตกต่างระหว่างค่าเฉลี่ยของตัวอย่างระหว่าง 2 ประชากร
( difference of sample mean between 2 population) ในกรณีที่เราสุ่มตัวอย่าง 2 กลุ่มจาก 2 ประชากรอย่างเป็นอิสระกัน ค่าที่เราสนใจใน เรื่องนี้ก็คือ ค่าความแตกต่างระหว่างค่าเฉลี่ยของตัวอย่าง เช่น สมมติเรามีประชากร 2 ประชากร ให้ประชากรกลุ่มแรกมีค่าเฉลี่ย และความแปรปรวน ประชากรที่สองมีค่าเฉลี่ย และความแปรปรวน ถ้าสุ่มตัวอย่างจากประชากรที่ 1 และที่ 2 มีขนาด n1 และ n2 อย่างอิสระต่อกันตามลำดับ ให้ เป็นค่าเฉลี่ยที่ได้จากกลุ่มตัวอย่างที่ 1 และที่ 2 ตามลำดับ การแจกแจงของความแตกต่างระหว่าง เรียกการแจกแจงความแตกต่างระหว่างค่าเฉลี่ยของตัวอย่าง

ตัวอย่าง
ถ้าต้องการสุ่มหลอดไฟยี่ห้อ A จากบริษัทผลิตหลอดไฟบริษัทหนึ่ง
ประชากร คือ หลอดไฟยี่ห้อ A ทุกหลอดจากบริษัทนี้
ตัวอย่าง คือ หลอดไฟยี่ห้อ A บางหลอดจากบริษัทนี้
หน่วยตัวอย่าง คือ หลอดไฟยี่ห้อ A 1 หลอด

5.2.2 พารามิเตอร์และค่าสถิติ

พารามิเตอร์ (parameter) คือ ค่าคงที่ที่แสดงลักษณะของประชากร หรือ ค่าที่คำนวณได้จาก
ประชากร

ค่าสถิติ (statistic) คือ ฟังก์ชันของตัวแปรสุ่ม หรือค่าที่คำนวณได้จากตัวอย่าง

สัญลักษณ์แทนพารามิเตอร์และสถิติของลักษณะต่างๆ ที่สำคัญ ได้แก่ประชากร

กลุ่มตัวอย่าง
กลุ่มตัวอย่างกลุ่ม(Sample)หมายถึง เป็นส่วนหนึ่งของประชากรที่ผู้วิจัยสนใจ กลุ่มตัวอย่างที่ดีหมายถึงกลุ่มตัวอย่างที่มีลักษณะต่างๆที่สำคัญครบถ้วนเหมือนกับกลุ่มประชากร เป็นตัวแทนที่ดีของกลุ่มประชากรได้
การใช้กลุ่มตัวอย่างมาศึกษาค่าสถิติ(statistics) ซึ่งเป็นลักษณะที่ได้จากการวิเคราะห์กับกลุ่มตัวอย่าง อาจจะมีความผิดพลาดได้เมื่อนำไปใช้ประมาณค่าพารามิเตอร์ (parameter) หรือลักษณะของประชากร (characteristics of population) บางครั้งค่าสถิติที่ได้อาจประมาณต่ำกว่าค่าพารามิเตอร์ (underestimation) หรือประมาณเกินกว่าความเป็นจริงของลักษณะประชากร (overestimation) ซึ่งถ้าทำการศึกษาโดยการเลือกกลุ่มตัวอย่างประชากรจากประชากรเดิม (parent population) ด้วยขนาดของกลุ่มตัวอย่างเท่าเดิมโดยวิธีการสุ่ม(random) และใช้หลักการสุ่มโดยอาศัยความน่าจะเป็น (probability sampling) ความแปรผันของการประมาณค่าพารามิเตอร์จากการแจกแจงค่าสถิติที่นำมาใช้ในการประมาณจะแปรผันตามขนาดของกลุ่มตัวอย่าง โดยการแจกแจงของค่าสถิตินี้จะมีลักษณะการแจกแจงเข้าสู่การแจกแจงปกติ (normal distribution) ซึ่งเรียกว่าการแจกแจงเชิงสุ่ม (sampling distribution) โดยค่าคาดหวังของค่าสถิติตจะมีค่าเท่ากับค่าพารามิเตอร์ ความแปรผันหรือความคลาดเคลื่อนในการประมาณค่า ให้เป็นความเคลื่อนแบบสุ่ม (random error) หรือเรียกว่าเป็นความคลาดเคลื่อนเนื่องจากการเลือกตัวอย่าง (sampling error) หรือเรียกว่าเป็นความคลาดเคลื่อนมาตรฐาน (standard error) (เชิดศักดิ์ โฆวาสินธ์. 2545 : 52)
ในการวิจัย นักวิจัยไม่ได้ศึกษากับกลุ่มตัวอย่างหลายๆกลุ่มจากประชากรเดียวกันเพื่อหาการแจกแจงเชิงสุ่ม แต่จะศึกษากับกลุ่มตัวอย่างเพียงกลุ่มเดียว เพื่อหาการการแจกแจงของกลุ่มตัวอย่าง และให้ใช้ ทฤษฎี central limit theorem เชื่อมโยงความสัมพันธ์ของการแจกแจงเชิงสุ่ม และการแจงแจงของประชากร ประมาณค่าพารามิเตอร์และค่าความคลาดมาตรฐานโดยระบุความมั่นใจหรือความคลาดเคลื่อนในการประมาณค่า ดังนั้นในการใช้กลุ่มตัวอย่างศึกษาแทนประชากรจำเป็นต้องคำนึงถึง ความถูกต้อง (accuracy) ในการเป็นตัวแทนที่ดีของประชากร ซึ่งหมายถึง การไม่มีอคติ(bias)ในตัวอย่างที่ถูกเลือก หรือกล่าวได้ว่าโอกาสของการเลือกตัวอย่างมาศึกษาเพื่อประมาณค่าพารามิเตอร์สูงหรือต่ำกว่าความเป็นจริงมีพอๆกัน นอกจากนี้ยังต้องคำนึงถึงความแม่นยำในการประมาณค่าพารามิเตอร์ (precision of estimate) ซึ่งความแม่นยำนี้สามารถวัดได้จากค่าความคลาดเลื่อนในการประมาณค่า โดยค่าความคลาดเลื่อนต่ำจะให้ความแม่นยำในการประมาณค่าสูง ซึ่งค่าความคลาดเคลื่อนนี้ขึ้นอยู่กับกระบวนการเลือกกลุ่มตัวอย่าง เป็นความคลาดเคลื่อนจากการเลือกหน่วยตัวอย่าง(sampling error) ที่คาดเคลื่อนไปจากค่าพารามิเตอร์
การเลือกกลุ่มตัวอย่างเพื่อเป็นตัวแทนของประชากรนั้นมีอยู่สองหลักการใหญ่คือ 1) หลักการอาศัยความน่าจะเป็น (probability sampling) หรือการเลือกอย่างสุ่ม (random selection) ซึ่งเป็นหลักการที่สมาชิกของประชากรแต่ละหน่วยมีความน่าจะเป็นในการถูกเลือกเท่าๆกันและทราบความน่าจะเป็นนั้น 2) ไม่ใช้หลักการความน่าจะเป็น (nonprobability sampling) เป็นการเลือกกลุ่มตัวอย่างที่ความน่าจะเป็นในการถูกเลือกของแต่ละหน่วยตัวอย่างไม่เท่ากัน หรือบางหน่วยมีโอกาสที่จะไม่ถูกเลือก

ดังนั้นในการจะเห็นได้ว่าในการที่จะได้ว่าถ้าเราเลือกกลุ่มตัวอย่างโดยอาศัยหลักความน่าจะเป็น จะทำให้การประมาณค่าพารามิเตอร์ได้แม่นยำกว่า

ขั้นตอนการเลือกกลุ่มตัวอย่าง

กำหนด/นิยามประชากรเป้าหมาย
รวบรวมสมาชิกทั้งหมดของประชากร
กำหนดหน่วยของการสุ่มตัวอย่าง
วางแผนการเลือกกลุ่มตัวอย่าง
ทำการเลือกกลุ่มตัวอย่าง

การกำหนดขนาดกลุ่มตัวอย่าง
1. กำหนดกลุ่มตัวอย่างโดยใช้เกณฑ์
จำนวนประชากรหลักร้อยใช้กลุ่มตัวอย่าง 15 – 30%
จำนวนประชากรหลักพันใช้กลุ่มตัวอย่าง 10 – 15%
จำนวนประชากรหลักหมื่นใช้กลุ่มตัวอย่าง 5 – 10 %

2.ใช้สูตรคำนวณ
2.1 กรณีไม่ทราบค่าพารามิเตอร์ ไม่ทราบจำนวนประชากร ทราบเพียงแต่ว่ามีจำนวนมาก
2.2 กรณีที่ทราบจำนวนประชากรและมีจำนวนไม่มาก
3.กำหนดขนาดกลุ่มตัวอย่างโดยใช้ตารางของ Krejcie and Morgan

เทคนิคการสุ่มกลุ่มตัวอย่าง
1.การสุ่มโดยไม่คำนึงถึงความน่าจะเป็น
ในบางครั้งการเลือกกลุ่มตัวอย่างโดยอาศัยความน่าจะเป็น โดยวิธีการสุ่มอาจจะไม่สามารถทำได้หรือทำได้ยาก การเลือกกลุ่มตัวอย่างโดยไม่อาศัยความน่าจะเป็นจึงถูกนำมาใช้ซึ่งการเลือกกลุ่มตัวอย่างแบบนี้จะมีลักษณะเป็นอัตวิสัย (subjective) ซึ่งมักจะทำให้การประมาณค่าพารามิเตอร์ขาดความแม่นยำ ดังนั้นในการเลือกกลลุ่มตัวอย่างแบบนี้มักจะใช้เมื่อไม่ต้องการอ้างอิงถึงลักษณะประชากร ส่วนใหญ่จะใช้กับงานวิจัยสำรวจข้อเท้จจริง (Exploration research) กับกลุ่มที่มีลักษณะเฉพาะและไม่ต้องการเปรียบเทียบกับกลุ่มอื่นๆ นอกจากนี้ยังมีเหตุผลทางด้านค่าใช้จ่ายและเวลา เพราะการเลือกตัวอย่างโดยไม่อาศัยความน่าเป็นจะมีค่าใช้จ่ายและเวลาน้อยกว่าอาศัยความน่าจะเป็น
1.1 การสุ่มโดยบังเอิญ (Accidental sampling) เป็นการสุ่มจาก
สมาชิกของประชากรเป้าหมายที่เป็นใครก็ได้ที่สามารถให้ข้อมูลได้ครบถ้วน การสุ่มโดยวิธีนี้ไม่สามารถรับประกันความแม่นยำได้ ซึ่งการเลือกวิธีนี้เป็นวิธีที่ด้อยที่สุด เพราะเป็นการเลือกตัวอย่างที่มีลักษณะสอดคล้องกับนิยามของประชากรที่สามารถพบได้และใช้เป็นอย่างได้ทันที
1.2 การสุ่มแบบโควตา (Quota sampling) เป็นการสุมตัวอย่างโดยจำแนก
ประชากรออกเป็นส่วนๆก่อน (strata)โดยมีหลักจำแนกว่าตัวแปรที่ใช้ในการจำแนกนั้นควรจะมีความสัมพันธ์กับตัวแปรที่จะรวบรวม หรือตัวแปรที่สนใจ และสมาชิกที่อยู่แต่ละส่วนมีความเป็นเอกพันธ์ ในการสุ่มแบบโควตา นี้มีขั้นตอนการดำเนินการดังนี้
1.2.1 พิจารณาตัวแปรที่สัมพันธ์กับลักษณะของประชากรที่คำถามการวิจัยต้องการที่จะศึกษา เช่น เพศ ระดับการศึกษา
1.2.2 พิจารณาขนาดของแต่ละส่วน(segment)ของประชากรตามตามตัวแปร
1.2.3 คำนวณค่าอัตราส่วนของแต่ละส่วนของประชากร กำหนดเป็นโควตาของตัวอย่างแต่ละกลุ่มที่จะเลือก
4. เลือกตัวอย่างในแต่ละส่วนของประชากรให้ได้จำนวนตามโควตา
1.3 การสุ่มตัวอย่างเฉพาะเจาะจง (purposive sampling) หรือบางครั้ง
เรียกว่าการสุ่มแบบพิจารณา (judgment sampling) เป็นการสุ่มตัวอย่างโดยใช้ดุลพินิจของผู้วิจัยในการกำหนดสมาชิกของประชากรที่จะมาเป็นสมาชิกในกลุ่มตัวอย่าง ว่ามีลักษณะสอดคล้องหรือเป็นตัวแทนที่จะศึกษาหรือไม่ ข้อจำกัดของการสุ่มตัวอย่างแบบนี้คือไม่สามารถระบุได้ว่าตัวอย่างที่เลือก จะยังคงลักษณะดังกล่าวหรือไม่เมื่อเวลาเปลี่ยนไป
1.4 การสุมกลุ่มตัวอย่างตามสะดวก (convenience sampling) การเลือกกลุ่ม
ตัวอย่างโดยถือเอาความสะดวกหรือความง่ายต่อการรวบรวมข้อมูล ข้อจำกัดของการสุ่มแบบนี้จะมีลักษณะเหมือนกับการสุ่มโดยบังเอิญ
1.5 การสุมตัวอย่างแบบสโนว์บอลล์ (snowball sampling) เป็นการเลือกตัวอย่างในลักษณะการสร้างเครือข่ายข้อมูล เรียกว่า snowball sampling โดยเลือกจากหน่วยตัวอย่างกลุ่มแรก (จะใช้หรือไม่ใช้ความน่าจะเป็นก็ได้) และตัวอย่างกลุ่มนี้เสนอบุคคลอื่นที่มีลักษณะใกล้เคียงต่อๆไป

ข้อจำกัดของการสุ่มโดยไม่อาศัยความน่าจะเป็น
1. ผลการวิจัยไม่สามารถอ้างอิงไปสู่ประชากรทั้งหมดได้ จะสรุปอยู่ในขอบเขตของกลุ่มตัวอย่างเท่านั้น ข้อสรุปนั้นจะสรุปไปหาประชากรได้ต่อเมื่อกลุ่มตัวอย่างมีลักษณะต่างๆที่สำคัญๆเหมือนกับประชากร
2. กลุ่มตัวอย่างที่ได้นั้นขึ้นอยู่กับการตัดสินใจของผู้วิจัยและองค์ประกอบบางตัวที่ไม่สามารถควบคุมได้ และไม่มีวิธีการทางสถิติอย่างไรที่จะมาคำนวณความคลาดเคลื่อนที่เกิดจากการสุ่ม (sampling error)

2. การสุ่มโดยการคำนึงถึงความน่าจะเป็น(probability sampling)
2.1 การสุ่มอย่างง่าย (Simple random sampling)
สมาชิกทั้งหมดของประชากรเป็นอิสระซึ่งกันและกัน แล้วสุ่มหน่วยของการสุ่ม (Sampling unit) จนกว่าจะได้จำนวนตามที่ต้องการ โดยแต่ครั้งที่สุ่ม สมาชิกแต่ละหน่วยของประชากรมีโอกาสถูกเลือกเท่าเทียมกัน ซึ่งก่อนที่จะทำการสุ่มนั้น จะต้องนิยามประชากรให้ชัดเจน ทำรายการสมาชิกทั้งหมดของประชากร สุ่มตัวอย่างโดยใช้วิธีที่ทำให้โอกาสในการของสมาชิกแต่ละหน่วยในการถูกเลือกมีค่าเท่ากัน ซึ่งสามารถทำได้ 2 วิธี คือ
2.1.1 การจับฉลาก
2.1.2 การใช้ตารางเลขสุ่ม (table of random number) ซึ่งตัวเลขในตารางได้มาจากการอาศัยคอมพิวเตอร์กำหนดค่า หรือบางครั้งสามารถใช้วิธีการดึงตัวอย่างโดยอาศัยโปรแกรมสำเร็จรูป
ในการสุ่มอย่างง่าย มีข้อจำกัดคือ ประชากรต้องนับได้ครบถ้วน (finite population) ซึ่งบางครั้งอาจสร้างปัญหาให้กับนักวิจัย

2.2 การสุ่มแบบเป็นระบบ (systematic sampling)
ใช้ในกรณีที่ประชากรมีการจัดเรียงอย่างไม่ลำเอียง
1) ประชากรหารด้วยจำนวนกลุ่มตัวอย่าง (K = N/n)
2) สุ่มหมายเลข 1 ถึง K (กำหนดสุ่มได้หมายเลข r )
3) r จะเป็นหมายเลขเริ่มต้น ลำดับต่อไป r + K, r +2K, r + 3K, …..
การสุ่มแบบเป็นระบบ โอกาสถูกเลือกของตัวอย่างไม่เป็นอิสระจากกัน เพราะเมื่อตัวอย่างแรกถูกสุ่มแล้ว ตัวอย่างหน่วยอื่นก็จะถูกกำหนดให้เลือกตามมาโดยอัตโนมัติ โดยไม่มีการสุ่ม
3. การสุ่มแบบแบ่งชั้น (stratified random sampling)
เป็นการสุ่มกลุ่มตัวอย่างที่แบ่งกลุ่มประชากรออกเป็นกลุ่มย่อย (subgroup or
strata) เสียก่อนบน พื้นฐานของตัวแปรที่สำคัญที่ส่งผลกระทบต่อตัวแปรตาม โดยมีหลักในการจัดแบ่งกลุ่มแต่ละกลุ่มมีความเป็นเอกพันธ์ (Homogeneous) หรือกล่าวได้ว่า ในกลุ่มเดียวกันจะมีลักษณะคล้ายคลึงกันตามกลุ่มย่อยของตัวแปร แต่จะมีความแตกต่างระหว่างกลุ่ม จำนวนสมาชิกในกลุ่มย่อยจะถูกกำหนดให้เป็นสัดส่วน (proportion) ตามสัดส่วนที่ปรากฏในประชากร ซึ่งเรียกว่า การสุ่มแบบแบ่งชัดโดยใช้สัดสัด (proportion stratified sampling) การสุ่มแบบแบ่งชั้นจะมีความเหมาะสมกับงานวิจัยที่สนใจความแตกต่างของลักษณะประชากรในระหว่างกลุ่มย่อย
4.การสุ่มตัวอย่างแบบกลุ่ม (cluster sampling)
ในกรณีที่ประชากรมีขนาดใหญ่ การสุ่มกลุ่มตัวอย่างโดยจัดกระทำกับรายการสมาชิกทุกๆหน่วยของประชากรอาจทำได้ยากหรือทำไม่ได้เลย ดังนั้นแทนที่จะใช้วิธีการสุมจากทุกหน่วย นักวิจัยสามารถสุ่มจากกลุ่มที่ถูกจัดแบ่งไว้อยู่แล้ว ซึ่งวิธีการแบบนี้เรียกว่าการสุ่มแบบกลุ่ม (cluster sampling) สิ่งที่ควรคำนึงถึงการสุ่มแบบกลุ่ม มีดังนี้ (เชิดศักด์ โฆวาสินธ์.2545 : 62)
4.1 ความแตกต่างของลักษณะที่จะศึกษาระหว่างกลุ่ม (cluster) มีไม่มาก หรือเรียกว่ามีความเป็นเอกพันธ์ (homogeneous)
4.2 ขนาดของแต่ละกลุ่ม เท่ากันหรือแตกต่างกันไม่มากนัก เพราะเมื่อเลือกกลุ่มมาเป็นตัวอย่างแล้ว การประมาณค่าพารามิเตอร์ จะมีลักษณะไม่อคติ (unbias estimation) มากกว่า กรณีที่กลุ่มตัวอย่างในแต่กลุ่มมีขนาดแตกต่างกันมาก
4.3 ขนาดของกลุ่ม (cluster) ไม่มีคำตอบแน่นอนวาจำนวนหน่วยตัวอย่างที่ศึกษาในแต่ละกลุ่ม จะเป็นเท่าใด ขึ้นอยู่กับคำถามการวิจัยและความยากง่ายในการเก็บข้อมูล
4.4 การใช้วิธีการสุมแบบ multistage cluster sampling แท่นการใช้ single – stage มีเหตุผลดังนี้
 ขนาดของแต่ละกลุ่ม ที่มีอยู่มีขนาดใหญ่เกินไปเกินกว่าขนาดตามกำหลังทางเศรษฐกิจ
 สามารถหลีกเลี่ยงค่าใช้จ่ายที่เกิดขึ้นจากการแบ่งกลุ่ม ให้มีขนาดเล็กลงในแต่ละกลุ่ม
 ผลของการแบ่งกลุ่ม (clustering) แม้จะมีขนาดเล็กลงแต่ในระหว่างกลุ่มที่จะศึกษายังมีความแตกต่างกันไม่มากนัก
 การเลือกตัวอย่างของ compact cluster ให้ความยุ่งยากในกาเก็บรวบรมข้อมูล
4.5 ขนาดขอกลุ่มตัวอย่างหรือจำนวนกลุ่ม (cluster) ที่ต้องการในการเทียบเคียงจากการเลือกแบบการสุ่มอย่างง่าน (simple random sampling) ในการคำนวณขนาดกลุ่มตัวอย่าง โดยใช้จำนวนทั้งหมดของกลุ่ม ที่จัดแบ่งเป็นประชาการที่นำมาใช้ในการคำนวณ

5. การสุ่มแบบหลายขั้นตอน (multi-stage sampling)
เป็นกระบวนการสุ่มกลุ่มตัวอย่างจากประชากรซึ่งดำเนินการสุ่มตั้งแต่ 3 ขั้นขึ้นไป

สมมุติว่าประชากรที่เราสนใจประกอบ ด้วยบริษัท 5 แห่ง คือ
ถ้าเราเลือกตัวอย่างขนาด 3 แบบไม่คืนที่
ตัวอย่างที่เป็นไปได้ทั้งหมดมีอยู่ 10 ตัวอย่าง

จากข้อสังเกตข้างต้นเราพบว่าในการเลือกตัวอย่างขนาด 3 แต่ละครั้ง ถ้าเป็นการเลือกตัวอย่างตามความน่าจะเป็นแล้วเราไม่ทราบล่วงหน้าว่า ตัวอย่างขนาด 3 ดังกล่าวจะเป็นเซตใด

จึงนิยมที่จะให้ตัวอย่างขนาด 3 หมายถึง
“ เซตของตัวแปรสุ่ม และเรียกเซตของตัวแปรสุ่มนี้ว่า Random Sample ”

บทนิยาม

ตัวอย่างเชิงสุ่ม (Random Sample) ขนาด n หมายถึง “ เซตของตัวแปรสุ่ม ที่เป็นอิสระต่อกันและมีการแจกแจงเดียวกัน (นั่นคือมี p.d.f เดียวกัน)

การแจกแจงของข้อมูล

คำกล่าวที่ว่า ข้อมูลชุดหนึ่ง มีการแจกแจงแบบปกติหมายความว่าอย่างไร ?
คำว่า “ข้อมูลชุดหนึ่ง” อาจจะหมายถึง
ประชากรชุดหนึ่งหรือค่าสถิติชุดหนึ่งก็ได้

จาก Histogram พบว่า ข้อมูลชุดนี้ควรมีการแจกแจงแบบปกติ โดยที่ mและ s2 เป็นค่าคงตัวที่เหมาะสมซึ่งเรายังไม่ทราบค่าในขณะนี้ แต่ด้วยวิธีการเชิงตัวเลขจะทำให้ เราสามารถประมาณ ค่าของ m และ s ได้

ในที่นี้ Relative frequency ก็คือ Probability Distribution หรือ เรียกอย่างสั้นๆว่า Distribution ของข้อมูลชุดนี้

พารามิเตอร์ (Parameters) หมายถึง ค่าที่บ่งบอกลักษณะที่สำคัญของประชากรสถิติ (Statistic) ตัวแปรสุ่มที่เป็นฟังก์ชันของตัวอย่างตัวอย่างเชิงสุ่มซึ่งไม่ขึ้นอยู่กับค่าพารามิเตอร์ใดๆ

การแจกแจงของฟังก์ชันที่ได้จากกลุ่มตัวอย่าง (Sampling Distribution)

เสนอ
อาจารย์ปกรณ์ชัย สุพัฒน์

จัดทำโดย

1. นางสาววิภาวดี โกกะพันธ์ 5012252231

2. นางสาวสมัย เพชรใส 5012252133

3. นางสาวสุมาลี ชิดสิน 5012252234

4. นางสาววลัยกุล ศรีดาจันทร์ 5012252131

โปรแกรมวิชาวิทยาการคอมพิวเตอร์ ปี 3
รายงานนี้เป็นส่วนหนึ่งของวิชาสถิติประยุกต์

VIPAVADEE KOKAPAN

วันพุธที่ 3 กุมภาพันธ์ พ.ศ. 2553

การแจกแจงตัวอย่างsample distribution

1 ความคิดเห็น:

ความรู้สึก

คลังบทความของบล็อก

เกี่ยวกับฉัน