การประมาณค่าช่วงความเชื่อมั่น

วัตถุประสงค์การเรียนรู้

สถิติพิจารณาสิ่งต่อไปนี้ สองงานหลัก:

    เรามีค่าประมาณจากข้อมูลตัวอย่าง และเราต้องการสร้างข้อความความน่าจะเป็นว่าค่าที่แท้จริงของพารามิเตอร์ประมาณนั้นอยู่ที่ใด

    เรามีสมมติฐานเฉพาะที่ต้องทดสอบโดยใช้ข้อมูลตัวอย่าง

ในหัวข้อนี้เราจะพิจารณางานแรก ให้เราแนะนำคำจำกัดความของช่วงความเชื่อมั่นด้วย

ช่วงความเชื่อมั่นคือช่วงที่สร้างขึ้นรอบๆ ค่าประมาณของพารามิเตอร์ และแสดงตำแหน่งที่ค่าจริงของพารามิเตอร์โดยประมาณอยู่ด้วยความน่าจะเป็นที่ระบุตามลำดับความสำคัญ

หลังจากศึกษาเนื้อหาในหัวข้อนี้แล้ว คุณ:

    เรียนรู้ว่าช่วงความเชื่อมั่นสำหรับการประมาณค่าคืออะไร

    เรียนรู้การจำแนกปัญหาทางสถิติ

    เชี่ยวชาญเทคนิคการสร้างช่วงความเชื่อมั่นทั้งโดยใช้สูตรทางสถิติและการใช้เครื่องมือซอฟต์แวร์

    เรียนรู้ที่จะกำหนดขนาดตัวอย่างที่ต้องการเพื่อให้ได้พารามิเตอร์ความแม่นยำของการประมาณการทางสถิติ

การกระจายตัวของลักษณะตัวอย่าง

T-การกระจาย

ตามที่กล่าวไว้ข้างต้น การแจกแจงของตัวแปรสุ่มนั้นใกล้เคียงกับการแจกแจงแบบปกติมาตรฐานด้วยพารามิเตอร์ 0 และ 1 เนื่องจากเราไม่ทราบค่าของ σ เราจึงแทนที่มันด้วยการประมาณค่า s ปริมาณมีการกระจายที่แตกต่างกันอยู่แล้วคือหรือ การกระจายตัวของนักเรียนซึ่งถูกกำหนดโดยพารามิเตอร์ n -1 (จำนวนองศาอิสระ) การแจกแจงนี้ใกล้เคียงกับการแจกแจงแบบปกติ (ยิ่ง n ยิ่งมาก การแจกแจงก็จะยิ่งใกล้มากขึ้น)

ในรูป 95
นำเสนอการกระจายตัวของนักเรียนที่มีระดับความอิสระ 30 องศา อย่างที่คุณเห็น มันใกล้เคียงกับการกระจายตัวแบบปกติมาก

คล้ายกับฟังก์ชันสำหรับการทำงานกับการแจกแจงแบบปกติ NORMIDIST และ NORMINV มีฟังก์ชันสำหรับการทำงานกับการแจกแจงแบบ t - STUDIST (TDIST) และ สตูดราซอร์ (TINV). ตัวอย่างของการใช้ฟังก์ชันเหล่านี้สามารถดูได้ในไฟล์ STUDRASP.XLS (เทมเพลตและโซลูชัน) และในรูปที่ 1 96
.

การกระจายลักษณะอื่น ๆ

ดังที่เราทราบแล้วว่า เพื่อกำหนดความแม่นยำในการประมาณค่าความคาดหวังทางคณิตศาสตร์ เราจำเป็นต้องมีการแจกแจงแบบ t ในการประมาณค่าพารามิเตอร์อื่นๆ เช่น ความแปรปรวน จำเป็นต้องมีการแจกแจงที่แตกต่างกัน สองในนั้นคือการแจกแจงแบบ F และ x 2 -การกระจาย.

ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ย

ช่วงความเชื่อมั่น- นี่คือช่วงเวลาที่สร้างขึ้นรอบๆ ค่าประมาณของพารามิเตอร์ และแสดงตำแหน่งที่ค่าจริงของพารามิเตอร์โดยประมาณอยู่ด้วยความน่าจะเป็นที่ระบุโดยนิรนัย

การสร้างช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยเกิดขึ้น ดังต่อไปนี้:

ตัวอย่าง

ร้านอาหารฟาสต์ฟู้ดแห่งนี้วางแผนที่จะขยายประเภทด้วยแซนด์วิชรูปแบบใหม่ เพื่อประเมินความต้องการ ผู้จัดการวางแผนที่จะสุ่มเลือกผู้เข้าชม 40 คนจากผู้ที่ได้ลองใช้แล้ว และขอให้พวกเขาให้คะแนนทัศนคติต่อผลิตภัณฑ์ใหม่ในระดับตั้งแต่ 1 ถึง 10 ผู้จัดการต้องการประมาณค่าที่คาดหวัง จำนวนคะแนนที่ผลิตภัณฑ์ใหม่จะได้รับและสร้างช่วงความเชื่อมั่น 95% สำหรับการประมาณนี้ วิธีการทำเช่นนี้? (ดูไฟล์ SANDWICH1.XLS (เทมเพลตและวิธีแก้ไข)

สารละลาย

เพื่อแก้ไขปัญหานี้คุณสามารถใช้ . ผลลัพธ์จะแสดงในรูป 97
.

ช่วงความเชื่อมั่นสำหรับมูลค่ารวม

บางครั้ง การใช้ข้อมูลตัวอย่าง จำเป็นต้องประมาณไม่ใช่การคาดการณ์ทางคณิตศาสตร์ แต่ต้องประมาณผลรวมของค่าทั้งหมด ตัวอย่างเช่น ในสถานการณ์ที่มีผู้ตรวจสอบบัญชี ดอกเบี้ยอาจอยู่ที่การประมาณไม่ใช่ขนาดบัญชีเฉลี่ย แต่อยู่ที่ผลรวมของบัญชีทั้งหมด

ให้ N เป็นจำนวนองค์ประกอบทั้งหมด n คือขนาดตัวอย่าง T 3 คือผลรวมของค่าในกลุ่มตัวอย่าง T" เป็นการประมาณสำหรับผลรวมของประชากรทั้งหมด จากนั้น และช่วงความเชื่อมั่นคำนวณโดยสูตร โดยที่ s คือค่าประมาณของค่าเบี่ยงเบนมาตรฐานสำหรับตัวอย่าง และคือค่าประมาณของค่าเฉลี่ยสำหรับตัวอย่าง

ตัวอย่าง

สมมติว่าหน่วยงานภาษีต้องการประมาณยอดคืนภาษีทั้งหมดสำหรับผู้เสียภาษี 10,000 ราย ผู้เสียภาษีจะได้รับเงินคืนหรือจ่ายภาษีเพิ่มเติม ค้นหาช่วงความเชื่อมั่น 95% สำหรับจำนวนเงินคืน โดยสมมติว่ามีกลุ่มตัวอย่าง 500 คน (ดูไฟล์ AMOUNT OF REFUND.XLS (เทมเพลตและวิธีแก้ไข)

สารละลาย

StatPro ไม่มีขั้นตอนพิเศษสำหรับกรณีนี้ อย่างไรก็ตาม สามารถสังเกตได้ว่าขอบเขตสามารถรับได้จากขอบเขตของค่าเฉลี่ยตามสูตรข้างต้น (รูปที่ 98
).

ช่วงความมั่นใจสำหรับสัดส่วน

ให้ p เป็นความคาดหวังทางคณิตศาสตร์ของส่วนแบ่งของลูกค้า และให้ p b เป็นค่าประมาณของส่วนแบ่งนี้ที่ได้จากตัวอย่างขนาด n แสดงว่าสำหรับขนาดใหญ่พอสมควรแล้ว การกระจายการประเมินจะใกล้เคียงกับปกติโดยมีค่าคาดหวังทางคณิตศาสตร์ p และค่าเบี่ยงเบนมาตรฐาน . ข้อผิดพลาดมาตรฐานของการประมาณค่าในกรณีนี้แสดงเป็น และช่วงความเชื่อมั่นเท่ากับ .

ตัวอย่าง

ร้านอาหารฟาสต์ฟู้ดแห่งนี้วางแผนที่จะขยายประเภทด้วยแซนด์วิชรูปแบบใหม่ เพื่อประเมินความต้องการ ผู้จัดการได้สุ่มเลือกผู้เข้าชม 40 คนจากผู้ที่ได้ลองใช้แล้ว และขอให้พวกเขาให้คะแนนทัศนคติที่มีต่อผลิตภัณฑ์ใหม่ในระดับตั้งแต่ 1 ถึง 10 ผู้จัดการต้องการประมาณสัดส่วนที่คาดหวังของ ลูกค้าที่ให้คะแนนผลิตภัณฑ์ใหม่อย่างน้อย 6 คะแนน (เขาคาดหวังว่าลูกค้าเหล่านี้จะเป็นผู้บริโภคของผลิตภัณฑ์ใหม่)

สารละลาย

ในตอนแรก เราจะสร้างคอลัมน์ใหม่ตามแอตทริบิวต์ 1 หากคะแนนของลูกค้ามากกว่า 6 คะแนนและเป็น 0 มิฉะนั้น (ดูไฟล์ SANDWICH2.XLS (เทมเพลตและวิธีแก้ปัญหา)

วิธีที่ 1

โดยการนับเลข 1 เราประมาณส่วนแบ่งแล้วใช้สูตร

ค่า zcr นำมาจากตารางการแจกแจงแบบปกติพิเศษ (เช่น 1.96 สำหรับช่วงความเชื่อมั่น 95%)

เมื่อใช้วิธีการนี้และข้อมูลเฉพาะเพื่อสร้างช่วง 95% เราจะได้ผลลัพธ์ดังต่อไปนี้ (รูปที่ 99
). ค่าวิกฤตของพารามิเตอร์ zcr คือ 1.96 ข้อผิดพลาดมาตรฐานของการประมาณการคือ 0.077 ขีดจำกัดล่างของช่วงความเชื่อมั่นคือ 0.475 ขีดจำกัดบนของช่วงความเชื่อมั่นคือ 0.775 ดังนั้น ผู้จัดการมีสิทธิ์ที่จะเชื่อด้วยความมั่นใจ 95% ว่าเปอร์เซ็นต์ของลูกค้าที่ให้คะแนนผลิตภัณฑ์ใหม่ 6 คะแนนขึ้นไปจะอยู่ระหว่าง 47.5 ถึง 77.5

วิธีที่ 2

ปัญหานี้สามารถแก้ไขได้โดยใช้เครื่องมือ StatPro มาตรฐาน ในการดำเนินการนี้ ก็เพียงพอที่จะทราบว่าส่วนแบ่งในกรณีนี้เกิดขึ้นพร้อมกับค่าเฉลี่ยของคอลัมน์ประเภท ต่อไปเราสมัคร StatPro/การอนุมานทางสถิติ/การวิเคราะห์ตัวอย่างเดียวเพื่อสร้างช่วงความเชื่อมั่นของค่าเฉลี่ย (ค่าประมาณของความคาดหวังทางคณิตศาสตร์) สำหรับคอลัมน์ประเภท ผลลัพธ์ที่ได้ในกรณีนี้จะใกล้เคียงกับผลลัพธ์ของวิธีที่ 1 มาก (รูปที่ 99)

ช่วงความเชื่อมั่นสำหรับส่วนเบี่ยงเบนมาตรฐาน

s ใช้เป็นค่าประมาณของส่วนเบี่ยงเบนมาตรฐาน (สูตรแสดงไว้ในส่วนที่ 1) ฟังก์ชันความหนาแน่นของการประมาณค่า s คือฟังก์ชันไคสแควร์ ซึ่งมีดีกรีอิสระ n-1 เช่นเดียวกับการแจกแจงแบบ t มีฟังก์ชันพิเศษสำหรับการทำงานกับการแจกแจง CHIDIST และ CHIINV นี้

ช่วงความเชื่อมั่นในกรณีนี้จะไม่สมมาตรอีกต่อไป แผนภาพขอบเขตแบบธรรมดาแสดงไว้ในรูปที่ 1 100 .

ตัวอย่าง

เครื่องจักรจะต้องผลิตชิ้นส่วนที่มีเส้นผ่านศูนย์กลาง 10 ซม. อย่างไรก็ตาม เกิดข้อผิดพลาดขึ้นเนื่องจากสถานการณ์ต่างๆ ผู้ควบคุมคุณภาพมีความกังวลเกี่ยวกับสองสถานการณ์ ประการแรก ค่าเฉลี่ยควรอยู่ที่ 10 ซม. ประการที่สอง แม้ในกรณีนี้ ถ้ามีการเบี่ยงเบนมาก หลายส่วนก็จะถูกปฏิเสธ ทุกวันเขาสร้างตัวอย่าง 50 ชิ้นส่วน (ดูไฟล์ QUALITY CONTROL.XLS (เทมเพลตและโซลูชัน) ตัวอย่างดังกล่าวให้ข้อสรุปอะไรได้บ้าง

สารละลาย

ลองสร้างช่วงความเชื่อมั่น 95% สำหรับค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานโดยใช้ StatPro/การอนุมานทางสถิติ/การวิเคราะห์ตัวอย่างเดียว(รูปที่ 101
).

ต่อไป โดยใช้สมมติฐานของการกระจายเส้นผ่านศูนย์กลางปกติ เราจะคำนวณสัดส่วนของผลิตภัณฑ์ที่มีข้อบกพร่อง โดยตั้งค่าส่วนเบี่ยงเบนสูงสุดที่ 0.065 การใช้ความสามารถของตารางการทดแทน (กรณีของพารามิเตอร์สองตัว) เราวางแผนการพึ่งพาสัดส่วนของข้อบกพร่องกับค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน (รูปที่ 102
).

ช่วงความเชื่อมั่นสำหรับผลต่างระหว่างสองค่าเฉลี่ย

นี่เป็นหนึ่งในการประยุกต์ใช้วิธีการทางสถิติที่สำคัญที่สุด ตัวอย่างสถานการณ์

    ผู้จัดการร้านเสื้อผ้าต้องการทราบว่าลูกค้าหญิงโดยเฉลี่ยใช้จ่ายในร้านค้ามากหรือน้อยกว่าลูกค้าชายโดยเฉลี่ย

    สองสายการบินบินเส้นทางเดียวกัน องค์กรผู้บริโภคต้องการเปรียบเทียบความแตกต่างระหว่างเวลาล่าช้าของเที่ยวบินโดยเฉลี่ยที่คาดไว้สำหรับทั้งสองสายการบิน

    บริษัทจะส่งคูปองสำหรับสินค้าบางประเภทในเมืองหนึ่งและไม่ใช่ในเมืองอื่น ผู้จัดการต้องการเปรียบเทียบปริมาณการซื้อเฉลี่ยของผลิตภัณฑ์เหล่านี้ในช่วงสองเดือนข้างหน้า

    ตัวแทนจำหน่ายรถยนต์มักจะจัดการกับคู่แต่งงานในการนำเสนอ เพื่อให้เข้าใจถึงปฏิกิริยาส่วนตัวของพวกเขาต่อการนำเสนอ คู่รักมักจะถูกสัมภาษณ์แยกกัน ผู้จัดการต้องการประเมินความแตกต่างของคะแนนที่ได้รับจากชายและหญิง

กรณีตัวอย่างอิสระ

ความแตกต่างระหว่างค่าเฉลี่ยจะมีการแจกแจงแบบ t โดยมีดีกรีอิสระ n 1 + n 2 - 2 ช่วงความเชื่อมั่นสำหรับ μ 1 - μ 2 แสดงโดยความสัมพันธ์:

ปัญหานี้สามารถแก้ไขได้ไม่เพียงแต่โดยใช้สูตรข้างต้น แต่ยังใช้เครื่องมือ StatPro มาตรฐานอีกด้วย เมื่อต้องการทำเช่นนี้ก็เพียงพอที่จะใช้

ช่วงความเชื่อมั่นสำหรับความแตกต่างระหว่างสัดส่วน

ให้เป็นความคาดหวังทางคณิตศาสตร์ของหุ้น ให้ เป็นการประมาณตัวอย่างที่สร้างจากตัวอย่างขนาด n 1 และ n 2 ตามลำดับ แล้วเป็นการประมาณความแตกต่าง ดังนั้น ช่วงความเชื่อมั่นของความแตกต่างนี้จึงแสดงเป็น:

โดยที่ z cr คือค่าที่ได้จากการแจกแจงแบบปกติโดยใช้ตารางพิเศษ (เช่น 1.96 สำหรับช่วงความเชื่อมั่น 95%)

ข้อผิดพลาดมาตรฐานของการประมาณค่าแสดงในกรณีนี้โดยความสัมพันธ์:

.

ตัวอย่าง

ร้านค้ากำลังเตรียมการขายครั้งใหญ่ ได้ทำการวิจัยทางการตลาดดังต่อไปนี้ ผู้ซื้อ 300 อันดับแรกได้รับการคัดเลือกและสุ่มแบ่งออกเป็นสองกลุ่ม กลุ่มละ 150 คน ผู้ซื้อที่เลือกทั้งหมดได้รับคำเชิญให้เข้าร่วมการขาย แต่มีเพียงสมาชิกของกลุ่มแรกเท่านั้นที่ได้รับคูปองเพื่อรับส่วนลด 5% ในระหว่างการขาย จะมีการบันทึกการซื้อของผู้ซื้อที่เลือกทั้งหมด 300 ราย ผู้จัดการสามารถตีความผลลัพธ์และตัดสินเกี่ยวกับประสิทธิผลของคูปองได้อย่างไร (ดูไฟล์ COUPONS.XLS (เทมเพลตและโซลูชัน))

สารละลาย

สำหรับกรณีเฉพาะของเรา ลูกค้า 150 รายที่ได้รับคูปองส่วนลด 55 รายซื้อสินค้าลดราคา และใน 150 รายที่ไม่ได้รับคูปอง มีเพียง 35 รายที่ซื้อสินค้า (รูปที่ 103)
). จากนั้นค่าสัดส่วนตัวอย่างคือ 0.3667 และ 0.2333 ตามลำดับ และผลต่างตัวอย่างระหว่างพวกมันเท่ากับ 0.1333 ตามลำดับ สมมติว่าช่วงความเชื่อมั่น 95% เราพบจากตารางการแจกแจงแบบปกติ z cr = 1.96 การคำนวณค่าความผิดพลาดมาตรฐานของผลต่างตัวอย่างคือ 0.0524 ในที่สุดเราก็พบว่าขีดจำกัดล่างของช่วงความเชื่อมั่น 95% คือ 0.0307 ​​และขีดจำกัดบนคือ 0.2359 ตามลำดับ ผลลัพธ์ที่ได้สามารถตีความได้ในลักษณะที่ว่าสำหรับลูกค้าทุกๆ 100 รายที่ได้รับคูปองส่วนลด เราสามารถคาดหวังลูกค้าใหม่ได้ตั้งแต่ 3 ถึง 23 ราย อย่างไรก็ตาม เราต้องจำไว้ว่าข้อสรุปนี้ไม่ได้หมายถึงประสิทธิผลของการใช้คูปอง (เนื่องจากการให้ส่วนลด เราจึงสูญเสียกำไร!) มาสาธิตสิ่งนี้ด้วยข้อมูลเฉพาะกัน สมมติว่าขนาดการซื้อเฉลี่ยคือ 400 รูเบิล ซึ่งคือ 50 รูเบิล มีกำไรให้ร้าน. ดังนั้นกำไรที่คาดหวังจากลูกค้า 100 รายที่ไม่ได้รับคูปองคือ:

50 0.2333 100 = 1166.50 ถู

การคำนวณที่คล้ายกันสำหรับลูกค้า 100 รายที่ได้รับคูปองจะให้:

30 0.3667 100 = 1100.10 ถู

กำไรเฉลี่ยที่ลดลงเหลือ 30 อธิบายได้จากข้อเท็จจริงที่ว่าเมื่อใช้ส่วนลด ลูกค้าที่ได้รับคูปองจะซื้อสินค้าโดยเฉลี่ย 380 รูเบิล

ดังนั้นข้อสรุปสุดท้ายบ่งชี้ถึงความไร้ประสิทธิผลของการใช้คูปองดังกล่าวในสถานการณ์เฉพาะนี้

ความคิดเห็น ปัญหานี้สามารถแก้ไขได้โดยใช้เครื่องมือ StatPro มาตรฐาน ในการทำเช่นนี้ ก็เพียงพอแล้วที่จะลดปัญหานี้ให้เหลือเพียงปัญหาการประมาณความแตกต่างระหว่างค่าเฉลี่ยสองค่าโดยใช้วิธีนี้ จากนั้นจึงนำไปใช้ StatPro/การอนุมานทางสถิติ/การวิเคราะห์สองตัวอย่างเพื่อสร้างช่วงความเชื่อมั่นสำหรับผลต่างระหว่างค่าเฉลี่ยสองค่า

การควบคุมความยาวช่วงความเชื่อมั่น

ความยาวของช่วงความเชื่อมั่นขึ้นอยู่กับ เงื่อนไขต่อไปนี้:

    ข้อมูลโดยตรง (ส่วนเบี่ยงเบนมาตรฐาน)

    ระดับความสำคัญ

    ขนาดตัวอย่าง.

ขนาดตัวอย่างในการประมาณค่าเฉลี่ย

ขั้นแรก พิจารณาปัญหาในกรณีทั่วไปก่อน ให้เราแทนค่าของความยาวครึ่งหนึ่งของช่วงความเชื่อมั่นที่มอบให้เราเป็น B (รูปที่ 104
). เรารู้ว่าช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยของตัวแปรสุ่ม X บางตัวแสดงเป็น , ที่ไหน . เชื่อ:

และแสดง n เราจะได้

น่าเสียดายที่เราไม่ทราบค่าที่แน่นอนของความแปรปรวนของตัวแปรสุ่ม X นอกจากนี้ เราไม่ทราบค่าของ tcr เนื่องจากมันขึ้นอยู่กับ n ถึงจำนวนดีกรีอิสระ ในสถานการณ์นี้ เราสามารถทำได้ดังต่อไปนี้ แทนที่จะใช้ความแปรปรวน เราใช้การประมาณค่าความแปรปรวนตามการใช้งานตัวแปรสุ่มที่มีอยู่ภายใต้การศึกษา แทนที่จะใช้ค่า t cr เราใช้ค่า z cr สำหรับการแจกแจงแบบปกติ สิ่งนี้ค่อนข้างยอมรับได้ เนื่องจากฟังก์ชันความหนาแน่นของการแจกแจงสำหรับการแจกแจงแบบปกติและการแจกแจงแบบ t นั้นใกล้เคียงกันมาก (ยกเว้นกรณีของ n เล็ก) ดังนั้นสูตรที่ต้องการจึงอยู่ในรูปแบบ:

.

เนื่องจากสูตรนี้ให้ผลลัพธ์ที่ไม่ใช่จำนวนเต็ม โดยทั่วไปแล้ว การปัดเศษด้วยผลลัพธ์ที่มากเกินไปจึงถือเป็นขนาดตัวอย่างที่ต้องการ

ตัวอย่าง

ร้านอาหารฟาสต์ฟู้ดแห่งนี้วางแผนที่จะขยายประเภทด้วยแซนด์วิชรูปแบบใหม่ เพื่อประเมินความต้องการ ผู้จัดการวางแผนที่จะสุ่มเลือกจำนวนผู้เข้าชมจากผู้ที่ได้ลองใช้แล้ว และขอให้พวกเขาให้คะแนนทัศนคติต่อผลิตภัณฑ์ใหม่ในระดับตั้งแต่ 1 ถึง 10 ผู้จัดการต้องการประมาณ จำนวนคะแนนที่คาดหวังที่ผลิตภัณฑ์ใหม่จะได้รับผลิตภัณฑ์และสร้างช่วงความเชื่อมั่น 95% สำหรับการประมาณการนี้ ในเวลาเดียวกัน เขาต้องการให้ช่วงความเชื่อมั่นครึ่งหนึ่งไม่เกิน 0.3 เขาต้องสัมภาษณ์ผู้เยี่ยมชมกี่คน?

ดังต่อไปนี้:

ที่นี่ โอเคคือค่าประมาณของสัดส่วน p และ B คือค่าครึ่งหนึ่งของความยาวของช่วงความเชื่อมั่น การประมาณค่าสูงเกินไปสำหรับ n สามารถหาได้โดยใช้ค่า โอเค= 0.5. ในกรณีนี้ ความยาวของช่วงความเชื่อมั่นจะไม่เกินค่า B ที่ระบุสำหรับค่าจริงของ p

ตัวอย่าง

ให้ผู้จัดการจากตัวอย่างก่อนหน้านี้วางแผนประมาณส่วนแบ่งของลูกค้าที่ต้องการผลิตภัณฑ์ประเภทใหม่ เขาต้องการสร้างช่วงความเชื่อมั่น 90% โดยมีความยาวครึ่งหนึ่งไม่เกิน 0.05 ควรรวมไคลเอนต์จำนวนเท่าใดในกลุ่มตัวอย่างแบบสุ่ม?

สารละลาย

ในกรณีของเรา ค่า z cr = 1.645 ดังนั้นปริมาณที่ต้องการจึงถูกคำนวณดังนี้ .

หากผู้จัดการมีเหตุผลให้เชื่อได้ว่าค่า p ที่ต้องการคือประมาณ 0.3 ดังนั้น เมื่อแทนค่านี้ลงในสูตรข้างต้น เราจะได้ค่าตัวอย่างสุ่มที่น้อยกว่า ซึ่งก็คือ 228

สูตรในการกำหนด ขนาดตัวอย่างแบบสุ่ม ในกรณีที่มีความแตกต่างระหว่างสองวิธีเขียนเป็น:

.

ตัวอย่าง

บริษัทคอมพิวเตอร์บางแห่งมีศูนย์บริการลูกค้า เมื่อเร็ว ๆ นี้จำนวนข้อร้องเรียนของลูกค้าเกี่ยวกับคุณภาพการบริการที่ไม่ดีเพิ่มขึ้น ศูนย์บริการจ้างพนักงานสองประเภทเป็นหลัก: ผู้ที่ไม่มีประสบการณ์มากนัก แต่สำเร็จการศึกษาหลักสูตรเตรียมความพร้อมพิเศษ และผู้ที่มีประสบการณ์ภาคปฏิบัติอย่างกว้างขวาง แต่ยังไม่จบหลักสูตรพิเศษ บริษัทต้องการวิเคราะห์ข้อร้องเรียนของลูกค้าในช่วง 6 เดือนที่ผ่านมา และเปรียบเทียบจำนวนข้อร้องเรียนโดยเฉลี่ยของพนักงานแต่ละกลุ่มในสองกลุ่ม สันนิษฐานว่าตัวเลขในกลุ่มตัวอย่างทั้งสองกลุ่มจะเท่ากัน ต้องรวมพนักงานกี่คนในกลุ่มตัวอย่างเพื่อให้ได้ช่วง 95% ที่มีความยาวครึ่งหนึ่งไม่เกิน 2

สารละลาย

ในที่นี้ σ ots คือค่าประมาณของค่าเบี่ยงเบนมาตรฐานของตัวแปรสุ่มทั้งสองตัวภายใต้สมมติฐานที่ว่ามันใกล้เคียงกัน ดังนั้นในปัญหาของเรา เราจำเป็นต้องได้ค่าประมาณนี้ ซึ่งสามารถทำได้ดังต่อไปนี้ เมื่อดูข้อมูลข้อร้องเรียนของลูกค้าในช่วงหกเดือนที่ผ่านมา ผู้จัดการอาจสังเกตเห็นว่าโดยทั่วไปพนักงานแต่ละคนได้รับการร้องเรียนตั้งแต่ 6 ถึง 36 เรื่อง เมื่อรู้ว่าสำหรับการแจกแจงแบบปกติค่าเกือบทั้งหมดอยู่ห่างจากค่าเฉลี่ยไม่เกินสามส่วนเบี่ยงเบนมาตรฐาน เขาจึงเชื่อได้อย่างสมเหตุสมผลว่า:

จากที่ σ ots = 5

เราได้แทนค่านี้ลงในสูตร .

สูตรในการกำหนด ขนาดตัวอย่างแบบสุ่ม กรณีประมาณความแตกต่างระหว่างสัดส่วนมีรูปแบบ:

ตัวอย่าง

บริษัทบางแห่งมีโรงงานสองแห่งที่ผลิตสินค้าที่คล้ายคลึงกัน ผู้จัดการบริษัทต้องการเปรียบเทียบเปอร์เซ็นต์ของผลิตภัณฑ์ที่มีข้อบกพร่องในโรงงานทั้งสองแห่ง จากข้อมูลที่มีอยู่ อัตราของเสียที่โรงงานทั้งสองแห่งอยู่ระหว่าง 3 ถึง 5% มีวัตถุประสงค์เพื่อสร้างช่วงความเชื่อมั่น 99% โดยมีความยาวครึ่งหนึ่งไม่เกิน 0.005 (หรือ 0.5%) แต่ละโรงงานต้องเลือกสินค้ากี่รายการ?

สารละลาย

ในที่นี้ p 1ots และ p 2ots เป็นค่าประมาณของข้อบกพร่องที่ไม่ทราบสาเหตุ 2 ส่วนในโรงงานแห่งที่ 1 และ 2 หากเราใส่ p 1ots = p 2ots = 0.5 เราจะได้ค่าที่ประเมินไว้สูงเกินไปสำหรับ n แต่เนื่องจากในกรณีของเรา เรามีข้อมูลเบื้องต้นเกี่ยวกับหุ้นเหล่านี้ เราจึงใช้ค่าประมาณด้านบนของหุ้นเหล่านี้ ซึ่งก็คือ 0.05 เราได้รับ

เมื่อประมาณค่าพารามิเตอร์ประชากรบางตัวจากข้อมูลตัวอย่าง จะมีประโยชน์ที่จะไม่เพียงแต่ให้ค่าประมาณแบบจุดของพารามิเตอร์เท่านั้น แต่ยังให้ช่วงความเชื่อมั่นที่แสดงตำแหน่งที่ค่าที่แน่นอนของพารามิเตอร์ที่ถูกประมาณค่าอาจอยู่อีกด้วย

ในบทนี้ เรายังได้ทำความคุ้นเคยกับความสัมพันธ์เชิงปริมาณที่ช่วยให้เราสามารถสร้างช่วงเวลาดังกล่าวสำหรับพารามิเตอร์ต่างๆ เรียนรู้วิธีควบคุมความยาวของช่วงความเชื่อมั่น

โปรดทราบว่าปัญหาในการประมาณขนาดตัวอย่าง (ปัญหาในการวางแผนการทดลอง) สามารถแก้ไขได้โดยใช้เครื่องมือ StatPro มาตรฐาน กล่าวคือ StatPro/การอนุมานทางสถิติ/การเลือกขนาดตัวอย่าง.

ช่วงความเชื่อมั่นสำหรับความถี่และเศษส่วน

© 2008

สถาบันสาธารณสุขแห่งชาติ ออสโล ประเทศนอร์เวย์

บทความนี้อธิบายและอภิปรายการคำนวณช่วงความเชื่อมั่นสำหรับความถี่และสัดส่วนโดยใช้วิธี Wald, Wilson, Clopper - Pearson โดยใช้การแปลงเชิงมุมและวิธีการ Wald พร้อมการแก้ไข Agresti - Coull เนื้อหาที่นำเสนอให้ข้อมูลทั่วไปเกี่ยวกับวิธีการคำนวณช่วงความเชื่อมั่นสำหรับความถี่และสัดส่วนและมีจุดมุ่งหมายเพื่อกระตุ้นความสนใจของผู้อ่านวารสารไม่เพียง แต่ในการใช้ช่วงความเชื่อมั่นเมื่อนำเสนอผลการวิจัยของตนเอง แต่ยังรวมถึงการอ่านวรรณกรรมเฉพาะทางก่อนเริ่มงานด้วย เกี่ยวกับการตีพิมพ์ในอนาคต

คำหลัก: ช่วงความเชื่อมั่น ความถี่ สัดส่วน

สิ่งพิมพ์ก่อนหน้านี้ฉบับหนึ่งกล่าวถึงคำอธิบายของข้อมูลเชิงคุณภาพโดยย่อ และรายงานว่าการประมาณช่วงของข้อมูลนั้นดีกว่าการชี้ประมาณการเพื่ออธิบายความถี่ของการเกิดลักษณะเฉพาะที่กำลังศึกษาในประชากร เนื่องจากการวิจัยดำเนินการโดยใช้ข้อมูลตัวอย่าง การฉายภาพผลลัพธ์ต่อประชากรจึงต้องมีองค์ประกอบของความไม่แม่นยำในการสุ่มตัวอย่าง ช่วงความเชื่อมั่นคือการวัดความแม่นยำของพารามิเตอร์ที่กำลังประมาณ เป็นที่น่าสนใจที่หนังสือเกี่ยวกับสถิติพื้นฐานสำหรับแพทย์บางเล่มเพิกเฉยต่อหัวข้อช่วงความเชื่อมั่นสำหรับความถี่โดยสิ้นเชิง ในบทความนี้ เราจะดูหลายวิธีในการคำนวณช่วงความเชื่อมั่นสำหรับความถี่ ซึ่งหมายถึงคุณลักษณะของกลุ่มตัวอย่าง เช่น การไม่ซ้ำซ้อนและความเป็นตัวแทน ตลอดจนความเป็นอิสระของการสังเกตจากกันและกัน ในบทความนี้ ความถี่ไม่ใช่ที่เข้าใจว่าเป็นจำนวนสัมบูรณ์ที่แสดงจำนวนครั้งของค่าหนึ่งๆ ที่เกิดขึ้นโดยรวม แต่เป็นค่าสัมพัทธ์ที่กำหนดสัดส่วนของผู้เข้าร่วมการศึกษาที่มีลักษณะเฉพาะที่ศึกษาเกิดขึ้น


ในการวิจัยทางชีวการแพทย์ มักใช้ช่วงความเชื่อมั่น 95% ช่วงความเชื่อมั่นนี้คือพื้นที่ที่สัดส่วนที่แท้จริงตกอยู่ที่ 95% ของเวลา กล่าวอีกนัยหนึ่ง เราสามารถพูดได้ด้วยความน่าเชื่อถือ 95% ว่ามูลค่าที่แท้จริงของความถี่ของการเกิดลักษณะใดลักษณะหนึ่งในกลุ่มประชากรจะอยู่ภายในช่วงความเชื่อมั่น 95%

คู่มือสถิติสำหรับนักวิจัยทางการแพทย์ส่วนใหญ่รายงานว่าข้อผิดพลาดของความถี่คำนวณโดยใช้สูตร

โดยที่ p คือความถี่ของการเกิดลักษณะเฉพาะในกลุ่มตัวอย่าง (ค่าตั้งแต่ 0 ถึง 1) บทความทางวิทยาศาสตร์ในประเทศส่วนใหญ่ระบุความถี่ของการเกิดลักษณะในตัวอย่าง (p) รวมถึงข้อผิดพลาดในรูปแบบ p ± s อย่างไรก็ตาม จะเหมาะสมกว่าที่จะนำเสนอช่วงความเชื่อมั่น 95% สำหรับความถี่ของการเกิดลักษณะในประชากรซึ่งจะรวมค่าจาก

ก่อน.

คู่มือบางฉบับแนะนำว่าสำหรับตัวอย่างขนาดเล็ก ให้แทนที่ค่า 1.96 ด้วยค่า t สำหรับ N – องศาอิสระ 1 โดยที่ N คือจำนวนข้อสังเกตในตัวอย่าง ค่า t หาได้จากตารางสำหรับการแจกแจงแบบ t ซึ่งมีอยู่ในตำราสถิติเกือบทุกเล่ม การใช้การแจกแจงแบบ t สำหรับวิธี Wald ไม่ได้ให้ข้อได้เปรียบที่มองเห็นได้เมื่อเปรียบเทียบกับวิธีอื่นๆ ที่กล่าวถึงด้านล่าง ดังนั้นจึงไม่แนะนำโดยผู้เขียนบางคน

วิธีที่นำเสนอข้างต้นสำหรับการคำนวณช่วงความเชื่อมั่นสำหรับความถี่หรือสัดส่วนมีชื่อว่า Wald เพื่อเป็นเกียรติแก่ Abraham Wald (1902–1950) เนื่องจากการใช้อย่างแพร่หลายเริ่มขึ้นหลังจากการตีพิมพ์ของ Wald และ Wolfowitz ในปี 1939 อย่างไรก็ตาม วิธีการนี้ถูกเสนอโดย Pierre Simon Laplace (1749–1827) ย้อนกลับไปในปี 1812

วิธี Wald เป็นที่นิยมมาก แต่การใช้งานนั้นเกี่ยวข้องกับปัญหาสำคัญ ไม่แนะนำให้ใช้วิธีนี้กับตัวอย่างที่มีขนาดน้อย รวมถึงในกรณีที่ความถี่ของการเกิดลักษณะเฉพาะมีแนวโน้มที่จะเป็น 0 หรือ 1 (0% หรือ 100%) และเป็นไปไม่ได้เลยสำหรับความถี่ 0 และ 1 นอกจากนี้ การประมาณค่าการแจกแจงแบบปกติซึ่งใช้ในการคำนวณข้อผิดพลาด “ไม่ทำงาน” ในกรณีที่ n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.


เนื่องจากตัวแปรใหม่มีการกระจายตามปกติ ขอบเขตล่างและบนของช่วงความเชื่อมั่น 95% สำหรับตัวแปร φ จะเป็น φ-1.96 และ φ+1.96left">

แทนที่จะเป็น 1.96 สำหรับตัวอย่างขนาดเล็ก ขอแนะนำให้แทนที่ค่า t ด้วยดีกรีอิสระ N – 1 วิธีนี้ไม่สร้างค่าลบและช่วยให้สามารถประมาณช่วงความเชื่อมั่นสำหรับความถี่ได้แม่นยำกว่าวิธี Wald นอกจากนี้ยังมีการอธิบายไว้ในหนังสืออ้างอิงในประเทศเกี่ยวกับสถิติทางการแพทย์หลายเล่มซึ่งไม่ได้นำไปสู่การใช้อย่างแพร่หลายในการวิจัยทางการแพทย์ ไม่แนะนำให้คำนวณช่วงความเชื่อมั่นโดยใช้การแปลงเชิงมุมสำหรับความถี่ที่เข้าใกล้ 0 หรือ 1

นี่คือจุดที่คำอธิบายวิธีการประมาณช่วงความเชื่อมั่นในหนังสือส่วนใหญ่เกี่ยวกับสถิติพื้นฐานสำหรับนักวิจัยทางการแพทย์มักจะสิ้นสุดลง และปัญหานี้เป็นเรื่องปกติไม่เพียงแต่สำหรับในประเทศเท่านั้น แต่ยังรวมถึงวรรณกรรมต่างประเทศด้วย ทั้งสองวิธีใช้ทฤษฎีบทขีดจำกัดศูนย์กลาง ซึ่งหมายถึงตัวอย่างจำนวนมาก

เมื่อคำนึงถึงข้อบกพร่องของการประมาณช่วงความเชื่อมั่นโดยใช้วิธีการข้างต้น คลอปเปอร์และเพียร์สันเสนอในปี พ.ศ. 2477 เกี่ยวกับวิธีการคำนวณสิ่งที่เรียกว่าช่วงความเชื่อมั่นที่แน่นอน โดยพิจารณาจากการแจกแจงแบบทวินามของลักษณะที่กำลังศึกษา วิธีนี้มีอยู่ในเครื่องคิดเลขออนไลน์หลายเครื่อง แต่ช่วงความเชื่อมั่นที่ได้รับด้วยวิธีนี้มักจะกว้างเกินไป ในขณะเดียวกันก็แนะนำให้ใช้วิธีนี้ในกรณีที่จำเป็นต้องมีการประเมินแบบอนุรักษ์นิยม ระดับของการอนุรักษ์ของวิธีการจะเพิ่มขึ้นเมื่อขนาดตัวอย่างลดลง โดยเฉพาะอย่างยิ่งเมื่อ N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

ตามที่นักสถิติหลายคนกล่าวไว้ การประเมินช่วงความเชื่อมั่นสำหรับความถี่ที่เหมาะสมที่สุดนั้นดำเนินการโดยวิธีของ Wilson ซึ่งเสนอย้อนกลับไปในปี 1927 แต่ในทางปฏิบัติแล้วไม่ได้ใช้ในการวิจัยทางชีวการแพทย์ในประเทศ วิธีการนี้ไม่เพียงแต่ทำให้สามารถประมาณช่วงความเชื่อมั่นสำหรับทั้งความถี่ที่เล็กมากและความถี่ที่มากเท่านั้น แต่ยังใช้ได้กับการสังเกตจำนวนเล็กน้อยอีกด้วย โดยทั่วไป ช่วงความเชื่อมั่นตามสูตรของวิลสันจะมีรูปแบบ



โดยที่ค่า 1.96 เมื่อคำนวณช่วงความเชื่อมั่น 95% N คือจำนวนการสังเกต และ p คือความถี่ของการเกิดลักษณะเฉพาะในตัวอย่าง วิธีการนี้มีอยู่ในเครื่องคิดเลขออนไลน์ ดังนั้นการใช้งานจึงไม่เป็นปัญหา และไม่แนะนำให้ใช้วิธีนี้กับ n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

นอกจากวิธี Wilson แล้ว ยังเชื่อว่าวิธี Wald ที่มีการแก้ไข Agresti – Coll จะให้ค่าประมาณที่เหมาะสมที่สุดสำหรับช่วงความเชื่อมั่นสำหรับความถี่ การแก้ไข Agresti-Coll เป็นการแทนที่ในสูตร Wald ของความถี่ของการเกิดขึ้นของลักษณะเฉพาะในตัวอย่าง (p) ด้วย p` เมื่อคำนวณว่า 2 จะถูกบวกเข้ากับตัวเศษและ 4 จะถูกบวกเข้ากับตัวส่วนนั่นคือ p` = (X + 2) / (N + 4) โดยที่ X คือจำนวนผู้เข้าร่วมการศึกษาที่มีลักษณะเฉพาะที่กำลังศึกษา และ N คือขนาดกลุ่มตัวอย่าง การปรับเปลี่ยนนี้ให้ผลลัพธ์ที่คล้ายคลึงกับสูตรของ Wilson มาก ยกเว้นเมื่อความถี่ของเหตุการณ์เข้าใกล้ 0% หรือ 100% และตัวอย่างมีขนาดเล็ก นอกเหนือจากวิธีการข้างต้นในการคำนวณช่วงความเชื่อมั่นสำหรับความถี่แล้ว ยังมีการเสนอการแก้ไขความต่อเนื่องสำหรับทั้งวิธี Wald และ Wilson สำหรับตัวอย่างขนาดเล็ก แต่การศึกษาพบว่าการใช้งานดังกล่าวไม่เหมาะสม

ลองพิจารณาการประยุกต์ใช้วิธีการข้างต้นในการคำนวณช่วงความเชื่อมั่นโดยใช้สองตัวอย่าง ในกรณีแรก เราศึกษากลุ่มตัวอย่างจำนวนมากจากผู้เข้าร่วมการศึกษาที่ได้รับการสุ่มเลือกจำนวน 1,000 ราย โดยในจำนวนนี้ 450 รายมีลักษณะที่อยู่ระหว่างการศึกษา (ซึ่งอาจเป็นปัจจัยเสี่ยง ผลลัพธ์ หรือลักษณะอื่นๆ) ซึ่งคิดเป็นความถี่ 0.45 หรือ 45 % ในกรณีที่สอง การศึกษาดำเนินการโดยใช้กลุ่มตัวอย่างขนาดเล็ก เช่น มีเพียง 20 คน และมีผู้เข้าร่วมการศึกษาเพียง 1 คน (5%) เท่านั้นที่มีลักษณะที่กำลังศึกษา ช่วงความเชื่อมั่นโดยใช้วิธี Wald วิธี Wald ที่มีการแก้ไข Agresti – Coll และวิธีการ Wilson คำนวณโดยใช้เครื่องคิดเลขออนไลน์ที่พัฒนาโดย Jeff Sauro (//www. /wald. htm) ช่วงความเชื่อมั่นที่แก้ไขความต่อเนื่องของ Wilson คำนวณโดยใช้เครื่องคิดเลขที่ Wassar Stats ให้มา: เว็บไซต์สำหรับการคำนวณทางสถิติ (//faculty.vassar.edu/lowry/prop1.html) การคำนวณการแปลงเชิงมุมฟิชเชอร์ดำเนินการด้วยตนเองโดยใช้ค่าวิกฤตสำหรับองศาอิสระ 19 และ 999 ตามลำดับ ผลการคำนวณจะแสดงในตารางสำหรับทั้งสองตัวอย่าง

ช่วงความเชื่อมั่นคำนวณด้วยวิธีที่แตกต่างกันหกวิธีสำหรับสองตัวอย่างที่อธิบายไว้ในข้อความ

วิธีการคำนวณช่วงความเชื่อมั่น

P=0.0500 หรือ 5%

CI 95% สำหรับ X=450, N=1000, P=0.4500 หรือ 45%

–0,0455–0,2541

Wald พร้อมการแก้ไข Agresti–Coll

<,0001–0,2541

วิลสันพร้อมการแก้ไขอย่างต่อเนื่อง

Clopper–Pearson "วิธีการที่แน่นอน"

การแปลงเชิงมุม

<0,0001–0,1967

ดังที่เห็นได้จากตาราง สำหรับตัวอย่างแรก ช่วงความเชื่อมั่นที่คำนวณโดยใช้วิธี Wald “ที่ยอมรับโดยทั่วไป” จะเข้าสู่ขอบเขตลบ ซึ่งไม่สามารถเป็นกรณีของความถี่ได้ น่าเสียดายที่เหตุการณ์ดังกล่าวไม่ใช่เรื่องแปลกในวรรณคดีรัสเซีย วิธีการนำเสนอข้อมูลแบบดั้งเดิมในแง่ของความถี่และข้อผิดพลาดสามารถปกปิดปัญหานี้ได้บางส่วน ตัวอย่างเช่น หากความถี่ของการเกิดลักษณะหนึ่งๆ (เป็นเปอร์เซ็นต์) แสดงเป็น 2.1 ± 1.4 แสดงว่าสิ่งนี้ไม่ "น่ารังเกียจต่อดวงตา" เท่ากับ 2.1% (95% CI: –0.7; 4.9) แม้ว่า และ หมายถึง สิ่งเดียวกัน. วิธี Wald ที่มีการแก้ไขและการคำนวณ Agresti–Coll โดยใช้การแปลงเชิงมุมจะให้ขอบเขตล่างที่มีแนวโน้มเป็นศูนย์ วิธีแก้ไขความต่อเนื่องของวิลสันและ "วิธีที่แน่นอน" จะสร้างช่วงความเชื่อมั่นที่กว้างกว่าวิธีของวิลสัน สำหรับตัวอย่างที่สอง วิธีการทั้งหมดให้ช่วงความเชื่อมั่นที่เท่ากันโดยประมาณ (ความแตกต่างปรากฏเพียงในพันเท่านั้น) ซึ่งไม่น่าแปลกใจ เนื่องจากความถี่ของการเกิดเหตุการณ์ในตัวอย่างนี้ไม่แตกต่างจาก 50% มากนัก และขนาดตัวอย่างเท่ากับ มีขนาดค่อนข้างใหญ่.

สำหรับผู้อ่านที่สนใจปัญหานี้ เราสามารถแนะนำผลงานของ R. G. Newcombe และ Brown, Cai และ Dasgupta ซึ่งให้ข้อดีและข้อเสียของการใช้วิธีการที่แตกต่างกัน 7 และ 10 วิธีในการคำนวณช่วงความเชื่อมั่น ตามลำดับ ในบรรดาคู่มือภายในประเทศ เราขอแนะนำหนังสือเล่มนี้ ซึ่งนอกเหนือจากคำอธิบายโดยละเอียดของทฤษฎีแล้ว ยังนำเสนอวิธีการของ Wald และ Wilson ตลอดจนวิธีการคำนวณช่วงความเชื่อมั่นโดยคำนึงถึงการแจกแจงความถี่ทวินาม นอกจากเครื่องคิดเลขออนไลน์ฟรี (http://www. /wald.htm และ http://faculty. vassar.edu/lowry/prop1.html) แล้ว ช่วงความเชื่อมั่นสำหรับความถี่ (และไม่เพียงเท่านั้น!) ยังสามารถคำนวณได้โดยใช้ โปรแกรม CIA (Confidence Intervals Analysis) ซึ่งสามารถดาวน์โหลดได้จาก http://www. โรงเรียนแพทย์ โซตอน เครื่องปรับอากาศ สหราชอาณาจักร/ซีไอเอ/ .

บทความถัดไปจะพิจารณาวิธีการเปรียบเทียบข้อมูลเชิงคุณภาพที่ไม่แปรเปลี่ยน

บรรณานุกรม

สถิติทางการแพทย์ด้วยภาษาที่ชัดเจน หลักสูตรเบื้องต้น / อ. บาเนอร์จี. – อ.: เวชศาสตร์ปฏิบัติ, 2550. – 287 น. สถิติทางการแพทย์ / . – อ.: หน่วยงานข้อมูลทางการแพทย์, 2550. – 475 หน้า สถิติการแพทย์และชีววิทยา / เอส. กลานซ์. – อ.: แพรกติกา, 2541. ประเภทข้อมูล การทดสอบการกระจาย และสถิติเชิงพรรณนา // นิเวศวิทยาของมนุษย์ – 2551 – ฉบับที่ 1 – หน้า 52–58 กับ. สถิติการแพทย์ : หนังสือเรียน / . – Rostov ไม่มี: Phoenix, 2007. – 160 น. สถิติการแพทย์ประยุกต์ / , . - เซนต์ปีเตอร์สเบิร์ก. : โฟเลียต, 2003. – 428 น. เอฟ. ไบโอเมตริกซ์ / . – ม.: มัธยมปลาย, 2533. – 350 น. . สถิติทางคณิตศาสตร์ทางการแพทย์ / , . – อ.: การเงินและสถิติ, 2550. – 798 น. สถิติทางคณิตศาสตร์ในการวิจัยทางคลินิก / , . – อ.: GEOTAR-MED, 2001. – 256 หน้า จุนเครอฟ วี. และ. การประมวลผลข้อมูลการวิจัยทางการแพทย์และทางสถิติ / , . - เซนต์ปีเตอร์สเบิร์ก. : VmedA, 2002. – 266 หน้า อาเกรสติ เอ.การประมาณดีกว่าการประมาณค่าช่วงสัดส่วนทวินาม / A. Agresti, B. Coull // นักสถิติชาวอเมริกัน – 1998. – N 52. – หน้า 119–126. อัลท์แมน ดี.สถิติด้วยความมั่นใจ // D. Altman, D. Machin, T. Bryant, M. J. Gardner – ลอนดอน: หนังสือ BMJ, 2000. – 240 น. บราวน์ แอล.ดี.การประมาณช่วงสำหรับสัดส่วนทวินาม / L. D. Brown, T. T. Cai, A. Dasgupta // วิทยาศาสตร์ทางสถิติ – 2001. – N 2. – หน้า 101–133. คลอปเปอร์ ซี.เจ.การใช้ความเชื่อมั่นหรือขีดจำกัดความไว้วางใจที่แสดงไว้ในกรณีของทวินาม / C. J. Clopper, E. S. Pearson // Biometrika – 1934. – N 26. – หน้า 404–413. การ์เซีย-เปเรซ ม.เอ. เกี่ยวกับช่วงความมั่นใจสำหรับพารามิเตอร์ทวินาม / M. A. Garcia-Perez // คุณภาพและปริมาณ – 2005. – N 39. – หน้า 467–481. โมตุลสกี้ เอช.ชีวสถิติที่ใช้งานง่าย // H. Motulsky – ออกซ์ฟอร์ด: สำนักพิมพ์มหาวิทยาลัยออกซ์ฟอร์ด, 1995. – 386 หน้า นิวคอมบ์ อาร์.จี.ช่วงความเชื่อมั่นสองด้านสำหรับสัดส่วนเดียว: การเปรียบเทียบวิธีทั้งเจ็ด / R. G. Newcombe // สถิติทางการแพทย์ – 1998. – N.17. – หน้า 857–872. เซาโร เจ.การประมาณอัตราความสำเร็จจากตัวอย่างขนาดเล็กโดยใช้ช่วงความเชื่อมั่นทวินาม: การเปรียบเทียบและคำแนะนำ / J. Sauro, J. R. Lewis // การประชุมประจำปีของปัจจัยมนุษย์และสังคมการยศาสตร์ – ออร์แลนโด ฟลอริดา 2548 วอลด์ เอ.ขีดจำกัดความมั่นใจสำหรับฟังก์ชันการแจกแจงแบบต่อเนื่อง // A. Wald, J. Wolfovitz // พงศาวดารของสถิติทางคณิตศาสตร์ – 1939. – N 10. – หน้า 105–118. วิลสัน อี.บี. การอนุมานที่เป็นไปได้ กฎแห่งการสืบทอด และการอนุมานทางสถิติ / อี. บี. วิลสัน // วารสารสมาคมสถิติอเมริกัน – 1927. – N 22. – หน้า 209–212.

ช่วงความเชื่อมั่นสำหรับสัดส่วน

ก. เอ็ม. กรีบอฟสกี้

สถาบันสาธารณสุขแห่งชาติ ออสโล ประเทศนอร์เวย์

บทความนี้นำเสนอวิธีการคำนวณช่วงความเชื่อมั่นสำหรับสัดส่วนทวินามหลายวิธี ได้แก่ วิธี Wald, Wilson, arcsine, Agresti-Coull และวิธี Clopper-Pearson ที่แน่นอน บทความนี้เป็นเพียงการแนะนำทั่วไปเกี่ยวกับปัญหาการประมาณค่าช่วงความเชื่อมั่นของสัดส่วนทวินาม และจุดมุ่งหมายไม่เพียงเพื่อกระตุ้นให้ผู้อ่านใช้ช่วงความเชื่อมั่นเมื่อนำเสนอผลการวิจัยเชิงประจักษ์ของตนเอง แต่ยังสนับสนุนให้พวกเขาปรึกษาหนังสือสถิติด้วย ก่อนที่จะวิเคราะห์ข้อมูลของตัวเองและเตรียมต้นฉบับ

คำสำคัญ: ช่วงความเชื่อมั่น สัดส่วน

ข้อมูลติดต่อ:

ที่ปรึกษาอาวุโส สถาบันสาธารณสุขแห่งชาติ ออสโล นอร์เวย์

ช่วงความเชื่อมั่น ( ภาษาอังกฤษ ช่วงความเชื่อมั่น) การประมาณช่วงประเภทหนึ่งที่ใช้ในสถิติ ซึ่งคำนวณตามระดับนัยสำคัญที่กำหนด พวกเขาอนุญาตให้เราสร้างข้อความว่าค่าที่แท้จริงของพารามิเตอร์ทางสถิติที่ไม่รู้จักของประชากรนั้นอยู่ในช่วงของค่าที่ได้รับโดยมีความน่าจะเป็นที่ระบุโดยระดับนัยสำคัญทางสถิติที่เลือก

การกระจายแบบปกติ

เมื่อทราบความแปรปรวน (σ 2) ของประชากรข้อมูลแล้ว คะแนน z สามารถใช้เพื่อคำนวณขีดจำกัดความเชื่อมั่น (จุดสิ้นสุดของช่วงความเชื่อมั่น) เมื่อเปรียบเทียบกับการใช้การกระจายตัวแบบ t การใช้คะแนน z จะช่วยให้คุณสร้างไม่เพียงแต่ช่วงความเชื่อมั่นที่แคบลงเท่านั้น แต่ยังรวมถึงการประมาณค่าที่คาดหวังและส่วนเบี่ยงเบนมาตรฐาน (σ) ที่เชื่อถือได้มากขึ้น เนื่องจากคะแนน z ขึ้นอยู่กับ การกระจายตัวตามปกติ

สูตร

ในการกำหนดจุดขอบเขตของช่วงความเชื่อมั่น โดยที่ทราบค่าเบี่ยงเบนมาตรฐานของประชากรข้อมูล จะใช้สูตรต่อไปนี้

L = X - Z α/2 σ
√น

ตัวอย่าง

สมมติว่าขนาดตัวอย่างคือการสังเกต 25 ครั้ง ค่าที่คาดหวังของกลุ่มตัวอย่างคือ 15 และค่าเบี่ยงเบนมาตรฐานของประชากรคือ 8 สำหรับระดับนัยสำคัญ α=5% คะแนน Z คือ Z α/2 = 1.96 ในกรณีนี้ ขีดจำกัดล่างและบนของช่วงความเชื่อมั่นจะเป็น

ล = 15 - 1.96 8 = 11,864
√25
ล = 15 + 1.96 8 = 18,136
√25

ดังนั้น เราสามารถพูดได้ว่าด้วยความน่าจะเป็น 95% ความคาดหวังทางคณิตศาสตร์ของประชากรจะอยู่ในช่วงตั้งแต่ 11.864 ถึง 18.136

วิธีการลดช่วงความเชื่อมั่นให้แคบลง

สมมติว่าช่วงนั้นกว้างเกินไปสำหรับวัตถุประสงค์ในการศึกษาของเรา มีสองวิธีในการลดช่วงช่วงความเชื่อมั่น

  1. ลดระดับนัยสำคัญทางสถิติ α
  2. เพิ่มขนาดตัวอย่าง

การลดระดับนัยสำคัญทางสถิติลงเหลือ α=10% เราจะได้คะแนน Z เท่ากับ Z α/2 =1.64 ในกรณีนี้ ขอบเขตล่างและบนของช่วงเวลาจะเป็น

ล = 15 - 1.64 8 = 12,376
√25
ล = 15 + 1.64 8 = 17,624
√25

และช่วงความเชื่อมั่นก็สามารถเขียนได้ในรูป

ในกรณีนี้ เราสามารถตั้งสมมติฐานได้ว่าด้วยความน่าจะเป็น 90% ความคาดหวังทางคณิตศาสตร์ของประชากรจะอยู่ภายในช่วง

หากเราไม่ต้องการลดระดับนัยสำคัญทางสถิติ α ทางเลือกเดียวคือเพิ่มขนาดตัวอย่าง เมื่อเพิ่มขึ้นเป็น 144 การสังเกต เราได้ค่าขีดจำกัดความเชื่อมั่นดังต่อไปนี้

ล = 15 - 1.96 8 = 13,693
√144
ล = 15 + 1.96 8 = 16,307
√144

ช่วงความเชื่อมั่นนั้นจะมีรูปแบบดังนี้

ดังนั้น การลดช่วงความเชื่อมั่นให้แคบลงโดยไม่ลดระดับนัยสำคัญทางสถิติจึงทำได้โดยการเพิ่มขนาดตัวอย่างเท่านั้น หากไม่สามารถเพิ่มขนาดตัวอย่างได้ การลดช่วงความเชื่อมั่นให้แคบลงสามารถทำได้โดยการลดระดับนัยสำคัญทางสถิติเท่านั้น

การสร้างช่วงความเชื่อมั่นสำหรับการแจกแจงนอกเหนือจากปกติ

หากไม่ทราบค่าเบี่ยงเบนมาตรฐานของประชากร หรือการแจกแจงแตกต่างจากปกติ การแจกแจงแบบ t จะใช้เพื่อสร้างช่วงความเชื่อมั่น เทคนิคนี้เป็นแบบอนุรักษ์นิยมมากกว่า ซึ่งสะท้อนให้เห็นในช่วงความเชื่อมั่นที่กว้างกว่า เมื่อเปรียบเทียบกับเทคนิคที่ใช้คะแนน Z

สูตร

ในการคำนวณขีดจำกัดล่างและบนของช่วงความเชื่อมั่นโดยยึดตามการแจกแจงแบบ t ให้ใช้สูตรต่อไปนี้

L = X - เสื้อ α σ
√น

การแจกแจงของนักเรียนหรือการแจกแจงแบบ t ขึ้นอยู่กับพารามิเตอร์เดียวเท่านั้น - จำนวนระดับความอิสระซึ่งเท่ากับจำนวนค่าแต่ละค่าของแอตทริบิวต์ (จำนวนการสังเกตในตัวอย่าง) ค่าของการทดสอบทีของนักเรียนสำหรับจำนวนองศาอิสระที่กำหนด (n) และระดับนัยสำคัญทางสถิติ α สามารถพบได้ในตารางอ้างอิง

ตัวอย่าง

สมมติว่าขนาดของกลุ่มตัวอย่างคือ 25 ค่าเดี่ยว ค่าที่คาดหวังของกลุ่มตัวอย่างคือ 50 และค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างคือ 28 จำเป็นต้องสร้างช่วงความเชื่อมั่นสำหรับระดับนัยสำคัญทางสถิติ α=5%

ในกรณีของเรา จำนวนระดับความเป็นอิสระคือ 24 (25-1) ดังนั้นค่าตารางที่สอดคล้องกันของการทดสอบของนักเรียนสำหรับระดับนัยสำคัญทางสถิติ α=5% คือ 2.064 ดังนั้นขีดจำกัดล่างและบนของช่วงความเชื่อมั่นจะเป็น

ล = 50 - 2.064 28 = 38,442
√25
ล = 50 + 2.064 28 = 61,558
√25

และช่วงก็สามารถเขียนได้ในรูป

ดังนั้น เราสามารถพูดได้ว่าด้วยความน่าจะเป็น 95% ความคาดหวังทางคณิตศาสตร์ของประชากรจะอยู่ในช่วง

การใช้การแจกแจงแบบ t ช่วยให้คุณจำกัดช่วงความเชื่อมั่นให้แคบลงโดยการลดนัยสำคัญทางสถิติหรือโดยการเพิ่มขนาดตัวอย่าง

การลดนัยสำคัญทางสถิติจาก 95% เหลือ 90% ในเงื่อนไขของตัวอย่างของเรา เราจะได้ค่าตารางที่สอดคล้องกันของการทดสอบของนักเรียนที่ 1.711

ล = 50 - 1.711 28 = 40,418
√25
ล = 50 + 1.711 28 = 59,582
√25

ในกรณีนี้ เราสามารถพูดได้ว่าด้วยความน่าจะเป็น 90% ความคาดหวังทางคณิตศาสตร์ของประชากรจะอยู่ในช่วง

หากเราไม่ต้องการลดนัยสำคัญทางสถิติ ทางเลือกเดียวคือเพิ่มขนาดตัวอย่าง สมมติว่าเป็นการสังเกตแต่ละครั้ง 64 ครั้ง ไม่ใช่ 25 ครั้งในสภาพดั้งเดิมของตัวอย่าง ค่าตารางของการทดสอบทีของนักเรียนสำหรับ 63 องศาอิสระ (64-1) และระดับนัยสำคัญทางสถิติ α=5% คือ 1.998

ยาว = 50 - 1.998 28 = 43,007
√64
ยาว = 50 + 1.998 28 = 56,993
√64

สิ่งนี้ทำให้เราบอกได้ว่าด้วยความน่าจะเป็น 95% ความคาดหวังทางคณิตศาสตร์ของประชากรจะอยู่ในช่วง

ตัวอย่างขนาดใหญ่

ตัวอย่างขนาดใหญ่คือตัวอย่างจากประชากรของข้อมูลที่จำนวนการสังเกตแต่ละรายการเกิน 100 การศึกษาทางสถิติแสดงให้เห็นว่าตัวอย่างขนาดใหญ่มีแนวโน้มที่จะมีการกระจายตามปกติ แม้ว่าการกระจายตัวของประชากรจะไม่ปกติก็ตาม นอกจากนี้ สำหรับตัวอย่างดังกล่าว การใช้คะแนน z และการแจกแจงแบบ t จะให้ผลลัพธ์ที่เหมือนกันโดยประมาณเมื่อสร้างช่วงความเชื่อมั่น ดังนั้น สำหรับตัวอย่างขนาดใหญ่ จึงเป็นที่ยอมรับได้ที่จะใช้คะแนน z สำหรับการแจกแจงแบบปกติแทนการแจกแจงแบบ t

มาสรุปกัน

การคำนวณช่วงความเชื่อมั่นจะขึ้นอยู่กับความคลาดเคลื่อนโดยเฉลี่ยของพารามิเตอร์ที่เกี่ยวข้อง ช่วงความเชื่อมั่น แสดงให้เห็นว่าภายในขีดจำกัดความน่าจะเป็น (1-a) ค่าที่แท้จริงของพารามิเตอร์โดยประมาณนั้นอยู่ โดยที่ a คือระดับนัยสำคัญ (1-a) เรียกอีกอย่างว่าความน่าจะเป็นของความเชื่อมั่น

ในบทแรก เราแสดงให้เห็นว่า ตัวอย่างเช่น สำหรับค่าเฉลี่ยเลขคณิต ค่าเฉลี่ยประชากรที่แท้จริงในกรณีประมาณ 95% อยู่ภายในค่าคลาดเคลื่อนมาตรฐาน 2 ค่าของค่าเฉลี่ย ดังนั้น ขอบเขตของช่วงความเชื่อมั่น 95% สำหรับค่าเฉลี่ยจะถูกแยกออกจากค่าเฉลี่ยตัวอย่างเป็น 2 เท่าของค่าคลาดเคลื่อนเฉลี่ยของค่าเฉลี่ย กล่าวคือ เราคูณค่าคลาดเคลื่อนเฉลี่ยของค่าเฉลี่ยด้วยค่าสัมประสิทธิ์ที่แน่นอนขึ้นอยู่กับระดับความเชื่อมั่น สำหรับค่าเฉลี่ยและผลต่างของค่าเฉลี่ย ค่าสัมประสิทธิ์นักเรียน (ค่าวิกฤตของการทดสอบของนักเรียน) จะถูกใช้ค่าวิกฤตของเกณฑ์ z สำหรับส่วนแบ่งและผลต่างของค่าเฉลี่ย ผลคูณของสัมประสิทธิ์และข้อผิดพลาดโดยเฉลี่ยสามารถเรียกได้ว่าเป็นข้อผิดพลาดสูงสุดของพารามิเตอร์ที่กำหนดเช่น สูงสุดที่เราจะได้รับเมื่อประเมิน

ช่วงความเชื่อมั่นสำหรับ ค่าเฉลี่ยเลขคณิต : .

นี่คือค่าเฉลี่ยตัวอย่าง

ความคลาดเคลื่อนเฉลี่ยของค่าเฉลี่ยเลขคณิต

ส –ค่าเบี่ยงเบนมาตรฐานตัวอย่าง

n

ฉ = น-1 (สัมประสิทธิ์ของนักเรียน)

ช่วงความเชื่อมั่นสำหรับ ความแตกต่างของค่าเฉลี่ยเลขคณิต :

นี่คือความแตกต่างระหว่างค่าเฉลี่ยตัวอย่าง

- ข้อผิดพลาดเฉลี่ยของความแตกต่างระหว่างวิธีทางคณิตศาสตร์

ส 1 , ส 2 –ตัวอย่างค่าเบี่ยงเบนมาตรฐาน

n1,n2

ค่าวิกฤตของการทดสอบของนักเรียนสำหรับระดับนัยสำคัญที่กำหนด a และจำนวนระดับความเป็นอิสระ ฉ=n 1 +n 2-2 (ค่าสัมประสิทธิ์ของนักเรียน)

ช่วงความเชื่อมั่นสำหรับ หุ้น :

.

โดยที่ d คือเศษส่วนตัวอย่าง

– ข้อผิดพลาดเศษส่วนเฉลี่ย

n– ขนาดตัวอย่าง (ขนาดกลุ่ม)

ช่วงความเชื่อมั่นสำหรับ ความแตกต่างของหุ้น :

นี่คือความแตกต่างในการแชร์ตัวอย่าง

– ความคลาดเคลื่อนโดยเฉลี่ยของความแตกต่างระหว่างค่าเฉลี่ยเลขคณิต

n1,n2– ปริมาตรตัวอย่าง (จำนวนกลุ่ม)

ค่าวิกฤตของเกณฑ์ z ที่ระดับนัยสำคัญที่กำหนด a ( , , )

ด้วยการคำนวณช่วงความเชื่อมั่นสำหรับความแตกต่างระหว่างตัวบ่งชี้ ประการแรกเราจะเห็นค่าที่เป็นไปได้ของผลกระทบโดยตรง ไม่ใช่แค่การประมาณค่าจุดเท่านั้น ประการที่สอง เราสามารถสรุปเกี่ยวกับการยอมรับหรือการปฏิเสธสมมติฐานว่าง และประการที่สาม เราสามารถสรุปเกี่ยวกับพลังของการทดสอบได้

เมื่อทดสอบสมมติฐานโดยใช้ช่วงความเชื่อมั่น คุณต้องปฏิบัติตามกฎต่อไปนี้:

หากช่วงความเชื่อมั่น 100(1-a) เปอร์เซ็นต์ของผลต่างในค่าเฉลี่ยไม่มีศูนย์ ความแตกต่างจะมีนัยสำคัญทางสถิติที่ระดับนัยสำคัญ a ในทางตรงกันข้าม หากช่วงเวลานี้มีศูนย์ ความแตกต่างก็ไม่มีนัยสำคัญทางสถิติ

แท้จริงแล้ว หากช่วงเวลานี้มีศูนย์ หมายความว่าตัวบ่งชี้ที่กำลังเปรียบเทียบอาจมีค่ามากกว่าหรือน้อยกว่าในกลุ่มใดกลุ่มหนึ่งเมื่อเปรียบเทียบกับกลุ่มอื่นๆ กล่าวคือ ความแตกต่างที่สังเกตได้นั้นเกิดจากโอกาส

พลังของการทดสอบสามารถตัดสินได้จากตำแหน่งของศูนย์ภายในช่วงความเชื่อมั่น หากศูนย์อยู่ใกล้กับขีดจำกัดล่างหรือบนของช่วงเวลา อาจเป็นไปได้ว่าเมื่อมีการเปรียบเทียบกลุ่มจำนวนมาก ความแตกต่างจะมีนัยสำคัญทางสถิติ หากศูนย์อยู่ใกล้กับช่วงกึ่งกลางของช่วงเวลา นั่นหมายความว่าทั้งการเพิ่มขึ้นและลดลงของตัวบ่งชี้ในกลุ่มทดลองมีแนวโน้มเท่ากัน และอาจไม่มีความแตกต่างกันจริงๆ

ตัวอย่าง:

เพื่อเปรียบเทียบอัตราการเสียชีวิตจากการผ่าตัดเมื่อใช้ยาระงับความรู้สึกสองประเภท: มีผู้เข้ารับการผ่าตัดด้วยการดมยาสลบประเภทแรก 61 ราย เสียชีวิต 8 ราย และประเภทที่สอง 67 ราย เสียชีวิต 10 ราย

วัน 1 = 8/61 = 0.131; d2 = 10/67 = 0.149; d1-d2 = - 0.018

ความแตกต่างในอัตราการเสียชีวิตของวิธีที่เปรียบเทียบจะอยู่ในช่วง (-0.018 - 0.122; -0.018 + 0.122) หรือ (-0.14; 0.104) โดยมีความน่าจะเป็น 100(1-a) = 95% ช่วงเวลาประกอบด้วยศูนย์ เช่น ไม่สามารถปฏิเสธสมมติฐานเรื่องอัตราการตายที่เท่ากันด้วยการดมยาสลบสองประเภทที่แตกต่างกัน

ดังนั้นอัตราการเสียชีวิตสามารถและจะลดลงเหลือ 14% และเพิ่มเป็น 10.4% โดยมีความน่าจะเป็น 95% เช่น 0 จะอยู่ในช่วงกลางของช่วงเวลาโดยประมาณ ดังนั้นจึงอาจโต้แย้งได้ว่า ทั้งสองวิธีนี้ไม่มีความร้ายแรงที่แตกต่างกันจริงๆ

ในตัวอย่างที่กล่าวถึงก่อนหน้านี้ เวลาในการกดเฉลี่ยระหว่างการทดสอบการกรีดถูกเปรียบเทียบในกลุ่มนักเรียนสี่กลุ่มที่มีคะแนนสอบต่างกัน มาคำนวณช่วงความเชื่อมั่นสำหรับเวลาเร่งด่วนโดยเฉลี่ยสำหรับนักเรียนที่สอบผ่านด้วยเกรด 2 และ 5 และช่วงความเชื่อมั่นสำหรับความแตกต่างระหว่างค่าเฉลี่ยเหล่านี้

ค่าสัมประสิทธิ์ของนักเรียนหาได้จากตารางการแจกแจงของนักเรียน (ดูภาคผนวก): สำหรับกลุ่มแรก: = t(0.05;48) = 2.011; สำหรับกลุ่มที่สอง: = t(0.05;61) = 2.000 ดังนั้น ช่วงความเชื่อมั่นสำหรับกลุ่มแรก: = (162.19-2.011*2.18; 162.19+2.011*2.18) = (157.8; 166.6) สำหรับกลุ่มที่สอง (156.55- 2,000*1.88; 156.55+2,000*1.88) = (152.8 ; 160.3) ดังนั้นสำหรับผู้ที่สอบผ่านด้วยคะแนน 2 เวลากดเฉลี่ยอยู่ที่ 157.8 มิลลิวินาที ถึง 166.6 มิลลิวินาที โดยมีความน่าจะเป็น 95% สำหรับผู้ที่สอบผ่านด้วยคะแนน 5 คือ จาก 152.8 มิลลิวินาที ถึง 160.3 มิลลิวินาที โดยมีความน่าจะเป็น 95% .

คุณยังสามารถทดสอบสมมติฐานว่างได้โดยใช้ช่วงความเชื่อมั่นเพื่อหาค่าเฉลี่ย ไม่ใช่แค่เพียงผลต่างของค่าเฉลี่ยเท่านั้น ตัวอย่างเช่น ในกรณีของเรา หากช่วงความเชื่อมั่นของค่าเฉลี่ยทับซ้อนกัน สมมติฐานว่างก็ไม่สามารถปฏิเสธได้ หากต้องการปฏิเสธสมมติฐานในระดับนัยสำคัญที่เลือก ช่วงความเชื่อมั่นที่เกี่ยวข้องจะต้องไม่ทับซ้อนกัน

ลองหาช่วงความเชื่อมั่นสำหรับส่วนต่างของเวลาเร่งด่วนเฉลี่ยของกลุ่มที่สอบผ่านเกรด 2 และ 5 ผลต่างของค่าเฉลี่ย: 162.19 – 156.55 = 5.64 ค่าสัมประสิทธิ์นักเรียน: = t(0.05;49+62-2) = t(0.05;109) = 1.982 ส่วนเบี่ยงเบนมาตรฐานของกลุ่มจะเท่ากับ: ; . เราคำนวณความคลาดเคลื่อนโดยเฉลี่ยของความแตกต่างระหว่างค่าเฉลี่ย: ช่วงความเชื่อมั่น: =(5.64-1.982*2.87; 5.64+1.982*2.87) = (-0.044; 11.33)

ดังนั้นความแตกต่างของเวลากดโดยเฉลี่ยของกลุ่มที่สอบผ่านด้วยคะแนน 2 และ 5 จะอยู่ในช่วงตั้งแต่ -0.044 มิลลิวินาที ถึง 11.33 มิลลิวินาที ช่วงเวลานี้รวมศูนย์ด้วย เช่น เวลาเร่งด่วนโดยเฉลี่ยของผู้สอบผ่านดีอาจเพิ่มขึ้นหรือลดลงเมื่อเทียบกับผู้ที่สอบผ่านไม่เป็นที่น่าพอใจ ได้แก่ สมมติฐานว่างไม่สามารถปฏิเสธได้ แต่ศูนย์นั้นใกล้กับขีดจำกัดล่างมาก และเวลากดมีแนวโน้มที่จะลดลงมากสำหรับผู้ที่ผ่านไปด้วยดี ดังนั้น เราสามารถสรุปได้ว่ายังคงมีความแตกต่างในเวลาเฉลี่ยของการกดระหว่างผู้ที่ผ่าน 2 และ 5 เราไม่สามารถตรวจพบได้เนื่องจากการเปลี่ยนแปลงของเวลาเฉลี่ย การแพร่กระจายของเวลาเฉลี่ย และขนาดตัวอย่าง

พลังของการทดสอบคือความน่าจะเป็นที่จะปฏิเสธสมมติฐานว่างที่ไม่ถูกต้อง เช่น ค้นหาความแตกต่างในจุดที่มีอยู่จริง

พลังของการทดสอบนั้นพิจารณาจากระดับนัยสำคัญ ขนาดของความแตกต่างระหว่างกลุ่ม การแพร่กระจายของค่าในกลุ่ม และขนาดของกลุ่มตัวอย่าง

สำหรับการทดสอบและการวิเคราะห์ความแปรปรวนของนักเรียน สามารถใช้แผนภาพความไวได้

สามารถใช้อำนาจของเกณฑ์ในการกำหนดจำนวนกลุ่มที่ต้องการเบื้องต้นได้

ช่วงความเชื่อมั่นจะแสดงภายในซึ่งจำกัดค่าที่แท้จริงของพารามิเตอร์โดยประมาณอยู่กับความน่าจะเป็นที่กำหนด

เมื่อใช้ช่วงความเชื่อมั่น คุณสามารถทดสอบสมมติฐานทางสถิติและสรุปเกี่ยวกับความอ่อนไหวของเกณฑ์ได้

วรรณกรรม.

Glanz S. – บทที่ 6,7

Rebrova O.Yu. – หน้า 112-114, หน้า 171-173, หน้า 234-238.

Sidorenko E.V. – หน้า 32-33

คำถามสำหรับการทดสอบตนเองของนักเรียน

1. อำนาจของเกณฑ์คืออะไร?

2. ในกรณีใดบ้างที่จำเป็นต้องประเมินอำนาจของเกณฑ์?

3. วิธีการคำนวณกำลัง

6. จะทดสอบสมมติฐานทางสถิติโดยใช้ช่วงความเชื่อมั่นได้อย่างไร?

7. สิ่งที่สามารถพูดได้เกี่ยวกับพลังของเกณฑ์เมื่อคำนวณช่วงความเชื่อมั่น?

งาน

ช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์ - นี่คือช่วงเวลาที่คำนวณจากข้อมูลที่มีความน่าจะเป็นที่ทราบ ซึ่งมีการคาดการณ์ทางคณิตศาสตร์ของประชากรทั่วไป การประมาณค่าตามธรรมชาติสำหรับความคาดหวังทางคณิตศาสตร์คือค่าเฉลี่ยเลขคณิตของค่าที่สังเกตได้ ดังนั้นตลอดบทเรียนเราจะใช้คำว่า "ค่าเฉลี่ย" และ "มูลค่าเฉลี่ย" ในปัญหาในการคำนวณช่วงความเชื่อมั่น คำตอบที่ต้องการบ่อยที่สุดคือ "ช่วงความเชื่อมั่นของตัวเลขเฉลี่ย [ค่าในปัญหาเฉพาะ] มาจาก [ค่าน้อยลง] ถึง [ค่ามากขึ้น]" เมื่อใช้ช่วงความเชื่อมั่น คุณสามารถประเมินได้ไม่เพียงแต่ค่าเฉลี่ยเท่านั้น แต่ยังรวมถึงสัดส่วนของลักษณะเฉพาะของประชากรทั่วไปด้วย บทเรียนจะกล่าวถึงค่าเฉลี่ย การกระจาย ส่วนเบี่ยงเบนมาตรฐาน และข้อผิดพลาด ซึ่งเราจะได้คำจำกัดความและสูตรใหม่ ลักษณะเฉพาะของกลุ่มตัวอย่างและประชากร .

การประมาณจุดและช่วงของค่าเฉลี่ย

หากค่าเฉลี่ยของประชากรประมาณด้วยตัวเลข (จุด) ค่าเฉลี่ยเฉพาะซึ่งคำนวณจากตัวอย่างการสังเกตจะถูกนำมาใช้เป็นค่าประมาณของค่าเฉลี่ยที่ไม่ทราบของประชากร ในกรณีนี้ ค่าเฉลี่ยตัวอย่างซึ่งเป็นตัวแปรสุ่มไม่ตรงกับค่าเฉลี่ยของประชากรทั่วไป ดังนั้น เมื่อระบุค่าเฉลี่ยตัวอย่าง คุณต้องระบุข้อผิดพลาดในการสุ่มตัวอย่างไปพร้อมๆ กัน การวัดข้อผิดพลาดในการสุ่มตัวอย่างคือข้อผิดพลาดมาตรฐาน ซึ่งแสดงอยู่ในหน่วยเดียวกับค่าเฉลี่ย ดังนั้นจึงมักใช้สัญกรณ์ต่อไปนี้: .

หากการประมาณค่าเฉลี่ยจำเป็นต้องเชื่อมโยงกับความน่าจะเป็นที่แน่นอน พารามิเตอร์ที่น่าสนใจในประชากรจะต้องประเมินไม่ใช่ด้วยตัวเลขตัวเดียว แต่ต้องประเมินตามช่วงเวลา ช่วงความเชื่อมั่นคือช่วงที่มีความน่าจะเป็นที่แน่นอน พบค่าของตัวบ่งชี้ประชากรโดยประมาณ ช่วงความเชื่อมั่นที่เป็นไปได้ = 1 - α พบตัวแปรสุ่มคำนวณได้ดังนี้

,

α = 1 - ซึ่งสามารถพบได้ในภาคผนวกของหนังสือสถิติเกือบทุกเล่ม

ในทางปฏิบัติ ไม่ทราบค่าเฉลี่ยประชากรและความแปรปรวน ดังนั้นความแปรปรวนประชากรจึงถูกแทนที่ด้วยความแปรปรวนตัวอย่าง และค่าเฉลี่ยประชากรด้วยค่าเฉลี่ยตัวอย่าง ดังนั้น ช่วงความเชื่อมั่นในกรณีส่วนใหญ่จึงคำนวณได้ดังนี้:

.

สูตรช่วงความเชื่อมั่นสามารถใช้เพื่อประมาณค่าเฉลี่ยประชากรได้

  • ทราบค่าเบี่ยงเบนมาตรฐานของประชากร
  • หรือไม่ทราบค่าเบี่ยงเบนมาตรฐานของประชากร แต่ขนาดกลุ่มตัวอย่างมากกว่า 30

ค่าเฉลี่ยตัวอย่างเป็นการประมาณค่าเฉลี่ยประชากรอย่างเป็นกลาง ในทางกลับกัน ความแปรปรวนตัวอย่าง ไม่ใช่การประมาณค่าความแปรปรวนของประชากรอย่างเป็นกลาง เพื่อให้ได้ค่าประมาณที่เป็นกลางของความแปรปรวนประชากรในสูตรความแปรปรวนตัวอย่าง ขนาดตัวอย่าง nควรถูกแทนที่ด้วย n-1.

ตัวอย่างที่ 1ข้อมูลถูกรวบรวมจากร้านกาแฟที่สุ่มเลือก 100 แห่งในเมืองหนึ่ง โดยจำนวนพนักงานโดยเฉลี่ยในร้านกาแฟเหล่านั้นคือ 10.5 โดยมีค่าเบี่ยงเบนมาตรฐานอยู่ที่ 4.6 กำหนดช่วงความเชื่อมั่น 95% สำหรับจำนวนพนักงานร้านกาแฟ

โดยที่ค่าวิกฤตของการแจกแจงแบบปกติมาตรฐานสำหรับระดับนัยสำคัญ α = 0,05 .

ดังนั้น ช่วงความเชื่อมั่น 95% สำหรับจำนวนพนักงานร้านกาแฟโดยเฉลี่ยจึงอยู่ระหว่าง 9.6 ถึง 11.4

ตัวอย่างที่ 2สำหรับการสุ่มตัวอย่างจากประชากร 64 การสังเกต จะมีการคำนวณค่าทั้งหมดดังต่อไปนี้:

ผลรวมของค่าในการสังเกต

ผลรวมของการเบี่ยงเบนกำลังสองของค่าจากค่าเฉลี่ย .

คำนวณช่วงความเชื่อมั่น 95% สำหรับการคาดหวังทางคณิตศาสตร์

ลองคำนวณค่าเบี่ยงเบนมาตรฐาน:

,

มาคำนวณค่าเฉลี่ยกัน:

.

เราแทนค่าลงในนิพจน์สำหรับช่วงความมั่นใจ:

โดยที่ค่าวิกฤตของการแจกแจงแบบปกติมาตรฐานสำหรับระดับนัยสำคัญ α = 0,05 .

เราได้รับ:

ดังนั้น ช่วงความเชื่อมั่น 95% สำหรับความคาดหวังทางคณิตศาสตร์ของกลุ่มตัวอย่างนี้จึงอยู่ในช่วงตั้งแต่ 7.484 ถึง 11.266

ตัวอย่างที่ 3สำหรับตัวอย่างประชากรสุ่มจากการสังเกต 100 ครั้ง ค่าเฉลี่ยที่คำนวณได้คือ 15.2 และค่าเบี่ยงเบนมาตรฐานคือ 3.2 คำนวณช่วงความเชื่อมั่น 95% สำหรับค่าที่คาดหวัง จากนั้นจึงคำนวณช่วงความเชื่อมั่น 99% หากกำลังของตัวอย่างและความแปรผันยังคงไม่เปลี่ยนแปลงและค่าสัมประสิทธิ์ความเชื่อมั่นเพิ่มขึ้น ช่วงความเชื่อมั่นจะแคบลงหรือกว้างขึ้นหรือไม่

เราแทนที่ค่าเหล่านี้เป็นนิพจน์สำหรับช่วงความมั่นใจ:

โดยที่ค่าวิกฤตของการแจกแจงแบบปกติมาตรฐานสำหรับระดับนัยสำคัญ α = 0,05 .

เราได้รับ:

.

ดังนั้น ช่วงความเชื่อมั่น 95% สำหรับค่าเฉลี่ยของกลุ่มตัวอย่างนี้จึงอยู่ในช่วงตั้งแต่ 14.57 ถึง 15.82

เราแทนที่ค่าเหล่านี้เป็นนิพจน์สำหรับช่วงความมั่นใจอีกครั้ง:

โดยที่ค่าวิกฤตของการแจกแจงแบบปกติมาตรฐานสำหรับระดับนัยสำคัญ α = 0,01 .

เราได้รับ:

.

ดังนั้น ช่วงความเชื่อมั่น 99% สำหรับค่าเฉลี่ยของกลุ่มตัวอย่างนี้จึงอยู่ในช่วงตั้งแต่ 14.37 ถึง 16.02

ดังที่เราเห็น เมื่อค่าสัมประสิทธิ์ความเชื่อมั่นเพิ่มขึ้น ค่าวิกฤตของการแจกแจงแบบปกติมาตรฐานก็จะเพิ่มขึ้นด้วย และด้วยเหตุนี้ จุดเริ่มต้นและจุดสิ้นสุดของช่วงเวลาจึงอยู่ห่างจากค่าเฉลี่ย และด้วยเหตุนี้ ช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์จึงเพิ่มขึ้น .

การประมาณจุดและช่วงเวลาของความถ่วงจำเพาะ

ส่วนแบ่งของคุณลักษณะตัวอย่างบางส่วนสามารถตีความได้ว่าเป็นจุดประมาณของส่วนแบ่ง พีที่มีลักษณะเดียวกันในประชากรทั่วไป หากค่านี้จำเป็นต้องเชื่อมโยงกับความน่าจะเป็น ก็ควรคำนวณช่วงความเชื่อมั่นของความถ่วงจำเพาะ พีลักษณะเฉพาะของประชากรที่มีความน่าจะเป็น = 1 - α :

.

ตัวอย่างที่ 4ในบางเมืองมีผู้สมัครสองคน และ บีกำลังลงสมัครรับตำแหน่งนายกเทศมนตรี สุ่มสำรวจชาวเมือง 200 คน โดย 46% ตอบว่าพวกเขาจะลงคะแนนให้ผู้สมัคร , 26% - สำหรับผู้สมัคร บีและ 28% ไม่รู้ว่าพวกเขาจะลงคะแนนให้ใคร กำหนดช่วงความเชื่อมั่น 95% สำหรับสัดส่วนของชาวเมืองที่สนับสนุนผู้สมัคร .