Categorical Data Analysis / การวิเคราะห์ข้อมูลจำแนกประเภท

มาตรฐาน

ศรินดา วงศ์โกศลสุข (แปลและเรียบเรียง)

วัตถุประสงค์ทั่วไป

หลายๆ การสำรวจและการทดลองได้ผลตัวแปรในเชิงคุณภาพมากกว่าเชิงปริมาณ ซึ่งสามารถนำไปจำแนกได้แต่จะไม่ออกมาในรูปแบบตัวเลข ข้อมูลจากการทดลองเหล่านี้ประกอบด้วยการนับหรือจำนวนจากการสังเกตซึ่งอยู่ในแต่ละกลุ่มผลของการทดลอง โดยในบทนี้ เราจะดูเกี่ยวกับวิธีการวิเคราะห์ข้อมูลจำแนกประเภท

ดัชนีบทเรียน

  • สมมุติฐานการทดสอบไคสแควร์ (14.7)
  • การเปรียบเทียบหลายกลุ่มประชากรอเนกนาม (14.5)
  • ตารางความเป็นไปได้ (Contingency tables) (14.4)
  • การทดลองอเนกนาม (14.1)
  • การนำไปใช้อื่นๆ (14.7)
  • สถิติไคสแควร์ของเพียร์สัน (14.2)
  • การทดสอบความน่าจะเป็นของเซลล์ที่กำหนด (14.3)

แนวทางการตลาดสามารถปรับปรุงบริการของห้องสมุดได้หรือไม่?

คุณให้คะแนนห้องสมุดอย่างไร? บรรยากาศมันดูเป็นมิตร, หม่นหมอง, เงียบเกินไปหรือไม่? เจ้าหน้าที่ห้องสมุดให้ความช่วยเหลือดีหรือไม่? สัญลักษณ์ที่ใช้ชัดเจนและไม่สับสนหรือไม่? ในสมัยนี้ที่ผู้บริโภคเป็นใหญ่นำไปสู่แนวทางด้านการตลาด ซึ่งส่วนใหญ่จะเกี่ยวข้องกับการที่องค์กรศึกษาอย่างเป็นระบบเกี่ยวกับความต้องการและความจำเป็นของลูกค้าเพื่อที่จะพัฒนาบริการหรือผลิตภัณฑ์ของตน ในกรณีศึกษาท้ายบทนี้ เราจะพิจารณาผลของการศึกษาเพื่อให้ทราบถึงท่าทีของผู้ใหญ่ในช่วงต้นต่อบริการของห้องสมุด

14.1 ลักษณะของการทดลอง

หลายๆ การทดลองให้ผลการวัดเชิงคุณภาพหรือประเภทแทนที่จะเป็นเชิงปริมาณ ซึ่งหมายถึง คุณภาพหรือลักษณะเฉพาะถูกวัดด้วยแต่ละหน่วยของการทดลอง (แทนที่จะเป็นจำนวนตัวเลข) คุณสามารถสรุปข้อมูลชนิดนี้ด้วยการสร้างรายการประเภทหรือลักษณะเฉพาะและรายงานจำนวนนับของการวัดในแต่ละประเภท ซึ่งมีตัวอย่างดังต่อไปนี้:

  • ประชากรสามารถจำแนกเป็น 5 กลุ่มรายได้
  • หนูทดลองสามารถตอบสนองต่อตัวกระตุ้น 1 ใน 3 วิธี
  • ลูกอม M&M’S สามารถเป็น 1 ใน 6 สี
  • กระบวนการผลิตผลิตภัณฑ์เชิงอุตสาหกรรมสามารถจำแนกออกเป็น “รับได้”, “คุณภาพระดับรอง”, หรือ “ของเสีย”

เหล่านี้คือบางส่วนของหลายๆ เหตุการณ์ที่กลุ่มข้อมูลมีลักษณะเฉพาะที่เหมาะสมกับการทดลองแบบอเนกนาม

การทดลองแบบอเนกนาม

  • การทดลองประกอบด้วยการทดสอบเหมือนๆ กัน จำนวน n ครั้ง
  • ผลของแต่ละการทดลองตกอยู่ใน 1 ใน k ประเภท
  • ความน่าจะเป็นที่ผลลัพธ์ของแต่ละการทดลองตกอยู่ในประเภทหนึ่งๆ เช่น ประเภท i คือ pi และเป็นอย่างนี้เสมอทุกการทดลอง ความน่าจะเป็นเหล่านี้ต้องอยู่ระหว่าง 0 และ 1 สำหรับแต่ละประเภท k และผลรวมความน่าจะเป็นของทุก k คือ ∑pi = 1
  • แต่ละการทดลองเป็นอิสระต่อกัน
  • การทดลองนับจำนวนผลลัพธ์จากการสังเกตในแต่ละประเภทเขียนว่า O1, O2, …, Ok, ด้วย O1 + O2 + … + Ok = n

ตัวอย่างที่เห็นได้ชัดของการทดลองแบบอเนกนาม คือ บอล n ลูกถูกโยนไปโดนกล่องหรือเซลล์ k ซึ่งการโยนแต่ละครั้งเป็นอิสระต่อกันและมีโอกาสในการโดนกล่องที่ i เท่ากัน อย่างไรก็ตาม โอกาสเหล่านี้อาจต่างกันในแต่ละกล่อง; การโยนให้โดนกล่อง 1 อาจง่ายกว่ากล่อง 3 เมื่อบอลทุกลูกถูกโยนจนครบ จำนวนในแต่ละกล่องหรือเซลล์จะถูกนับ O1, O2, …, Ok

คุณอาจจะเห็นถึงความคล้ายกันของการทดลองแบบอเนกนามและการทดลองแบบทวินามในบทที่ 5 เมื่อมีประเภท k = 2, การทดลองทั้งสองครั้งเหมือนกัน ยกเว้นต่างกันที่ชื่อเรียก แทนที่จะใช้ p และ q เราเขียน p1 และ p2 เพื่อแสดงความน่าจะเป็นของสองประเภท (สำเร็จ และ ล้มเหลว) แทนที่จะใช้ x และ (n-x) เราเขียน O1 และ O2 เพื่อแสดงจำนวน “สำเร็จ” และ “ล้มเหลว” ที่สังเกตได้

เมื่อเราแสดงตัวแปรสุ่มทวินาม เราให้ความเห็นเกี่ยวกับพารามิเตอร์ทวินาม p (โดยค่าพื้นฐาน q = 1-p) โดยใช้กลุ่มทดลองขนาดใหญ่บนพื้นฐานของสถิติ z ในบทนี้ เราขยายแนวความคิดนี้เพื่อให้ความเห็นเกี่ยวกับพารามิเตอร์อเนกนาม (p1, p2, …, pk) โดยใช้สถิติชนิดที่แตกต่างกันออกไป สถิตินี้มีการประมาณการกระจายของตัวอย่าง ซึ่งถูกคิดค้นขึ้นโดยนักสถิติชาวอังกฤษชื่อ คาร์ล เพียร์สัน ในปี 1900 โดยถูกเรียกว่า สถิติไคสแควร์ (หรือ เพียร์สันไคสแควร์)

เกร็ดเล็กเกร็ดน้อย

การทดลองอเนกนามเป็นส่วนขยายของการทดลองแบบทวินาม สำหรับการทดลองแบบทวินาม k = 2

14.2 สถิติเพียร์สันไคสแควร์

สมมุติว่า บอล n = 100 ลูกถูกโยนไปที่เซลล์ (กล่อง) และคุณรู้ว่าความน่าจะเป็นของบอลที่จะตกลงในกล่องแรกคือ p1 = .1 จะมีลูกบอลกี่ลูกที่คุณคิดว่าจะตกลงในกล่องแรก? โดยสัญชาตญาณแล้ว คุณคาดว่าจะเห็น 100(.1) = 10 ลูกในกล่องแรก คุณอาจกลับไปคิดถึงค่าเฉลี่ยหรือค่าคาดหวังของความสำเร็จ µ = np ในการทดลองแบบทวินาม โดยทั่วไปแล้ว จำนวนคาดหวังของบอลที่จะตกลงในเซลล์ i (เขียนว่า Ei) สามารถคำนวณโดยใช้สูตร

Ei = npi

สำหรับเซลล์ใดๆ i = 1, 2, …, k

สมมุติว่าคุณมีค่าสมมุติฐานสำหรับแต่ละความน่าจะเป็น p1, p2, …, pk และคำนวณจำนวนคาดหวังสำหรับแต่ละประเภทหรือเซลล์ ถ้าสมมุติฐานคุณถูกต้อง จำนวนเซลล์ที่แท้จริงที่สังเกตได้ Oi ต้องไม่ต่างมากนักจากจำนวนเซลล์ที่คาดหวัง Ei = npi ยิ่งมีความต่างมาก ยิ่งเป็นไปได้สูงที่สมมุติฐานจะผิด สถิติเพียร์สันไคสแควร์ใช้ความแตกต่าง (Oi – Ei) โดยยกกำลังสองความแตกต่างนี้เพื่อกำจัดค่าลบ และตั้งค่าเฉลี่ยถ่วงน้ำหนักของความแตกต่างยกกำลังสองนั้น

สถิติการทดสอบเพียร์สันไคสแควร์

X2 = ∑(Oi – Ei)2 / Ei

ผลรวมของเซลล์ k ทั้งหมด กับ Ei = npi

ถึงแม้ว่าหนังสือนี้จะไม่มีการพิสูจน์ทางคณิตศาสตร์ แต่ก็ยังสามารถแสดงให้เห็นได้ว่าเมื่อ n มีขนาดใหญ่ X2 มีการประมาณการกระจายตัวของความน่าจะเป็นแบบไคสแควร์ในตัวอย่างซ้ำๆ ถ้าจำนวนเซลล์ที่คาดหวังในสมมุติฐานถูกต้อง ความแตกต่าง (Oi – Ei) จะน้อยและ X2 จะใกล้ 0 แต่ถ้าความน่าจะเป็นของสมมุติฐานไม่ถูกต้อง ความแตกต่างมาก (Oi – Ei) จะส่งให้ค่า X2 มากตามไปด้วย คุณควรใช้การทดสอบสถิติทางขวาและดูถึงค่าที่มากเกินปกติของการทดสอบทางสถิติ

การกระจายตัวแบบไคสแควร์ถูกใช้ในบทที่ 10 เพื่อให้ความเห็นเกี่ยวกับความผันแปรของประชากรกลุ่มหนึ่ง σ2 เหมือนกับการกระจายตัวแบบ F ที่ทรงไม่สมมาตรและขึ้นอยู่กับจำนวนระดับความเป็นอิสระ (degree of freedom – df) เมื่อ df ถูกกำหนด คุณสามารถใช้ตารางที่ 5 ใน Appendix I เพื่อหาค่าวิกฤตหรือผูกกับค่า p สำหรับสถิติไคสแควร์ อีกทางเลือกหนึ่งคือคุณสามารถใช้โปรแกรมความน่าจะเป็นไคสแควร์เพื่อหาค่าวิกฤตหรือค่า p ที่แน่นอนสำหรับการทดลอง

df ที่เหมาะสมสำหรับสถิติไคสแควร์ขึ้นอยู่กับโปรแกรมที่คุณใช้ ถึงแม้ว่าเราจะกำหนด df ที่เหมาะสมสำหรับโปรแกรมที่แสดงในบทนี้ คุณก็ยังควรจะใช้กฎพื้นฐานในการกำหนด df สำหรับสถิติไคสแควร์

เกร็ดเล็กเกร็ดน้อย

การทดสอบเพียร์สันไคสแควร์เป็นการทดสอบทางขวาเสมอ

ผู้สอนส่วนตัว

ฉันจะกำหนดตัวเลขที่เหมาะสมของ df ได้อย่างไร?

1. เริ่มด้วยจำนวนประเภทหรือเซลล์ในการทดลอง

2. ลบ 1 df สำหรับแต่ละข้อจำกัดเส้นตรงของความน่าจะเป็นของเซลล์ df จะถูกลบ 1 เสมอเพราะ p1 + p2 + … + pk = 1

3. ในบางครั้งจำนวนเซลล์ที่คาดหวังไม่สามารถคำนวณได้โดยตรง แต่จะต้องถูกประมาณโดยใช้ข้อมูลตัวอย่าง ลบ 1 df ทุกพารามิเตอร์ประชากรที่เป็นอิสระที่ต้องประมาณเพื่อให้ได้ค่าประมาณของ Ei

เราจะเริ่มด้วยการนำไปใช้อย่างง่ายของสถิติการทดสอบไคสแควร์ – การทดสอบสารรูปสนิทดี (the goodness-of-fit test)

14.3 ทดสอบความน่าจะเป็นของเซลล์ที่ระบุ – การทดสอบสารรูปสนิทดี

สมมุติฐานพื้นฐานที่สุดเกี่ยวกับความน่าจะเป็นของเซลล์ที่ระบุค่าตัวเลขสำหรับแต่ละเซลล์ จำนวนเซลล์คาดหวังสามารถคำนวณได้อย่างง่ายๆ โดยใช้ความน่าจะเป็นสมมุติฐาน Ei = npi และใช้เพื่อคำนวณค่าที่สังเกตได้ของสถิติการทดสอบ X2 สำหรับการทดลองอเนกนามประกอบด้วยประเภทหรือเซลล์ k สถิติการทดสอบมีค่าประมาณการกระจายตัว χ2 ที่มี df = (k-1)

ตัวอย่าง 14.1 นักวิจัยออกแบบการทดลองให้หนูลงทางลาดที่แบ่งออกและนำไปสู่ประตูที่มีสีต่างกัน 3 สี นักวิจัยส่งหนูลงทางลาด n = 90 ครั้งและสังเกตทางเลือกในตาราง 14.1 หนูมี (หรือได้มา) ซึ่งความชอบ 1 ใน 3 ประตูนี้หรือไม่?

ตาราง 14.1 ทางเลือกประตูของหนู

ประตูสีเขียว          ประตูสีแดง          ประตูสีน้ำเงิน

จำนวนที่สังเกตได้ (Oi)            20                         39                        31

วิธีทำ ถ้าหนูไม่มีความชอบในทางเลือกของประตู คุณจะคาดหวังให้ในระยะยาวหนูจะเลือกแต่ละประตูด้วยจำนวนครั้งที่เท่ากัน สมมุติฐานหลัก คือ

Ho : p1 = p2 = p3 = 1/3

สมมุติฐานรอง คือ

Ha : มีอย่างน้อย pi ที่ต่างจาก 1/3

เมื่อ pi คือความน่าจะเป็นที่หนูเลือกประตู i โดย i = 1, 2, และ 3 จำนวนเซลล์คาดหวังเท่ากันในทั้ง 3 ประเภท ซึ่งก็คือ npi = 90(1/3) = 30 สถิติการทดสอบไคสแควร์สามารถคำนวณได้โดย

X2 = ∑(Oi – Ei)2 / Ei

= (20-30)2/30 + (39-30)2/30 + (31-30)2/30

= 6.067

สำหรับตัวอย่างนี้ สถิติการทดสอบมี (k-1) = 2 df เพราะว่ามีเพียงข้อจำกัดเส้นตรงบนความน่าจะเป็นของเซลล์ที่ผลรวมจะต้องเท่ากับ 1 ดังนั้นคุณสามารถใช้ตารางที่ 5 ใน Appendix I เพื่อผูกกับค่า p ทางขวา เมื่อค่าที่ได้จากการสังเกต X2 = 6.067 อยู่ระหว่าง χ2.050 = 5.99 และ χ2.025 = 7.38 ค่า p อยู่ระหว่าง .025 และ .050 นักวิจัยจะรายงานผลนัยสำคัญที่ระดับ 5% (P < .05) หมายความว่าสมมุติฐานหลักที่ว่าไม่มีความชอบถูกปฏิเสธ มีหลักฐานเพียงพอที่จะชี้ว่าหนูมีความชอบต่อ 1 ใน 3 ของประตู

หลังจากกำหนดค่าสถิติที่หนูมีความชอบแล้ว คุณยังสามารถบอกอะไรได้อีกจากการทดลอง? ดูที่ข้อมูลว่าความแตกต่างอยู่ที่ไหน โปรแกรมทดสอบสารรูปสนิทดี แสดงในรูป 14.1 จะช่วยได้

รูป 14.1 โปรแกรมทดสอบสารรูปสนิทดี

คุณจะเห็นค่า X2 และค่า p ที่แน่นอน (.0482) ที่ท้ายโปรแกรม ตรงที่เหนือขึ้นไป แท่งสีแสดงการกระจายตัวของความถี่ที่ได้จากการสังเกต แถบสีน้ำเงินแสดงประเภทที่มีค่าจากการสังเกตมากกว่าที่คาดหวัง และเซลล์สีแดง (สีเทาในรูป 14.1) แสดงประเภทที่มีค่าจากการสังเกตน้อยกว่าที่คาดหวัง ความเข้มของสีแสดงความสำคัญของข้อขัดแย้ง ในตัวอย่างนี้ หนูเลือกประตูสีแดงและน้ำเงินบ่อยกว่าที่คาดหวัง และประตูสีเขียวน้อยกว่าที่คาดหวัง ประตูสีน้ำเงินถูกเลือกมากกว่า 1 ใน 3 เพียงนิดหน่อย

31/90 = .344

อย่างไรก็ตาม สัดส่วนของตัวอย่างสำหรับอีก 2 ประตูค่อนข้างต่างจาก 1 ใน 3 หนูเลือกประตูสีเขียวบ่อยน้อยที่สุดเพียง 22%

20/90 = .222

หนูเลือกประตูสีแดงบ่อยที่สุด 43%

39/90 = .433

คุณสามารถสรุปผลของการทดลองโดยบอกว่าหนูชอบประตูสีแดง คุณสามารถสรุปว่าความชอบมีสาเหตุมาจากสีของประตูได้หรือไม่? คำตอบคือไม่ สาเหตุอาจมาจากปัจจัยด้านสรีรศาสตร์หรือจิตศาสตร์อื่นๆ ที่คุณยังไม่ได้สำรวจ หลีกเลี่ยงการบอกถึงสาเหตุความสัมพันธ์ระหว่างสีและความชอบ

เกร็ดเล็กเกร็ดน้อย

เขตปฏิเสธและค่า p อยู่ทางขวาของการกระจายตัวแบบไคสแควร์

ตัวอย่าง 14.2 สัดส่วนของกรุ๊ปเลือด A, B, AB, และ O ในประชากรผิวขาวทั้งหมดในสหรัฐอเมริกา คือ .41, .10, .04, และ .45 ตามลำดับ เพื่อตัดสินว่าสัดส่วนประชากรที่แท้จริงอยู่ในกลุ่มค่าความน่าจะเป็นตามรายงานจริงหรือไม่ จึงมีการสุ่มตัวอย่างคนอเมริกัน 200 คนและทำการบันทึกกรุ๊ปเลือด ค่าที่สังเกตได้และค่าคาดหวังถูกแสดงในตาราง 14.2 ค่าคาดหวังถูกคำนวณด้วย Ei = 200pi จงทดสอบสารรูปสนิทดีของสัดส่วนกรุ๊ปเลือดเหล่านี้

ตาราง 14.2 จำนวนกรุ๊บเลือด

A          B          AB       O

ค่าที่สังเกตได้ (Oi)           89        18        12        81

ค่าคาดหวัง (Ei)                 82        20        8          90

วิธีทำ สมมุติฐานที่ทดสอบถูกกำหนดโดยรูปแบบความน่าจะเป็น

Ho : p1 = .41; p2 = .10; p3 = .04; p4 = .45

กับ

Ha : มีอย่างน้อย 1 ใน 4 ของความน่าจะเป็นที่แตกต่างจากค่าที่ระบุไว้ ดังนั้น

X2 = ∑(Oi – Ei)2 / Ei

= (89-82)2/82 + … + (81-90)2/90

= 3.70

จากตารางที่ 5 ใน Appendix I ด้วย df = (k-1) = 3 คุณสามารถหาว่าค่าที่สังเกตได้ของการทดสอบสถิติน้อยกว่า χ2.100 = 6.25 ดังนั้น ค่า p จึงมากกว่า .10 คุณไม่มีหลักฐานเพียงพอที่จะปฏิเสธ Ho นั่นคือ คุณไม่สามารถบอกได้ว่ากรุ๊ปเลือดคนอเมริกันผิวขาวแตกต่างจากที่รายงานไว้ ผลคือไม่มีนัยสำคัญ

คุณสามารถหาคำแนะนำการใช้ในหัวข้อ “My MINITAB” ท้ายบทนี้ที่ทำให้คุณสามารถทดสอบสารรูปสนิทดีและทราบคำตอบได้ กระบวนการนี้เพิ่งมีขึ้นใน MINITAB 15 ถ้าคุณใช้ MINITAB รุ่นก่อนหน้า คุณก็สามารถทราบคำตอบได้โดยใช้ฟังก์ชั่นเครื่องคิดเลข

ความแตกต่างของการเปรียบเทียบสมมุติฐานสารรูปสนิทดีกับสมมุติฐานอื่น คือ การทดสอบสารรูปสนิทดี นักวิจัยจะใช้สมมุติฐานหลักเพื่อระบุรูปแบบที่เชื่อว่าจริง แทนที่จะเป็นรูปแบบที่เชื่อว่าไม่จริง เมื่อคุณไม่สามารถปฏิเสธ Ho ในตัวอย่างกรุ๊ปเลือด ผลเป็นไปอย่างที่คาดหวัง แต่ต้องระวังว่าอย่างไรก็ตามเมื่อคุณรายงานผลการทดสอบสารรูปสนิทดี คุณไม่สามารถบอกด้วยความมั่นใจได้ว่ารูปแบบถูกต้องอย่างแน่นอนโดยไม่ได้รายงานค่า β สำหรับบางทางเลือกในเชิงปฏิบัติ

แบบฝึกหัด 14.3

เทคนิคพื้นฐาน

14.1 บอกถึงลักษณะเฉพาะของการทดลองอเนกนาม

14.2 ใช้ตารางที่ 5 ใน Appendix I เพื่อหาค่า χ2 ในพื้นที่ α ทางขวา

a. α = .05, df = 3                     b. α = .01, df = 8

14.3 บอกเขตปฏิเสธสำหรับการทดสอบไคสแควร์ของความน่าจะเป็นที่ระบุ ถ้าการทดลองมี k ประเภทในกรณีดังต่อไปนี้

a. k = 7, α = .05                      b. k = 10, α = .01

14.4 ใช้ตารางที่ 5 ใน Appendix I เพื่อผูกค่า p กับการทดสอบไคสแควร์

a. X2 = 4.29, df = 5                 b. X2 = 20.62, df = 6

14.5 สมมุติว่าผลตอบรับอยู่ใน 1 ใน 5 ประเภท k ด้วยความน่าจะเป็น p1, p2, …, p5 และผลตอบรับ n = 300 เป็นจำนวนในประเภทต่อไปนี้

ประเภท                                  1          2          3          4          5

จำนวนที่มีการสังเกต         47        63        74        51        65

a. ทั้ง 5 ประเภทมีโอกาสการเกิดเท่ากันหรือไม่? จะทดสอบสมมุติฐานนี้อย่างไร?

b. ถ้าคุณทดสอบสมมุติฐานนี้โดยใช้สถิติไคสแควร์ การทดสอบจะมี df เท่าไหร่?

c. หาค่าวิกฤตของ χ2 ที่กำหนดเขตปฏิเสธด้วย α = .05

d. คำนวณค่าที่สังเกตได้ของสถิติการทดสอบ

e. ทำการทดสอบและบอกถึงข้อสรุป

14.6 สมมุติว่าผลตอบรับอยู่ใน 1 ใน 3 ประเภท k ด้วยความน่าจะเป็น p1 = .4, p2 = .3, และ p3 = .3 และผลตอบรับ n = 300 เป็นจำนวนในประเภทต่อไปนี้

ประเภท                                      1          2          3

จำนวนที่สังเกตได้                 130      98        72

ข้อมูลมีหลักฐานเพียงพอหรือไม่ที่จะชี้ว่าความน่าจะเป็นของเซลล์แตกต่างจากที่ระบุไว้ของทั้ง 3 ประเภท? หาค่าประมาณ p และใช้มันในการตัดสินใจ

โปรแกรม

14.7 เลนส์ที่คุณชอบ – ถนน 4 เลนส์ถูกศึกษาว่าคนขับชอบเลนส์ด้านในมากกว่าหรือไม่ มีการสังเกตรถจำนวน 1000 คันในช่วงรถติดตอนเช้า และจำนวนรถในแต่ละเลนส์ถูกบันทึกดังนี้

เลนส์                                           1          2          3          4

จำนวนที่มีการสังเกตได้       294      276      238      192

ข้อมูลมีหลักฐานเพียงพอที่จะชี้ว่าผู้ขับมีความชอบบางเลนส์มากกว่าหรือไม่? การทดสอบใช้ α = .05 ถ้ามีความแตกต่าง ให้กล่าวถึงความแตกต่างนั้น

14.8 ต้น Peony – ต้น Peony ที่มีดอกสีแดงถูกผสมข้ามพันธุ์กับต้นที่มีดอกลาย นักพันธุศาสตร์บอกว่า ผล 75% ของการผสมพันธุ์นี้จะมีดอกสีแดง เพื่อทดสอบคำกล่าวนั้น เมล็ดพันธุ์ 100 เมล็ดจากการผสมข้ามพันธุ์นี้ถูกรวบรวมและเพาะพันธุ์ โดย 58 ต้นเป็นดอกสีแดง ใช้การทดสอบสารรูปสนิทดีไคสแควร์เพื่อตัดสินว่าข้อมูลตัวอย่างยืนยันการคาดการณ์ของนักพันธุศาสตร์

14.9 หัวใจวายในวันจันทร์ – คุณเกลียดวันจันทร์มั๊ย? นักวิจัยจากเยอรมันให้อีกเหตุผลหนึ่งสำหรับคุณ พวกเขาสรุปว่าความเสี่ยงของการเกิดหัวใจวายสำหรับคนทำงานมีในวันจันทร์มากกว่าวันอื่นๆ ถึง 50% นักวิจัยเก็บข้อมูลหัวใจวายและโรคหลอดเลือดหัวใจตีบในช่วง 5 ปีกว่าใน 330,000 คนที่อาศัยอยู่ใกล้เมือง Augsburg ประเทศเยอรมัน เพื่อพิสูจน์ข้ออ้างของเขา คุณจึงทำการสำรวจคนทำงาน 200 คนที่เคยหัวใจวายและบันทึกวันที่เกิดอาการหัวใจวาย:

วัน                      จำนวนที่สังเกตได้

อาทิตย์               24

จันทร์                  36

อังคาร                 27

พุธ                       26

พฤหัส                  32

ศุกร์                      26

เสาร์                     29

ข้อมูลแสดงหลักฐานเพียงพอที่จะชี้ว่ามีความแตกต่างในการเกิดหัวใจวายโดยขึ้นอยู่กับวันในสัปดาห์หรือไม่? ให้ทดสอบโดยใช้ α = .05

14.10 สถิติการตาย – สถิติทางการแพทย์แสดงการตายด้วย 4 โรคหลัก (ที่ไม่ใช่อุบัติเหตุ) คือ A, B, C, และ D เป็น 15%, 21%, 18%, และ 14% ตามลำดับ จากการศึกษาสาเหตุการตายที่ไม่ใช่อุบัติเหตุ 308 ครั้งที่โรงพยาบาลมีจำนวนดังนี้

โรค                           A          B          C          D          อื่นๆ

การตาย                   43        76        85        21        83

ข้อมูลเหล่านี้เป็นหลักฐานที่เพียงพอจะชี้ว่าสัดส่วนผู้ตายจากโรค A, B, C, และ D ที่โรงพยาบาลนี้ต่างจากสัดส่วนที่มีการสะสมจากประชากรกลุ่มใหญ่หรือไม่?

14.11 โรคจิตเภท – นักวิจัยนำเสนอความเชื่อมโยงระหว่างจำนวนการเกิดโรคจิตเภทและการเกิดในบางเดือน ซึ่งมีการติดเชื้อไวรัสบ่อย สมมุติว่าคุณทำงานในปัญหาที่คล้ายกันและคุณสงสัยว่ามีความเชื่อมโยงระหว่างโรคที่เกิดในตอนอายุมากและเดือนที่เกิด

คุณมีบันทึกโรค 400 กรณีและคุณจำแนกเดือนเกิดตามที่แสดงในตาราง ข้อมูลมีหลักฐานเพียงพอที่จะชี้ว่าสัดส่วนจำนวนของโรคแตกต่างกันในแต่ละเดือนเกิดหรือไม่? โดยทำการทดสอบด้วย α = .05

เดือน       ม.ค.         ก.พ.         มี.ค.         เม.ษ.         พ.ค.         มิ.ย.

เกิด          38            31            42            46             28            31

เดือน       ก.ค.         ส.ค.         ก.ย.         ต.ค.         พ.ย.         ธ.ค.

เกิด          24           29            33            36            27           35

14.12 ถั่วหวาน – สมมุติว่าคุณสนใจในคุณสมบัติพิเศษที่เป็นอิสระของถั่วหวาน – พื้นผิวของเมล็ด (S = ลื่น, s = ย่น) และสีของเมล็ด (Y = สีเหลือง, y = สีเขียว) ในรุ่นที่ 2 ที่มีการผสมข้ามพันธุ์ ทฤษฎีของแมนเดลบอกว่าจำนวนของถั่วที่ลื่นและเป็นสีเหลือง, ย่นและเป็นสีเหลือง, ลื่นและเป็นสีเขียว, ย่นและเป็นสีเขียว จะอยู่ในสัดส่วน 9:3:3:1 สมมุติว่าถั่วหวานที่ถูกสุ่มเลือก 100 เมล็ด มี 56, 19, 17, และ 8 ในแต่ละประเภทตามลำดับ ข้อมูลเหล่านี้แสดงว่ารูปแบบ 9:3:3:1 ถูกต้องหรือไม่? โดยทำการทดสอบด้วย α = .01

14.13 M&M’S – เว็บไซต์กลุ่มบริษัท Mars รายงาน % ของสีลูกอมช็อกโกแลตนม M&M’S ดังนี้

สีอะไรอยู่ในถุงของคุณ?

น้ำตาล    13%

เหลือง    14%

แดง    13%

น้ำเงิน    24%

ส้ม    20%

เขียว    16%

ถุงช็อกโกแลตนม M&M’S ขนาด 14 ออนซ์ ถูกสุ่มเลือกขึ้นมาและมีสีน้ำตาล 70 เม็ด, เหลือง 72 เม็ด, แดง 61 เม็ด, น้ำเงิน 118 เม็ด, ส้ม 108 เม็ด, และเขียว 85 เม็ด ข้อมูลนี้ยืนยัน % ที่ถูกรายงานโดยกลุ่มบริษัท Mars ได้หรือไม่? ใช้การทดสอบที่เหมาะสมและอธิบายลักษณะความแตกต่าง (ถ้ามี)

14.14 ถั่ว M&M’S – % สีที่แตกต่างกันของถั่ว M&M’S รายงานในเว็บไซต์กลุ่มบริษัท Mars เป็นดังนี้

สีอะไรอยู่ในถุงคุณ?

น้ำตาล    12%

เหลือง    15%

แดง    12%

น้ำเงิน    23%

ส้ม    23%

เขียว    15%

ถุงช็อกโกแลตถั่ว M&M’S ขนาด 14 ออนซ์ ถูกสุ่มเลือกขึ้นมาและมีสีน้ำตาล 70 เม็ด, เหลือง 87 เม็ด, แดง 64 เม็ด, น้ำเงิน 115 เม็ด, ส้ม 106 เม็ด, และเขียว 85 เม็ด ข้อมูลนี้ยืนยัน % ที่ถูกรายงานโดยกลุ่มบริษัท Mars หรือไม่? ใช้การทดสอบที่เหมาะสมและอธิบายลักษณะความแตกต่าง (ถ้ามี)

14.15 มาตรฐานการรับเข้าเรียน – บันทึกการลงทะเบียนในครั้งก่อนของมหาวิทยาลัยขนาดใหญ่ชี้ว่าจำนวนรวมของคนที่สมัครเข้าเรียน 60% ถูกรับเข้าโดยไม่มีเงื่อนไข, 5% ถูกรับเข้าโดยต้องมีการทดลองเรียน, และที่เหลือถูกปฏิเสธการรับเข้า จาก 500 ใบสมัครในปีปัจจุบัน 329 ผู้สมัครถูกรับเข้าโดยไม่มีเงื่อนไข, 43 ผู้สมัครถูกรับเข้าโดยต้องมีการทดลองเรียน, และที่เหลือถูกปฏิเสธการรับเข้า ข้อมูลเหล่านี้แสดงความแตกต่างจากระดับการรับเข้าในปีก่อนหน้าหรือไม่? ทดสอบโดย α = .05

14.4 ตารางความเป็นไปได้: การแยก 2 ประเภท

ในบางเหตุการณ์ นักวิจัยแยกประเภทหน่วยการทดลองตาม 2 ตัวแปรเชิงคุณภาพเพื่อสร้างข้อมูล 2 กลุ่มการกระจาย ซึ่งอธิบายในบทที่ 3

  • เฟอร์นิเจอร์ชิ้นที่เสียถูกแยกประเภทตามชนิดที่เสียและตามกะการผลิต
  • ศาสตราจารย์ถูกแยกประเภทตามระดับความเชี่ยวชาญและประเภทของมหาวิทยาลัย (รัฐหรือเอกชน) ที่ทำงานอยู่
  • คนไข้ถูกแยกประเภทตามชนิดของการรักษาไข้หวัดใหญ่ที่เขาได้รับและการที่เขาได้รับไข้หวัดใหญ่ในช่วงหน้าหนาวหรือไม่

เมื่อ 2 ตัวแปรแยกประเภทถูกบันทึก คุณสามารถสรุปข้อมูลโดยนับจำนวนหน่วยที่มีการสังเกตในแต่ละจุดตัดของประเภท ผลการนับแสดงในตารางความเป็นไปได้

ตัวอย่าง 14.3 จำนวนรวมของเฟอร์นิเจอร์ที่เสีย n = 309 ชิ้น ถูกบันทึกและถูกจำแนกเป็น 4 ชนิด A, B, C, และ D ในขณะเดียวกัน แต่ละชิ้นถูกระบุกะที่ผลิต การนับนี้แสดงในตารางความเป็นไปได้ 14.3

ตาราง 14.3 ตารางความเป็นไปได้

ชนิดของของเสีย              กะ 1      กะ 2      กะ 3      รวม

A                                          15        26        33        74

B                                           21        31        17        69

C                                           45        34        49        128

D                                           13        5          20        38

รวม                                       94        96        119      309

เมื่อคุณศึกษาข้อมูลที่เกี่ยวกับ 2 ตัวแปร สิ่งสำคัญที่ต้องพิจารณาคือความสัมพันธ์ระหว่าง 2 ตัวแปร สัดส่วนที่นับได้ในแต่ละประเภทของปัจจัยที่ 1 ขึ้นอยู่กับแต่ละประเภทของปัจจัยที่ 2 ที่มีการสังเกตหรือไม่? ในตัวอย่างของเฟอร์นิเจอร์ สัดส่วนของของเสียประเภทต่างๆ เปลี่ยนแปลงในแต่ละกะ หรือว่าเหมือนเดิม ไม่เกี่ยวกับกะการทำงาน? คุณอาจจำเหตุการณ์ที่เกิดขึ้นคล้ายกันเรียกว่า ปฏิสัมพันธ์ในการทดลองแบบแฟคทอเรียล a x b ในบทที่ 11 ในการวิเคราะห์ตารางความเป็นไปได้ วัตถุประสงค์คือการตัดสินว่าวิธีการจำแนกประเภทมีความเป็นไปได้หรือขึ้นอยู่กับอีกวิธีของการจำแนกประเภทหรือไม่ ถ้าไม่ ทั้ง 2 วิธีถือว่าเป็นอิสระต่อกัน

เกร็ดเล็กเกร็ดน้อย

ด้วยการจำแนกประเภท 2 ทาง เราจะไม่ทดสอบสมมุติฐานเกี่ยวกับความเป็นไปได้ที่ระบุ เราทดสอบว่า 2 วิธีการแยกประเภทเป็นอิสระต่อกันหรือไม่

การทดสอบความเป็นอิสระต่อกันไคสแควร์ (The Chi-Square Test of Independence)

คำถามถึงความเป็นอิสระต่อกันของ 2 วิธีการแยกประเภทสามารถตรวจสอบโดยใช้การทดสอบสมมุติฐานด้วยสถิติไคสแควร์ โดยมีสมมุติฐานดังนี้

Ho : 2 วิธีการแยกประเภทเป็นอิสระต่อกัน

Ha : 2 วิธีการแยกประเภทไม่เป็นอิสระต่อกัน

สมมุติว่าเรากำหนดให้จำนวนเซลล์ที่มีการสังเกตในแถว i และคอลัมน์ j ของตารางความเป็นไปได้เป็น Oij ถ้าคุณรู้จำนวนเซลล์คาดหวัง (Eij = npij) ภายใต้สมมุติฐานหลักของความเป็นอิสระต่อกัน ดังนั้นคุณสามารถใช้สถิติไคสแควร์เพื่อเปรียบเทียบจำนวนที่สังเกตได้และจำนวนคาดหวัง อย่างไรก็ตาม ค่าคาดหวังจะไม่ถูกระบุใน Ho อย่างในตัวอย่างก่อนหน้า

เพื่ออธิบายวิธีประมาณจำนวนเซลล์คาดหวังเหล่านี้ เราต้องทบทวนหลักการเหตุการณ์ที่เป็นอิสระต่อกันในบทที่ 4 พิจารณา pij ความน่าจะเป็นที่สิ่งที่เราสังเกตจะอยู่ในแถว i และคอลัมน์ j ของตารางความเป็นไปได้ ถ้าแถวและคอลัมน์เป็นอิสระต่อกันแล้ว

Pij = P (สิ่งที่เราสังเกตอยู่ในแถว i และคอลัมน์ j)

= P (สิ่งที่เราสังเกตอยู่ในแถว i) X P (สิ่งที่เราสังเกตอยู่ในคอลัมน์ j)

= PiPj

โดยที่ Pi และ Pj เป็นความน่าจะเป็นที่ไม่มีเงื่อนไขหรือมีขอบเขตที่จะอยู่ในแถว i หรือคอลัมน์ j ตามลำดับ ถ้าคุณสามารถได้ค่าประมาณที่ถูกต้องของความน่าจะเป็นที่มีขอบเขต คุณสามารถใช้มันใน pij ในสูตรสำหรับการนับจำนวนเซลล์คาดหวัง

โชคดีที่การประมาณนี้มีอยู่ จริงๆ แล้วมันเหมือนกับที่คุณจะเลือกโดยธรรมชาติอยู่แล้ว:

  • การประมาณความน่าจะเป็นในแถวใช้

i = จำนวนรวมที่สังเกตได้ในแถว i / จำนวนรวมที่สังเกตได้ทั้งหมด = ri / n

  • การประมาณความน่าจะเป็นในคอลัมน์ใช้

j = จำนวนรวมที่สังเกตได้ในคอลัมน์ j / จำนวนรวมที่สังเกตได้ทั้งหมด = cj / n

การประมาณจำนวนเซลล์ที่คาดหวังสำหรับแถว i และคอลัมน์ j มาจากสมมุติฐานความเป็นอิสระต่อกัน

เกร็ดเล็กเกร็ดน้อย

df ของตารางความเป็นไปได้ r x c คือ df = (r-1)(c-1)

การประมาณจำนวนเซลล์ที่คาดหวัง

Êij = n (ri / n) (cj / n) = ricj / n

โดยที่ ri เป็นผลรวมของแถว i และ cj เป็นผลรวมของคอลัมน์ j

สถิติการทดสอบไคสแควร์สำหรับตารางความเป็นไปได้ด้วยแถว r และคอลัมน์ c คำนวณโดย

X2 = ∑(Oij – Êij)2 / Êij

และสามารถแสดงการประมาณการกระจายตัวไคสแควร์ด้วย

df = (r-1)(c-1)

ถ้าค่าที่สังเกตได้ของ X2 สูงมาก สมมุติฐานหลักของความเป็นอิสระต่อกันจะถูกปฏิเสธ

ตัวอย่าง 14.4 ตามตัวอย่าง 14.3 ข้อมูลที่แสดงเป็นหลักฐานที่เพียงพอจะชี้ว่าชนิดของเฟอร์นิเจอร์ที่เสียเปลี่ยนแปลงตามกะการผลิตหรือไม่?

วิธีทำ การประมาณจำนวนเซลล์ที่คาดหวังถูกแสดงในวงเล็บในตาราง 14.4 เช่น การประมาณจำนวนเซลล์ที่คาดหวังสำหรับของเสียชนิด C ที่ผลิตในกะ 2 คือ

Ê32 = r3c2 / n = (128)(96) / 309 = 39.77

ตาราง 14.4 จำนวนเซลล์ที่สังเกตได้และที่คาดหวัง

ชนิดของของเสีย                   กะ 1                      กะ 2                     กะ 3                       รวม

A                                            15 (22.51)        26 (22.99)        33 (28.50)        74

B                                             21 (20.99)       31 (21.44)         17 (26.57)        69

C                                             45 (38.94)        34 (39.77)       49 (49.29)        128

D                                             13 (11.56)        5 (11.81)            20 (14.63)         38

รวม                                         94                        96                        119                       309

คุณสามารถใช้ค่าที่แสดงในตาราง 14.4 เพื่อคำนวณการทดสอบทางสถิติดังนี้

X2 = ∑(Oij – Êij)2 / Êij

= (15-22.51)2 / 22.51 + (26-22.99)2 / 22.99 + … + (20-14.63)2 / 14.63

= 19.18

เมื่อคุณดูการกระจายตัวไคสแควร์ในตารางที่ 5 ใน Appendix I ด้วย

df = (r-1)(c-1) = (4-1)(3-1) = 6

การทดสอบทางสถิติที่สังเกตได้มากกว่า χ2.005 = 18.5476 ซึ่งชี้ว่าค่า p น้อยกว่า .005 คุณสามารถปฏิเสธ Ho และบอกว่าผลมีนัยสำคัญมาก (P < .005) มีหลักฐานเพียงพอที่จะชี้ว่าสัดส่วนชนิดของเสียเปลี่ยนแปลงตามกะการผลิต

อีกคำถามที่เห็นได้ชัด คุณควรถามเกี่ยวกับลักษณะความสัมพันธ์ระหว่างทั้ง 2 ประเภท กะใดผลิตของเสียชนิดใดมากกว่ากัน? ในการทดลองแฟคทอเรียลในบทที่ 11 เมื่อมีความสัมพันธ์ (หรือปฏิสัมพันธ์) คุณต้องดูในตารางที่สัดส่วนที่มีความสัมพันธ์หรือเป็นเงื่อนไขสำหรับแต่ละประเภท ตัวอย่างเช่น กะที่ 1 ผลิตของเสียทั้งหมด 94 ชิ้น ของเสียเหล่านี้สามารถแบ่งเป็นชนิดโดยใช้สัดส่วนที่เป็นเงื่อนไขสำหรับตัวอย่างนี้แสดงในคอลัมน์แรกของตาราง 14.5 ถ้าคุณทำแบบเดียวกันกับอีก 2 กะ คุณจะสามารถเปรียบเทียบการกระจายตัวชนิดของของเสียใน 3 กะ ดังแสดงในตาราง 14.5

ลองเปรียบเทียบ 3 กลุ่มของสัดส่วน (แต่ละกลุ่มผลรวมเท่ากับ 1) จะเห็นว่ากะ 1 และ 2 ผลิตของเสียในลำดับที่เหมือนกัน – ชนิด C, B, A, และ D จากมากที่สุดไปน้อยที่สุด – แต่ในสัดส่วนที่ต่างกัน กะ 3 แสดงรูปแบบที่แตกต่างออกไป – ของเสียมากที่สุดยังเป็นชนิด C แต่ตามด้วยชนิด A, D, และ B ขึ้นอยู่กับว่าของเสียชนิดใดสำคัญที่สุดต่อผู้ผลิต แต่ละกะควรได้รับการตักเตือนแยกกันเกี่ยวกับเหตุผลในการทำของเสียมากเกินไป

ตาราง 14.5 ความน่าจะเป็นแบบมีเงื่อนไขสำหรับชนิดของของเสียในแต่ละกะ

ชนิดของเสีย                          กะ 1                  กะ 2                  กะ 3

A                                 15 / 94 = .16    26 / 96 = .27    33 / 119 = .28

B                                 21 / 94 = .22    31 / 96 = .32    17 / 119 = .14

C                                 45 / 94 = .48    34 / 96 = .35    49 / 119 = .41

D                                 13 / 94 = .14    5 / 96 = .05      20 / 119 = .17

รวม                                         1.00                 1.00                 1.00

โปรแกรม

โปรแกรม Chi-Square Test of Independence สามารถช่วยคุณมองเห็นการกระจายความถี่ของค่าที่สังเกตได้ ในรูป 14.2 (a) แถบสีน้ำเงินแสดงประเภทที่มีของเสียมากกว่าค่าคาดหวัง และแถบสีแดง (สีเทาในรูป) แสดงประเภทที่มีของเสียน้อยกว่าค่าคาดหวัง ความเข้มของสีแสดงความสำคัญของข้อขัดแย้ง ในรูป 14.2 (b) เราใช้ปุ่ม Data/Null เพื่อดูการกระจายตัวที่คาดหวังของของเสียถ้าสมมุติฐานหลักเป็นจริง ความสูงของสี่เหลี่ยมในแต่ละคอลัมน์ตรงกับการกระจายตัวแบบมีเงื่อนไขของของเสียในแต่ละกะตามตาราง 14.5 เราจะใช้โปรแกรมนี้สำหรับแบบฝึกหัดโปรแกรมท้ายบท

รูป 14.2 โปรแกรม Chi-Square Test of Independence

ผู้สอนส่วนตัว

ฉันจะกำหนดตัวเลขที่เหมาะสมของ df ได้อย่างไร?

ตามวิธีทั่วไปสำหรับกำหนด df:

1. เริ่มด้วยประเภทหรือเซลล์ k = rc ในตารางความเป็นไปได้

2. ลบ 1 df เนื่องจากความน่าจะเป็นของทุกเซลล์ rc ต้องรวมได้ 1

3. คุณต้องประมาณความน่าจะเป็นของแถว (r-1) และคอลัมน์ (c-1) เพื่อประมาณจำนวนเซลล์คาดหวัง (ความน่าจะเป็นของแถวและคอลัมน์สุดท้ายถูกกำหนดเพราะความน่าจะเป็นของแถวและคอลัมน์ด้านข้างต้องรวมได้ 1 เช่นกัน) ลบ df (r-1) และ (c-1)

ผลรวม df ของตารางความเป็นไปได้ r x c คือ

df = rc – 1 – (r-1) – (c-1) = rc – r – c + 1 = (r-1)(c-1)

ตัวอย่าง 14.5 มีการสำรวจเพื่อวัดประสิทธิผลของวัคซีนไข้หวัดใหญ่ชนิดใหม่ที่มีการใช้ในชุมชนเล็กๆ วัคซีนมีการให้บริการฟรี 2 ครั้งติดต่อกันในช่วง 2 สัปดาห์ บางคนได้รับวัคซีน 2 ครั้ง บางคนรับวัคซีนเพียง 1 ครั้ง บางคนไม่ต้องรับวัคซีนเลย จากการสำรวจคนในท้องถิ่น 1,000 คนในฤดูใบไม้ผลิต่อมาได้ข้อมูลดังแสดงในตาราง 14.6 ข้อมูลแสดงหลักฐานเพียงพอที่จะชี้ว่าวัคซีนประสบความสำเร็จในการลดจำนวนผู้เป็นไข้หวัดใหญ่ในชุมชนหรือไม่?

ตาราง 14.6 ตารางความเป็นไปได้ 2 X 3

ไม่รับวัคซีน           รับวัคซีน 1 ครั้ง    รับวัคซีน 2 ครั้ง    รวม

เป็นไข้หวัดใหญ่                                    24                         9                           13                        46

ไม่เป็นไข้หวัดใหญ่                               289                      100                      565                     954

รวม                                                         313                      109                      578                     1000

วิธีทำ ความสำเร็จของวัคซีนในการลดจำนวนคนเป็นไข้หวัดใหญ่สามารถวัดได้จาก 2 ส่วน

  • ถ้าวัคซีนประสบความสำเร็จ สัดส่วนของคนที่เป็นไข้หวัดใหญ่ควรจะมีความแตกต่าง ขึ้นอยู่กับจำนวนวัคซีนที่ได้รับ
  • ไม่เพียงแต่จะต้องมีความสัมพันธ์นั้น แต่สัดส่วนคนที่เป็นไข้หวัดใหญ่ยังต้องน้อยลงเมื่อมีการให้วัคซีนเพิ่มขึ้นจาก 0 ถึง 2 ครั้ง

ส่วนแรกสามารถทดสอบโดยใช้ไคสแควร์ด้วยสมมุติฐานดังนี้

Ho : ไม่มีความสัมพันธ์ระหว่างการให้วัคซีนและการเกิดไข้หวัดใหญ่

Ha : การเกิดไข้หวัดใหญ่ขึ้นอยู่กับจำนวนวัคซีนที่ให้

โดยทั่วไป โปรแกรมคอมพิวเตอร์สามารถกำจัดการคำนวณที่น่ารำคาญ และถ้าข้อมูลที่ใส่เข้าไปถูกต้อง มันจะให้ผลที่ถูกต้องเกี่ยวกับค่าที่สังเกตได้ของการทดสอบสถิติและค่า p เช่น รูปที่ 14.3 ที่ได้จาก MINITAB คุณสามารถหาวิธีสร้างดังรูปนี้ในส่วน MINITAB ท้ายบทนี้ ค่าที่สังเกตได้ของการทดสอบทางสถิติ X2 = 17.313 มีค่า p .000 และผลบอกถึงนัยสำคัญระดับสูง นั่นคือ สมมุติฐานหลักถูกปฏิเสธ หรือมีหลักฐานเพียงพอจะชี้ว่ามีความสัมพันธ์ระหว่างการให้วัคซีนและการเกิดไข้หวัดใหญ่

รูป 14.3 ผล MINITAB สำหรับตัวอย่าง 14.5 – การทดสอบไคสแควร์: ไม่รับวัคซีน, รับวัคซีน 1 ครั้ง, รับวัคซีน 2 ครั้ง

ลักษณะของความสัมพันธ์นี้คืออะไร? เพื่อตอบคำถามนี้ ดูที่ตาราง 14.7 และรูปที่ 14.4 ที่มีการเกิดของไข้หวัดใหญ่ในตัวอย่างของแต่ละกลุ่มการให้วัคซีน คำตอบเห็นได้ชัด กลุ่มที่ได้รับวัคซีน 2 ครั้งมีความอ่อนแอต่อไข้หวัดใหญ่น้อยกว่า ส่วนกลุ่มที่ได้รับวัคซีน 1 ครั้งดูเหมือนไม่ได้ทำให้ความอ่อนแอต่อไข้หวัดใหญ่น้อยลง

ตาราง 14.7 การเกิดของไข้หวัดใหญ่ของแต่ละการรับวัคซีน

ไม่รับวัคซีน           รับวัคซีน 1 ครั้ง    รับวัคซีน 2 ครั้ง

24/313 = .08    9/109 = .08      13/578 = .02

รูป 14.4 โปรแกรม Chi-Square Test of Independence

แบบฝึกหัด 14.4

เทคนิคพื้นฐาน

14.16 คำนวณค่าและกำหนดตัวเลข df ของ X2 สำหรับตารางความเป็นไปได้เหล่านี้:

a.         แถว                        คอลัมน์ 1           คอลัมน์ 2               คอลัมน์ 3           คอลัมน์ 4

1                      120                    70                          55                      16

2                      79                      108                        95                      43

3                      31                       49                          81                       140

b.         แถว                         คอลัมน์ 1           คอลัมน์ 2               คอลัมน์ 3

1                       35                      16                           84

2                      120                    92                           206

14.17 สมมุติว่าการสำรวจลูกค้าสรุปผล n = 307 คนในตารางความเป็นไปได้ที่มี 3 และแถว 5 คอลัมน์ แล้ว df ด้วยการทดสอบสถิติไคสแควร์จะเป็นเท่าไหร่?

14.18 ผลการสำรวจ 400 ชุดทำให้เกิดจำนวนเซลล์ในตารางความเป็นไปได้ 2 X 3:

แถว                        คอลัมน์ 1           คอลัมน์ 2               คอลัมน์ 3           รวม

1                              37                      34                          93                      164

2                              66                      57                         113                     236

รวม                          103                   91                          206                    400

a. ถ้าคุณอยากทดสอบสมมุติฐานหลักของความเป็นอิสระต่อกันที่ความน่าจะเป็นที่ตอบรับในแถวใดๆ เป็นอิสระจากคอลัมน์นั้นๆ และคุณวางแผนจะใช้การทดสอบไคสแควร์ แล้ว df ของสถิติ χ2 ควรเป็นเท่าไหร่?

b. หาค่าทดสอบทางสถิติ

c. หาเขตปฏิเสธด้วย α = .01

d. ทำการทดสอบและบอกข้อสรุป

e. หาค่าประมาณ p สำหรับการทดสอบและแสดงค่าของมัน

14.19 ความแตกต่างทางเพศ – คำถามที่ชายและหญิงตอบเกี่ยวกับความแตกต่างทางเพศถูกแบ่งเป็น 3 กลุ่มตามคำตอบจากคำถามแรก

กลุ่ม 1   กลุ่ม 2   กลุ่ม 3

ชาย       37        49        72

หญิง      7          50        31

ใช้ผลที่ได้จาก MINITAB ตัดสินว่ามีความแตกต่างในคำตอบระหว่างเพศหรือไม่ อธิบายลักษณะความแตกต่างนั้น (ถ้ามี)

ผลที่ได้จาก MINITAB สำหรับแบบฝึกหัด 14.19

การทดสอบไคสแควร์: กลุ่ม 1, กลุ่ม 2, กลุ่ม 3

การนำไปใช้

14.20 การดูแลสุขภาพที่จำเป็น – ในปี 2006 มีกฎหมายใหม่ในรัฐแมสซาชูเสตให้ผู้พักอาศัยทุกคนมีประกันสุขภาพ ผู้มีรายได้น้อยจะได้รับเงินช่วยเหลือจากรัฐเพื่อช่วยจ่ายค่าประกัน แต่ทุกคนจะต้องมีการจ่ายเพื่อบริการด้านสุขภาพ คนที่ไม่มีประกันจะถูกปรับที่นายจ้างซึ่งไม่ทำการช่วยเหลือ โพลสำนักข่าว ABC / สำนักข่าววอชิงตันสอบถามผู้ใหญ่ทั่วประเทศ n = 1,027 คนด้วยคำถามว่า คุณสนับสนุนหรือต่อต้านแผนนี้ในรัฐของคุณ? ผลการศึกษาได้ข้อมูลดังนี้

ฝ่าย                       สนับสนุน               ไม่สนับสนุน          ไม่แน่ใจ

เดโมแครต             256                      163                       22

อิสระ                      60                         40                         5

รีพับบลิกัน             235                       222                      24

a. มีความแตกต่างอย่างมีนัยสำคัญในสัดส่วนของผู้ถูกสำรวจที่สนับสนุน, ต่อต้าน, และไม่แน่ใจเกี่ยวกับแผนนี้ระหว่างฝ่ายเดโมแครต, อิสระ, และรีพับบลิกันหรือไม่? ใช้ α = .05

b. ถ้าความแตกต่างมีนัยสำคัญ อธิบายลักษณะของความแตกต่างโดยหาสัดส่วนของผู้ที่สนับสนุน, ต่อต้าน, และไม่แน่ใจในแต่ละฝ่าย

14.21 ทารกที่มีความกังวล – มีการศึกษาโดย Joseph Jacobson และ Diane Wille เพื่อตัดสินผลกระทบของการดูแลทารกต่อรูปแบบการติดแม่ ในการศึกษาทารก 93 คนถูกแยกประเภทเป็น “ไม่กังวล” หรือ “กังวล” โดยใช้กรอบสถานการณ์ที่ไม่ปกติของ Ainsworth นอกจากนี้ทารกยังถูกแบ่งด้วยค่าเฉลี่ยชั่วโมงต่อสัปดาห์ที่อยู่ในศูนย์ดูแลเด็ก ข้อมูลแสดงในตารางดังนี้

น้อย (0-3 ชม.)                ปานกลาง (4-19 ชม.)       มาก (20-54 ชม.)

ไม่กังวล             24                                    35                                      5

กังวล                  11                                    10                                       8

a. ข้อมูลให้หลักฐานที่เพียงพอจะชี้ว่ามีความแตกต่างในรูปแบบการติดแม่ขึ้นอยู่กับจำนวนเวลาที่เด็กอยู่ในศูนย์ดูแลหรือไม่? ใช้การทดสอบ α = .05

b. ค่าประมาณ p ในการทดสอบข้อ a คือเท่าไหร่?

14.22 ลักษณะการใช้จ่าย – มีความแตกต่างของลักษณะการใช้จ่ายของนักเรียนมัธยมปลายในแต่ละเพศหรือไม่? การศึกษาสำรวจคำถามนี้ในนักศึกษามัธยมปลาย 196 คน นักเรียกถูกถามเพื่อแบ่งจำนวนเงินที่ได้รับที่เขาใช้จ่ายเกี่ยวกับรถในเดือนหนึ่ง:

ไม่เลย/นิดหน่อย          บางส่วน          ครึ่งหนึ่ง          ส่วนใหญ่          ทั้งหมด/เกือบ

ชาย         73                                12                    6                      4                        3

หญิง        57                                15                    11                    9                        6

ใช้ส่วนหนึ่งของผลที่ได้จาก MINITAB เพื่อวิเคราะห์ความสัมพันธ์ระหว่างรูปแบบการใช้จ่ายและเพศ เขียนข้อความสั้นๆ อธิบายข้อสรุปทางสถิติของคุณและความหมายในเชิงปฏิบัติ

ส่วนหนึ่งของผล MINITAB สำหรับแบบฝึกหัด 14.22

การทดสอบไคสแควร์: ไม่เลย, บางส่วน, ครึ่งหนึ่ง, ส่วนใหญ่, ทั้งหมด

14.23 การรอใบสั่งยา – คุณรอการกรอกใบสั่งยานานแค่ไหน? จาก USA Today 3 ใน 10 ของคนอเมริกันรอการกรอกใบสั่งยานานกว่า 20 นาที มีการเปรียบเทียบเวลารอเภสัชกรในองค์กรรักษาสุขภาพและเภสัชกรในร้านขายยา ซึ่งได้ผลดังนี้

เวลารอ                   องค์กรรักษาสุขภาพ              ร้านขายยา

<= 15 นาที              75                                           119

16-20 นาที              44                                           21

> 20 นาที                 21                                           37

ไม่รู้                            10                                           23

a. มีหลักฐานเพียงพอที่จะชี้ว่ามีความแตกต่างด้านเวลารอของเภสัชกรในองค์กรรักษาสุขภาพและร้านขายยาหรือไม่? ใช้ α = .01

b. ถ้าเราคำนึงถึงเพียงเวลารอที่มากกว่า 20 นาที มีความแตกต่างอย่างมีนัยสำคัญในเวลารอระหว่างเภสัชกรในองค์กรรักษาสุขภาพและร้านขายยาที่ระดับนัยสำคัญ 1% หรือไม่?

14.24 การลอบสังหาร JFK – หลังจากการลอบสังหาร John F. Kennedy กว่า 40 ปี โพลสำนักข่าว FOX แสดงว่าชาวอเมริกันส่วนใหญ่ไม่เห็นด้วยกับข้อสรุปของรัฐบาลเกี่ยวกับการถูกฆ่า คณะกรรมการ Warren พบว่า Lee Harvey Oswald ดำเนินการยิง Kennedy เพียงผู้เดียว แต่ชาวอเมริกันหลายคนไม่แน่ใจ คุณคิดว่าพวกเรารู้ข้อเท็จจริงทั้งหมดเกี่ยวกับการลอบสังหารประธานาธิบดี John F. Kennedy หรือคุณคิดว่ามีเรื่องปกปิด? ผลจากโพลของผู้โหวตที่ลงทะเบียนทั่วประเทศมีดังนี้:

เรารู้ข้อเท็จจริงทั้งหมด         มีเรื่องปกปิด          ไม่แน่ใจ

เดโมแครต                 42                                      309                       31

รีพับบลิกัน                 64                                       246                       46

อิสระ                          20                                      115                        27

a. ข้อมูลเหล่านี้ให้หลักฐานที่เพียงพอจะสรุปว่ามีความเห็นที่แตกต่างเกี่ยวกับสิ่งที่อาจมีการปกปิดขึ้นอยู่กับฝ่ายการเมืองของผู้โหวตหรือไม่? ใช้ α = .05

b. ถ้ามีความแตกต่างอย่างมีนัยสำคัญในข้อ a. อธิบายลักษณะของความแตกต่างนั้น

14.25 ทำงานทางไกล – เพื่อเป็นทางเลือกของเวลาที่ยืดหยุ่น หลายบริษัทอนุญาตให้พนักงานทำงานของตนที่บ้าน ตัวอย่างสุ่มจากพนักงาน 300 คนถูกแบ่งตามเงินเดือนและจำนวนวันทำงานที่บ้านในแต่ละสัปดาห์

วันทำงานที่บ้านต่อสัปดาห์

เงินเดือน                             น้อยกว่า 1 วัน       อย่างน้อย 1 วันแต่ไม่ทุกวัน       ทุกวัน

น้อยกว่า $25,000              38                         16                                               14

$25,000 ถึง $49,999     54                         26                                               12

$50,000 ถึง $74,999     35                        22                                                 9

$75,000 ขึ้นไป                  33                        29                                                12

a. ข้อมูลแสดงหลักฐานที่เพียงพอจะชี้ว่าเงินเดือนมีความเกี่ยวข้องกับจำนวนวันทำงานที่บ้านหรือไม่? ใช้ α = .05

b. ใช้ตารางที่ 5 ใน Appendix I เพื่อประมาณค่า p สำหรับทดสอบสมมุติฐานนี้ ค่า p ยืนยันข้อสรุปของคุณในข้อ a. หรือไม่?

14.26 ทำงานทางไกล 2 – บทความใน American Demographics กล่าวถึงประเด็นการทำงานทางไกลเช่นกัน (แบบฝึกหัด 14.25) ในวิธีที่ค่อนข้างต่างกัน พวกเขาสรุปว่า คนที่ทำงานบริหารที่บ้านค่อนข้างอายุมากกว่าและมีการศึกษาดีกว่าคนที่ต้องทำงานที่ที่ทำงาน ใช้ข้อมูลด้านล่างจากตัวอย่างสุ่มของพนักงาน 300 คนเพื่อสนับสนุนหรือปฏิเสธข้อสรุปของพวกเขา ใช้การทดสอบสมมุติฐานที่เหมาะสมและอธิบายว่าทำไมถึงเห็นด้วยหรือไม่เห็นด้วยกับข้อสรุปของ American Demographics โดยกลุ่มพนักงานที่ทำงานผสมคือคนที่ทำงานที่บ้านอย่างน้อย 1 วันใน 1 สัปดาห์การทำงาน

อายุ                         พนักงานทำงานที่ที่ทำงาน    พนักงานที่ทำงานผสม           พนักงานทำงานที่บ้าน

15-34                          73                                           23                                           12

35-54                          85                                           40                                           23

55 ขึ้นไป                     22                                            12                                           10

การศึกษา                พนักงานทำงานที่ที่ทำงาน    พนักงานที่ทำงานผสม           พนักงานทำงานที่บ้าน

ต่ำกว่ามัธยมปลาย       23                                           3                                               5

มัธยมปลาย                  54                                           12                                            11

วิทยาลัย/เทียบเท่า     53                                           24                                            14

ปริญญาตรีขึ้นไป          41                                          42                                            18

14.5 เปรียบเทียบหลายกลุ่มประชากรอเนกนาม: การแยกประเภท 2 ทางด้วยจำนวนรวมในแถวหรือคอลัมน์ที่กำหนดไว้

ตารางความเป็นไปได้ r x c ให้ผลเมื่อแต่ละหน่วยการทดลอง n ถูกนับให้อยู่ในเซลล์ rc หนึ่งๆ ของการทดลองอเนกนาม แต่ละเซลล์แสดงคู่ของระดับประเภท ระดับแถว i และระดับคอลัมน์ j อย่างไรก็ตาม บางครั้งก็ไม่แนะนำให้ใช้การออกแบบการทดลองชนิดนี้ นั่นคือ เพื่อให้สิ่งที่สังเกตได้ n ตกอยู่ในช่องที่ควรจะเป็น ยกตัวอย่างเช่น คุณต้องศึกษาความเห็นของครอบครัวอเมริกันเกี่ยวกับระดับรายได้ เช่น ต่ำ ปานกลาง และสูง ถ้าคุณสุ่มเลือก n = 1,200 ครอบครัวสำหรับการสำรวจของคุณ คุณอาจจะไม่พบครอบครัวที่จัดตัวเองว่ารายได้ต่ำ มันอาจจะดีกว่าที่จะตัดสินใจล่วงหน้าสำรวจ 400 ครอบครัวในแต่ละระดับรายได้ ผลของข้อมูลจะยังคงแสดงเป็นการแยกประเภท 2 ทาง แต่จำนวนรวมในคอลัมน์ถูกกำหนดไว้ก่อน

ตัวอย่าง 14.6 ในการทดลองป้องกันไข้หวัดใหญ่เช่นตัวอย่าง 14.5 ผู้ทำการทดลองตัดสินใจค้นหาบันทึกของคลินิกสำหรับคนไข้ 300 คนในแต่ละประเภทของ 3 แบบการรับวัคซีน: ไม่รับวัคซีน, รับวัคซีน 1 ครั้ง, และรับวัคซีน 2 ครั้ง คนไข้ n = 900 คนจะถูกสำรวจเกี่ยวกับประวัติไข้หวัดใหญ่ในหน้าหนาว ผลการทดลองในตาราง 2 X 3 ด้วยคอลัมน์รวมที่กำหนดไว้ที่ 300 แสดงในตาราง 14.8 ด้วยการกำหนดผลรวมของคอลัมน์ ผู้ทดลองไม่ได้ทำการทดลองอเนกนามด้วย 2 X 3 = 6 เซลล์อีกต่อไป แต่ทำการทดลองทวินามแยกกัน 3 ครั้ง – เรียกว่า 1, 2, และ 3 – แต่ละครั้งด้วยความน่าจะเป็น pj ของการเกิดไข้หวัดใหญ่ และ qj ของการไม่เกิดไข้หวัดใหญ่ (ประชากรทวินาม pj + qj = 1)

ตาราง 14.8 กรณีการเกิดไข้หวัดใหญ่ของแต่ละแบบการรับวัคซีน

ไม่รับวัคซีน           รับวัคซีน 1 ครั้ง    รับวัคซีน 2 ครั้ง    รวม

เป็นไข้หวัดใหญ่                               …                           …                           …                    r1

ไม่เป็นไข้หวัดใหญ่                          …                           …                           …                    r2

รวม                                                    300                     300                      300                n

สมมุติว่าคุณใช้การทดสอบไคสแควร์เพื่อทดสอบความเป็นอิสระต่อกันของประเภทของแถวและคอลัมน์ ถ้าการให้วัคซีน (ระดับในคอลัมน์) ไม่มีผลกระทบกับการเกิดไข้หวัดใหญ่ แต่ละประชากรทวินามควรมีการเกิดไข้หวัดใหญ่เหมือนกัน เช่น p1 = p2 = p3 และ q1 = q2 = q3

การแยกประเภท 2 X 3 ในตัวอย่าง 14.6 อธิบายเหตุการณ์ที่การทดสอบความเป็นอิสระต่อกันไคสแควร์เทียบได้กับการทดสอบความเท่ากันของสัดส่วนทวินามที่คอลัมน์ = 3 การทดสอบชนิดนี้เรียกว่า การทดสอบความเหมือนกัน (tests of homogeneity) และถูกใช้เพื่อเปรียบเทียบหลายกลุ่มประชากรทวินาม ถ้ามีประเภทมากกว่า 2 แถวด้วยจำนวนรวมคอลัมน์คงที่ การทดสอบความเป็นอิสระต่อกันจะเท่ากับการทดสอบความเท่ากันของสัดส่วนอเนกนามของกลุ่ม c

คุณไม่ต้องกังวลเกี่ยวกับทฤษฎีการเทียบกันได้ของการทดสอบไคแสควร์สำหรับ 2 การออกแบบการทดลองนี้ ไม่ว่าคอลัมน์หรือแถวจะถูกกำหนดไว้หรือไม่ การทดสอบทางสถิติก็ยังคำนวณด้วย

X2 = ∑(Oij – Êij)2 / Êij โดยที่ Êij = ricj / n

ซึ่งมีการประมาณการกระจายตัวไคสแควร์ในตัวอย่างซ้ำๆ ด้วย df = (r-1)(c-1)

ผู้สอนส่วนตัว

ฉันจะกำหนดตัวเลขที่เหมาะสมของ df ได้อย่างไร?

ตามวิธีทั่วไปสำหรับกำหนด df:

1. เริ่มด้วยเซลล์ rc ในตาราง 2 ทาง

2. ลบ 1 df สำหรับแต่ละกลุ่มประชากรอเนกนาม c ที่ความน่าจะเป็นของคอลัมน์ต้องบวกกันได้ = 1 (ผลรวมของคอลัมน์ df)

3. คุณต้องประมาณความน่าจะเป็นของแถว (r-1) แต่ความน่าจะเป็นของคอลัมน์ถูกกำหนดก่อนแล้วและไม่ต้องประมาณการ ให้ลบ (r-1) df

ผลรวม df ของตาราง r x c (ที่ถูกกำหนดคอลัมน์) คือ

rc – c – (r-1) = rc – c – r + 1 = (r-1)(c-1)

ตัวอย่าง 14.7 การสำรวจอารมณ์ผู้โหวตมีขึ้นในสี่เขตการเลือกตั้งเพื่อเปรียบเทียบความชื่นชอบของผู้โหวตต่อผู้สมัคร ตัวอย่างสุ่มของผู้โหวต 200 คนถูกสำรวจใน 4 เขต ซึ่งมีผลแสดงในตาราง 14.9 ค่าในวงเล็บในตารางเป็นจำนวนเซลล์ที่คาดหวัง ข้อมูลแสดงหลักฐานที่เพียงพอจะชี้ว่าความชื่นชอบของผู้โหวตต่อผู้สมัคร A มีความแตกต่างใน 4 เขต?

ตาราง 14.9 ความเห็นของผู้โหวตใน 4 เขต

เขต 1                   เขต 2                 เขต 3                  เขต 4                 รวม

ชอบ A                  76 (59)             53 (59)             59 (59)             48 (59)             236

ไม่ชอบ A             124 (141)         147 (141)        141 (141)         152 (141)         564

รวม                        200                   200                    200                   200                   800

วิธีทำ เมื่อผลรวมคอลัมน์ถูกกำหนดที่ 200 รูปแบบจึงเป็น 4 การทดลองทวินาม แต่ละการทดลองได้ผลจากผู้โหวต 200 คนจาก 1 ใน 4 เขต เพื่อทดสอบความเท่ากันของสัดส่วนคนที่ชอบผู้สมัคร A ใน 4 เขต สมมุติฐานหลักคือ

Ho : p1 = p2 = p3 = p4

ซึ่งเทียบได้กับสมมุติฐาน

Ho : สัดส่วนความชอบผู้สมัคร A ไม่เกี่ยวกับเขต

และจะถูกปฏิเสธถ้าการทดสอบทางสถิติ X2 ใหญ่มาก ค่าที่สังเกตได้ของการทดสอบทางสถิติ X2 = 10.722 และค่า p คือ .013 ถูกแสดงในรูป 14.5 ผลมีนัยสำคัญ (P < .025) ว่า Ho ถูกปฏิเสธและคุณสามารถสรุปว่ามีความแตกต่างในสัดส่วนของผู้โหวตที่ชอบผู้สมัคร A ใน 4 เขต

รูป 14.5 ผล MINITAB สำหรับตัวอย่าง 14.7

การทดสอบไคสแควร์: เขต 1, เขต 2, เขต 3, เขต 4

ลักษณะแตกต่างที่พบโดยการทดสอบไคสแควร์คืออะไร? เพื่อตอบคำถามนี้ ดูที่ตาราง 14.10 ซึ่งแสดงสัดส่วนตัวอย่างคนที่ชอบผู้สมัคร A ในแต่ละเขต จะเห็นว่าผู้สมัคร A ทำได้ดีที่สุดในเขต 1 และแย่ที่สุดในเขต 4 แล้วมันมีความหมายในเชิงปฏิบัติสำหรับผู้สมัครหรือไม่? เป็นไปได้ว่าสิ่งที่น่าสังเกตยิ่งกว่าคือผู้สมัครไม่มีเสียงข้างมากในเขตใดเลย ถ้านี่เป็นการแข่งขันของผู้สมัคร 2 คน ผู้สมัคร A ต้องมีการหาเสียงเพิ่ม

ตาราง 14.10 สัดส่วนความชอบผู้สมัคร A ใน 4 เขต

เขต 1                       เขต 2                      เขต 3                      เขต 4

76/200 = .38    53/200 = .27    59/200 = .30    48/200 = .24

แบบฝึกหัด 14.5

เทคนิคพื้นฐาน

14.27 ตัวอย่างสุ่ม 200 คนถูกเลือกจากแต่ละกลุ่มประชากรจำนวน 3 กลุ่ม และแต่ละค่าที่สังเกตได้ถูกแยกประเภทว่าตกอยู่ในประเภท 1, 2, หรือ 3:

ประชากร               ประเภท 1           ประเภท 2           ประเภท 3           รวม

1                            108                     52                       40                     200

2                            87                       51                       62                      200

3                            112                     39                       49                      200

คุณต้องการรู้ว่าข้อมูลมีหลักฐานเพียงพอที่จะชี้ว่าสัดส่วนค่าที่สังเกตได้ใน 3 ประเภทนี้ขึ้นอยู่กับกลุ่มประชากรที่ถูกแยกหรือไม่

a. จงหาค่า X2 ของการทดสอบ

b. จงหาเขตปฏิเสธสำหรับการทดสอบด้วย α = .01

c. บอกข้อสรุปของคุณ

d. หาค่าประมาณ p สำหรับการทดสอบและแสดงค่าของมัน

14.28 ถ้าคุณอยากทดสอบสมมุติฐานหลักว่า 3 พารามิเตอร์ทวินาม pA, pB, และ pC เท่ากัน และสมมุติฐานรองว่ามีอย่างน้อยสองพารามิเตอร์ที่ต่างกัน ตัวแปรสุ่มอิสระ 100 คนถูกเลือกจากแต่ละกลุ่มประชากร ข้อมูลถูกแสดงในตาราง

ประชากร A        ประชากร B        ประชากร C        รวม

สำเร็จ                      24                      19                       33                     76

ล้มเหลว                   76                     81                       67                     224

รวม                          100                  100                    100                   300

a. เขียนสมมุติฐานหลักและรองสำหรับทดสอบความเท่ากันของสัดส่วนทวินามทั้ง 3

b. คำนวณการทดสอบทางสถิติและหาค่าประมาณ p สำหรับการทดสอบในข้อ a.

c. ใช้ค่าประมาณ p เพื่อกำหนดนัยสำคัญทางสถิติของผลของคุณ ถ้าผลมีนัยสำคัญทางสถิติ หาลักษณะความแตกต่างในสัดส่วนของทั้ง 3 ทวินาม

การนำไปใช้

14.29 รุ่นแซนด์วิช – คนอเมริกันในรุ่นแซนด์วิชสร้างความสมดุลระหว่างการดูแลญาติที่แก่กว่าและอ่อนกว่าอย่างไร? ในการสำรวจทางโทรศัพท์ ชาวอเมริกันอายุระหว่าง 45 ถึง 55 ปีโดยหนังสือพิมพ์ New York Times จำนวนผู้ที่ให้การช่วยเหลือด้านการเงินแก่พ่อแม่แสดงดังนี้

ให้การช่วยเหลือด้านการเงิน                                ใช่         ไม่

อเมริกันผิวขาว                                                      40        160

อเมริกันแอฟริกัน                                                  56        144

อเมริกันฮิสแปนิก                                                  68        132

อเมริกันเอเซียน                                                     84        116

มีความแตกต่างอย่างมีนัยสำคัญในสัดส่วนของคนที่ให้ความช่วยเหลือด้านการเงินแก่พ่อแม่ในกลุ่มย่อยของชาวอเมริกันหรือไม่? ใช้ α = .01

14.30 ไก่เป็นโรค – มีโรคหนึ่งของไก่ที่เชื่อว่าไม่สามารถติดต่อกันได้ เพื่อทดสอบทฤษฎีนี้ ไก่ 30,000 ตัวถูกแบ่งด้วยการสุ่มเป็น 3 กลุ่ม กลุ่มละ 10,000 ตัว กลุ่มแรกไม่สัมผัสกับไก่เป็นโรค กลุ่มที่ 2 สัมผัสพอสมควร และกลุ่มที่ 3 สัมผัสมาก หลังจาก 6 เดือนข้อมูลจำนวนไก่เป็นโรคถูกเก็บจากไก่ 10,000 ตัวในแต่ละกลุ่ม ข้อมูลให้หลักฐานที่เพียงพอจะชี้ความสัมพันธ์ระหว่างระดับการสัมผัสของไก่ที่เป็นโรคและไม่เป็นโรคกับการเกิดโรคหรือไม่? ใช้ α = .05

ไม่สัมผัส                 สัมผัสพอสมควร                 สัมผัสมาก

เป็นโรค                  87                          89                                        124

ไม่เป็นโรค             9,913                    9,911                                  9,876

รวม                         10,000                10,000                             10,000

14.31 การดูแลระยะยาว – มีการศึกษาในภาคตะวันตกเฉียงเหนือของอังกฤษเกี่ยวกับการประเมินสิ่งอำนวยความสะดวกเพื่อการดูแลระยะยาวกับผู้พักอาศัยที่เป็นโรควิกลจริต บ้านที่มีบริการพิเศษสำหรับคนแก่ที่มีปัญหาด้านสุขภาพ เรียกว่า บ้าน EMI ส่วนอีกประเภท คือ บ้านที่ไม่ใช่ EMI มีการคาดว่าบ้าน EMI จะทำคะแนนสูงกว่าในหลายๆ การวัดคุณภาพการบริการสำหรับผู้ที่เป็นโรควิกลจริต การวัดหนึ่งรวมถึงโครงสร้างของบ้านและบริการที่มีอยู่ ดังในตาราง

ชนิดการดูแล                         บ้าน EMI          บ้านที่ไม่ใช่ EMI          รวม

ดูแลด้านการพยาบาล            54                      22                                  76

ดูแลด้านการพักอาศัย           59                      77                                 136

ดูแล 2 ด้าน                             49                      26                                  75

รวม                                          162                    125                                287

a. อธิบายการทดลองทวินามที่สัดส่วนถูกเปรียบเทียบในการทดลองนี้

b. ข้อมูลชี้ว่าชนิดของการดูแลแตกต่างในบ้านทั้ง 3 ประเภทหรือไม่? ทดสอบที่ระดับ α = .01

c. จากผลในข้อ b. อธิบายลักษณะเชิงปฏิบัติของความสัมพันธ์ระหว่างชนิดของบ้านและชนิดของการดูแล

14.32 การวิจัยทะเลลึก – W.W. Menard ทำวิจัยเกี่ยวกับปุ่มแมงกานีส ส่วนผสมที่มีแร่ธาตุอยู่มากซึ่งพบมากมายบนพื้นใต้ทะเลลึก ส่วนหนึ่งของรายงานของเขา Menard ให้ข้อมูลความเกี่ยวข้องของอายุแม่เหล็กเปลือกโลกต่อความน่าจะเป็นในการพบปุ่มแมงกานีส ตารางได้ให้ตัวเลขของตัวอย่างแกนโลกและ % การมีปุ่มแมงกานีสในแต่ละกลุ่มอายุของเปลือกแม่เหล็ก ข้อมูลมีหลักฐานเพียงพอที่จะชี้ว่าความเป็นไปได้ในการพบปุ่มแมงกานีสในเปลือกโลกใต้ทะเลลึกขึ้นอยู่กับประเภทอายุของแม่เหล็กหรือไม่?

อายุ                                                 จำนวนตัวอย่าง                % ที่มีปุ่ม

Miocene ถึงปัจจุบัน                          389                              5.9

Oligocene                                          140                              17.9

Eocene                                                214                              16.4

Paleocene                                          84                                21.4

Late Cretaceous                              247                              21.1

Early and Middle Cretaceous    1120                            14.2

Jurassic                                               99                                11.0

14.33 ครอบครัวใหญ่แค่ไหน? – หอการค้าท้องถิ่นทำการสำรวจ 120 ครัวเรือนในเมือง – 40 ในแต่ละชนิดของการพักอาศัย (อพาร์ทเม้นต์, บ้านสำหรับ 2 ครอบครัว, บ้านสำหรับ 1 ครอบครัว) – และบันทึกจำนวนสมาชิกในครอบครัวในแต่ละครัวเรือน ข้อมูลแสดงในตารางดังนี้

ประเภทการพักอาศัย

จำนวนสมาชิก       อพาร์ทเม้นต์          บ้านสำหรับ 2 ครอบครัว     บ้านสำหรับ 1 ครอบครัว

1                               8                             20                                         1

2                              16                           8                                            9

3                              10                           10                                         14

4 หรือมากกว่า        6                              2                                           16

มีความแตกต่างอย่างมีนัยสำคัญด้านขนาดของครอบครัวในแต่ละประเภทการพักอาศัยหรือไม่? ทดสอบโดยใช้ α = .01 ถ้ามีความแตกต่างอย่างมีนัยสำคัญ อธิบายลักษณะความแตกต่างนั้น

14.34 การไปโบสถ์และอายุ – บทสรุปใน USA Today ชี้ว่ามีความแตกต่างในการเข้าโบสถ์ระหว่างคนอเมริกันอายุ 20 ปีและมากกว่า สมมุติว่าเราสุ่มเลือกคนอเมริกัน 100 คนในแต่ละกลุ่มอายุและบันทึกจำนวนผู้ที่บอกว่าเข้าโบสถ์เป็นปกติในแต่ละสัปดาห์

เข้าโบสถ์เป็นปกติ                 20s       30s       40s       50s       60+

ใช่                                            31          42         47         48        53

ไม่                                           69          58          53         52        47

ที่มา: กลุ่มวิจัย Barna

a. ข้อมูลชี้ว่าสัดส่วนผู้ใหญ่ที่เข้าโบสถ์เป็นประจำแตกต่างกันขึ้นอยู่กับอายุหรือไม่? ทดสอบโดยใช้ α = .05

b. ถ้ามีความแตกต่างอย่างมีนัยสำคัญในข้อ a. อธิบายลักษณะของความแตกต่างนี้โดยคำนวณสัดส่วนผู้ไปโบสถ์ในแต่ละกลุ่มอายุ ความแตกต่างอย่างมีนัยสำคัญอยู่ที่ใด?

14.6 การทดสอบทางสถิติที่เทียบกันได้ (The Equivalence of Statistical Tests)

เมื่อมีเพียง k = 2 ประเภทในการทดลองอเนกนาม การทดลองลดเป็นการทดลองทวินามที่คุณสามารถบันทึกจำนวนความสำเร็จ x (หรือ O1) ในการทดลอง n (หรือ O1 + O2) และเช่นเดียวกัน ข้อมูลที่เป็นผลจาก 2 การทดลองทวินามสามารถแสดงเป็นการแยกประเภท 2 ทางด้วย r = 2 และ c = 2 ดังนั้นการทดสอบความเหมือนกันไคสแควร์สามารถใช้เพื่อเปรียบเทียบ 2 สัดส่วนทวินาม (p1 และ p2) สำหรับ 2 เหตุการณ์นี้ เรามีแสดงการทดสอบทางสถิติสำหรับสัดส่วนทวินามบนสถิติ z ของบทที่ 9:

1 ตัวอย่าง:

k = 2

สำเร็จ ล้มเหลว

2 ตัวอย่าง:

r = c = 2

ตัวอย่าง 1 ตัวอย่าง 2
สำเร็จ สำเร็จ
ล้มเหลว ล้มเหลว

ทำไมถึงมี 2 การทดสอบที่แตกต่างกันสำหรับสมมุติฐานทางสถิติเดียวกัน? อันไหนที่คุณควรใช้? สำหรับ 2 เหตุการณ์นี้ คุณสามารถใช้ทั้งการทดสอบ z หรือการทดสอบไคสแควร์ และคุณจะได้ผลเดียวกัน ไม่ว่าจะ 1 หรือ 2 ตัวอย่างทดสอบ เราสามารถพิสูจน์ด้วยพีชคณิตว่า

z2 = χ2

ดังนั้นการทดสอบ z ทางสถิติจะต้องยกกำลัง 2 (จะบวกหรือลบ ขึ้นอยู่กับข้อมูล) ของสถิติไคสแควร์ อีกทั้ง เราสามารถแสดงด้วยทฤษฎีว่าค่าวิกฤตในตาราง z และ χ2 ใน Appendix I ที่ได้ค่า p ที่เหมือนกันสำหรับ 2 การทดลองที่เหมีอนกันนั้นมีความสัมพันธ์เหมือนกัน เพื่อทดสอบสมมุติฐานรองทางเดียว เช่น Ho: p1 > p2 ต้องมีการตัดสินใจก่อนว่า 12 > 0 หมายความว่า ถ้าความแตกต่างในสัดส่วนตัวอย่างมีลักษณะที่เหมาะสม เช่นนั้นแล้ว ค่าวิกฤตที่เหมาะสมของ χ2 จากตารางที่ 5 จะมี 1 df บนพื้นที่ทางขวาของ 2α ยกตัวอย่างเช่น ค่าวิกฤต χ2 ด้วย 1 df และ α = .05 จะเป็น χ2.10 = 2.70554 = 1.6452

สรุปว่า คุณมีอิสระที่จะเลือกทดสอบ (z หรือ X2) ที่สะดวกที่สุด เมื่อโปรแกรมคอมพิวเตอร์ส่วนใหญ่มีการทดสอบไคสแควร์ และส่วนใหญ่ไม่ได้มีการทดสอบตัวอย่าง z ขนาดใหญ่ คุณจึงอาจจะชอบการทดสอบไคสแควร์มากกว่า

เกร็ดเล็กเกร็ดน้อย

การทดสอบทวินาม 1 และ 2 ตัวอย่างจากบทที่ 9 เทียบได้กับการทดสอบไคสแควร์ z2 = χ2

14.7 การนำการทดสอบไคสแควร์ไปใช้ในรูปแบบอื่น

การนำการทดสอบไคสแควร์ไปวิเคราะห์ข้อมูลจำนวนนับเป็นเพียง 1 ในหลายปัญหาการจำแนกประเภทที่ให้ผลข้อมูลอเนกนาม การนำไปใช้ในบางครั้งค่อนข้างซับซ้อน ต้องมีขั้นตอนและการคำนวณที่ยุ่งยากสำหรับการประมาณจำนวนเซลล์คาดหวัง อย่างไรก็ตาม มีหลายๆ อันที่ถูกนำไปใช้บ่อยซึ่งน่ากล่าวถึงคือ

  • การทดสอบสารรูปสนิทดี – คุณสามารถกำหนดการทดสอบสารรูปสนิทดีเพื่อตัดสินว่าข้อมูลตรงกับข้อมูลที่ได้จากการกระจายตัวความน่าจะเป็นนั้นๆ (ที่อาจจะเป็นแบบปกติ, ทวินาม, ปัวส์ซอง, หรือการกระจายตัวอื่นๆ) เซลล์ของตัวอย่างความถี่ฮิสโตแกรมเป็นไปในทางเดียวกับเซลล์ k ของการทดลองอเนกนาม การนับจำนวนเซลล์คาดหวังถูกคำนวณโดยใช้ความน่าจะเป็นเกี่ยวกับการกระจายตัวของความน่าจะเป็นของสมมุติฐาน
  • อเนกนามที่ขึ้นกับเวลา – คุณสามารถใช้สถิติไคสแควร์เพื่อค้นหาระดับการเปลี่ยนแปลงของสัดส่วนอเนกนาม (หรือทวินาม) ที่ขึ้นกับเวลา ตัวอย่างเช่น สมมุติว่าสัดส่วนของคำตอบถูกในข้อสอบ 100 ข้อถูกบันทึกสำหรับนักเรียนที่มีการสอบซ้ำในทุก 4 สัปดาห์ สัดส่วนคำตอบที่ถูกต้องจะเพิ่มขึ้นหรือไม่? มีการเรียนรู้หรือไม่? ในกระบวนการเฝ้าดูด้วยแผนการควบคุมคุณภาพ มีแนวโน้มเชิงบวกในสัดส่วนของของเสียที่ขึ้นอยู่กับเวลาหรือไม่?
  • ตารางความเป็นไปได้หลายมิติ – แทนที่จะมีสองวิธีสำหรับการจำแนกประเภท คุณสามารถตรวจสอบความสัมพันธ์กันของ 3 ประเภทหรือมากกว่าได้ ตารางความเป็นไปได้ 2 ทางถูกขยายเป็นตารางมากกว่า 2 มิติ โดยวิธีการคล้ายกับที่ใช้สำหรับตารางความเป็นไปได้ r x c แต่การวิเคราะห์จะซับซ้อนกว่านิดหน่อย
  • รูปแบบล็อกเส้นตรง – รูปแบบที่มีความซับซ้อนสามารถสร้างโดยที่ล็อกของความน่าจะเป็นของเซลล์ (ln pij) เป็นบางฟังก์ชั่นเส้นตรงของความน่าจะเป็นของแถวและคอลัมน์

การนำสถิติเหล่านี้ไปใช้ค่อนข้างซับซ้อนและอาจทำให้คุณต้องปรึกษานักสถิติผู้เชี่ยวชาญสำหรับคำแนะนำก่อนที่คุณจะทำการทดลอง

ในทุกการนำสถิติไคสแควร์ของเพียร์สันไปใช้ จะต้องเป็นไปตามสมมุติฐานเพื่อให้การทดสอบทางสถิติมีการประมาณการกระจายตัวของความน่าจะเป็นไคสแควร์

สมมุติฐาน

  • การนับเซลล์ O1, O2, …, Ok ต้องผ่านข้อกำหนดของการทดลองอเนกนาม หรือกลุ่มของการทดลองอเนกนามที่สร้างด้วยการกำหนดผลรวมของแถวหรือคอลัมน์
  • การนับจำนวนเซลล์คาดหวัง E1, E2, …, Ek ควรเท่ากับหรือมากกว่า 5

คุณสามารถแน่ใจได้ว่าคุณผ่านสมมุติฐานแรกโดยเตรียมการและออกแบบการทดลองหรือการสำรวจตัวอย่างอย่างระมัดระวัง เมื่อคุณคำนวณจำนวนเซลล์คาดหวัง ถ้าคุณพบว่า 1 หรือมากกว่านั้น น้อยกว่า 5 มีทางเลือกเหล่านี้สำหรับคุณ:

  • เลือกกลุ่มตัวอย่าง n ใหญ่ขึ้น กลุ่มตัวอย่างที่ใหญ่ขึ้น การกระจายตัวไคสแควร์ยิ่งเข้าใกล้การประมาณการกระจายตัวของการทดสอบทางสถิติ X2 ของคุณ
  • มันอาจจะเป็นไปได้ที่จะรวมเซลล์ 1 หรือมากกว่ากับจำนวนเซลล์คาดหวังขนาดเล็ก ซึ่งจะทำให้ผ่านสมมุติฐาน

สุดท้าย ต้องแน่ใจว่าคุณคำนวณ df อย่างถูกต้องและคุณประเมินข้อสรุปทางสถิติและทางปฏิบัติที่ได้จากการทดลองของคุณอย่างระมัดระวัง

ทบทวนบทเรียน

แนวคิดหลักและสูตร

I. การทดลองอเนกนาม

1. มีการทดลองที่เหมือนกัน n ครั้ง และผลแต่ละครั้งอยู่ใน 1 ใน k ประเภท

2. ความน่าจะเป็นของการอยู่ในประเภท i คือ pi และคงที่ในแต่ละการทดลอง

3. การทดลองเป็นอิสระต่อกัน ∑pi = 1 และเราวัดจำนวนที่สังเกตได้ Oi ที่อยู่ในแต่ละประเภท k

II. สถิติเพียร์สันไคสแควร์

X2 = ∑(Oi – Ei)2 / Ei เมื่อ Ei = npi

ที่มีการประมาณการกระจายตัวไคสแควร์ด้วย df ที่ตัดสินจากการนำไปใช้

III. การทดสอบสารรูปสนิทดี

1. การจำแนกประเภททางเดียวด้วยความน่าจะเป็นของเซลล์ที่ระบุใน Ho

2. ใช้สถิติไคสแควร์ด้วย Ei = npi คำนวณด้วยความน่าจะเป็นของสมมุติฐาน

3. df = k – 1 – (จำนวนพารามิเตอร์ที่มีการประมาณเพื่อหา Ei)

4. ถ้า Ho ถูกปฏิเสธ ให้ตรวจสอบลักษณะของความแตกต่างโดยใช้สัดส่วนตัวอย่าง

IV. ตารางความเป็นไปได้

1. การจำแนก 2 ทางด้วยการสังเกต n ครั้งจำแนกสู่เซลล์ r x c ของตาราง 2 ทางโดยใช้ 2 วิธีการจำแนกที่แตกต่างเรียกว่า ตารางความเป็นไปได้

2. การทดสอบความเป็นอิสระต่อกันของวิธีการจำแนกประเภทใช้สถิติไคสแควร์

X2 = ∑(Oij – Êij)2 / Êij

ด้วย Êij = ricj / n และ df = (r-1)(c-1)

3. ถ้าสมมุติฐานหลักของความเป็นอิสระต่อกันของการจำแนกประเภทถูกปฏิเสธ ให้ตรวจสอบลักษณะของความสัมพันธ์โดยใช้สัดส่วนเงื่อนไขภายในแถวหรือคอลัมน์ของตารางความเป็นไปได้

V. กำหนดจำนวนรวมของแถวหรือคอลัมน์

1. เมื่อผลรวมในแถวหรือคอลัมน์ถูกกำหนด การทดสอบความเป็นอิสระต่อกันของการจำแนกประเภทกลายเป็นการทดสอบความเหมือนกันของความน่าจะเป็นของเซลล์สำหรับหลายๆ การทดลองอเนกนาม

2. ใช้สถิติไคสแควร์ที่เหมือนกันสำหรับตารางความเป็นไปได้

3. การทดสอบ z ในตัวอย่างกลุ่มใหญ่สำหรับ 1 หรือ 2 สัดส่วนทวินามเป็นกรณีพิเศษของสถิติไคสแควร์

VI. สมมุติฐาน

1. จำนวนเซลล์ที่ผ่านเงื่อนไขของการทดลองอเนกนามหรือกลุ่มของการทดลองอเนกนามด้วยขนาดตัวอย่างที่มีการกำหนด

2. ทุกการนับจำนวนเซลล์คาดหวังต้องเท่ากับหรือมากกว่า 5 เพื่อให้สามารถประมาณค่าไคสแควร์ได้

MINITAB

การทดสอบไคสแควร์

มีหลายกระบวนการในโปรแกรม MINITAB สำหรับวิเคราะห์ข้อมูลจำแนกประเภท กระบวนการที่เหมาะสมขึ้นอยู่กับว่าข้อมูลแสดงการจำแนกประเภททางเดียว (การทดลองอเนกนามเดี่ยว) หรือการจำแนกประเภท 2 ทาง (ตารางความเป็นไปได้) ถ้าข้อมูลดิบการจำแนกประเภทถูกจัดเก็บในแผ่นงาน MINITAB แทนการนับจำนวนเซลล์ที่สังเกตได้ คุณอาจต้องใช้การนับจำนวนหรือการจำแนกประเภทข้ามข้อมูลเพื่อให้ได้จำนวนเซลล์ก่อนดำเนินการต่อ

ตัวอย่างเช่น สมมุติว่าคุณมีบันทึกเพศ (ช หรือ ญ) และสถานะในวิทยาลัย (ปี1, 2, 3, 4, จบแล้ว) ของนักเรียนวิชาสถิติ 100 คน แผ่นงาน MINITAB จะประกอบด้วย 2 คอลัมน์ของ 100 การสังเกต แต่ละแถวจะประกอบด้วยเพศของแต่ละคนในคอลัมน์ 1 และสถานะในวิทยาลัยในคอลัมน์ 2 เพื่อให้ได้จำนวนเซลล์ที่สังเกตได้ (Oij) สำหรับตางรางความเป็นไปได้ 2 X 5 ใช้ Stat > Tables > Cross Tabulation and Chi-Square เพื่อสร้างกล่องข้อความโต้ตอบดังแสดงในรูป 14.6

รูป 14.6

ใน “Categorical Variables” ให้เลือกเพศสำหรับตัวแปรในแถว และเลือกสถานะสำหรับตัวแปรในคอลัมน์ ปล่อยให้กล่องข้อความโต้ตอบ “For Layers” และ “Frequencies are in:” ว่างเปล่า ติ๊กถูกในช่อง “Display Counts” กดปุ่ม “Chi-square…” เพื่อแสดงกล่องข้อความโต้ตอบในรูป 14.6 ติ๊กถูกในช่อง “Chi-Square Analysis” และ “การนับจำนวนเซลล์คาดหวัง” กด OK สองครั้ง ลำดับคำสั่งนี้ไม่เพียงสร้างตารางความเป็นไปได้ แต่ยังทำการทดสอบไคสแควร์ของความเป็นอิสระต่อกันและแสดงผลในหน้าต่างรูป 14.7 สำหรับข้อมูลเพศ / สถานะในวิทยาลัย ค่า p ที่มาก (P = .153) แสดงผลการไม่มีนัยสำคัญ จึงมีหลักฐานไม่เพียงพอจะชี้ว่าเพศของนักเรียนมีความสัมพันธ์กับสถานะในห้องเรียน

รูป 14.7

ถ้าจำนวนเซลล์ที่สังเกตได้ในตารางความเป็นไปได้ถูกสร้างอยู่แล้ว ก็เพียงแค่ใส่จำนวนในคอลัมน์ c ของแผ่นงาน MINITAB ใช้ Stat > Tables > Chi-Square Test (Two-Way Table in Worksheet) และเลือกคอลัมน์ที่เหมาะสมก่อนกด OK สำหรับข้อมูลเพศ / สถานะในวิทยาลัย คุณสามารถใส่จำนวนในคอลัมน์ C3 – C7 ดังแสดงในรูป 14.8 ผลลัพธ์จะแสดงด้วยชื่อแตกต่างกันแต่จะดูเหมือนผลลัพธ์ในรูป 14.7

รูป 14.8

การทดสอบง่ายๆ ของการทดลองอเนกนามเดี่ยวสามารถสร้างขึ้นโดยพิจารณาสัดส่วนนักเรียนวิชาสถิติเพศชายและเพศหญิงว่าเท่ากันหรือไม่ นั่นคือ p1 = .5 และ p2 = .5

ใน MINITAB 15 ใช้ Stat > Tables > Chi-Square Goodness-of-Fit Test (One Variable) เพื่อแสดงกล่องข้อความโต้ตอบในรูป 14.9 ถ้าคุณมีข้อมูลดิบแยกประเภทในคอลัมน์ ให้กดปุ่ม “Categorical data:” และใส่คอลัมน์เพศในเซลล์ ถ้าคุณมีค่าสรุปของจำนวนที่สังเกตได้สำหรับแต่ละประเภท เลือก “Observed counts” แล้วใส่จำนวนที่สังเกตได้ในคอลัมน์หรือพิมพ์จำนวนที่สังเกตได้ในแต่ละประเภท

รูป 14.9

สำหรับการทดสอบนี้ คุณสามารถเลือก “Equal proportions” เพื่อทดสอบ Ho: p1 = p2 = .5 เมื่อคุณมีสัดส่วนที่แตกต่างสำหรับแต่ละประเภท ให้ใช้ “Specific proportions” คุณสามารถเก็บสัดส่วนสำหรับแต่ละประเภทในคอลัมน์ เลือก “Input column” และใส่คอลัมน์ ถ้าคุณต้องการพิมพ์สัดส่วนสำหรับแต่ละประเภท เลือก “Input constants” และพิมพ์สัดส่วนสำหรับประเภทนั้นๆ แล้วกด OK ผลลัพธ์จะรวมหลายกราฟพร้อมด้วยค่าของ Oi และ Ei สำหรับแต่ละประเภท ค่าที่สังเกตได้ของการทดสอบสถิติ X2 = 1.44 และค่า p = 0.230 ซึ่งไม่มีนัยสำคัญ มีหลักฐานไม่เพียงพอที่จะชี้ความแตกต่างในสัดส่วนของนักเรียนวิชาสถิติผู้ชายและผู้หญิง

ถ้าคุณใช้ MINITAB รุ่นก่อนหน้า คุณจะต้องกำหนดจำนวนเซลล์ที่สังเกตได้และคาดหวัง และใส่มันในคอลัมน์แยกในแผ่นงาน เมื่อใช้ Calc > Calculator และคำสั่ง SUM((‘O’ – ‘E’)**2/‘E’) เพื่อคำนวณค่าที่สังเกตได้ของการทดสอบสถิติ

แบบฝึกหัดเสริม

แบบฝึกหัดที่มีดาว (*) เป็นทางเลือก

14.35 การขัดพื้น – ผู้ผลิตที่ขัดพื้นทำการสำรวจความชอบของลูกค้าเพื่อดูว่าที่ขัดพื้นใหม่ A ดีกว่าที่ผลิตโดยคู่แข่ง 4 ราย B, C, D, และ E หรือไม่ 100 ตัวอย่างแม่บ้านแสดงพื้นที่มี 5 รอยที่ถูกขัดจาก 5 ยี่ห้อ และให้แต่ละคนชี้รอยที่มีสภาพดีกว่า แสง, พื้นผิว, และอื่นๆ ถูกประมาณให้เหมือนกันสำหรับทั้ง 5 รอย ผลของการสำรวจแสดงดังนี้

การขัด                    A           B          C          D           E

ความถี่                    27        17        15        22        19

ข้อมูลเหล่านี้แสดงหลักฐานที่เพียงพอจะชี้ว่ามีความชอบในรอยขัดบนพื้น 1 หรือมากกว่ายิ่งกว่ารอยอื่นๆ หรือไม่? ถ้ามีอันใดอันหนึ่งที่ทำให้ปฏิเสธสมมุติฐานว่าไม่มีความชอบมากกว่าในการทดลองนี้ จะหมายความว่าที่ขัด A ดีกว่าอันอื่นๆ หรือไม่ คุณมีข้อแนะนำวิธีการทดลองที่ดีกว่านี้หรือไม่?

14.36 ฟิตเนสในอเมริกา – มีการสำรวจพื่อดูความสนใจของวัยกลางคนในโปรแกรมฟิตเนสในโร้ดไอส์แลนด์, โคโลราโด, แคลิฟอร์เนีย, และฟลอริดา วัตถุประสงค์ของการสำรวจคือตัดสินว่าการเข้าร่วมโปรแกรมฟิตเนสของวัยกลางคนแตกต่างในแต่ละรัฐของอเมริกาหรือไม่ ในแต่ละรัฐมีคนถูกสุ่มตัวอย่างสัมภาษณ์และข้อมูลเหล่านี้ถูกบันทึก

โร้ดไอส์แลนด์      โคโลราโด             แคลิฟอร์เนีย          ฟลอริดา

เข้าร่วม                   46                         63                          108                       121

ไม่เข้าร่วม              149                       178                       192                       179

ข้อมูลชี้ถึงความแตกต่างในการเข้าร่วมของวัยกลางคนในโปรแกรมฟิตเนสในแต่ละรัฐหรือไม่? ถ้าใช่ อธิบายลักษณะของความแตกต่าง

14.37 อุบัติเหตุร้ายแรง – ข้อมูลอุบัติเหตุถูกวิเคราะห์เพื่อหาจำนวนของอุบัติเหตุร้ายแรงของรถยนต์ 3 ขนาด ข้อมูลอุบัติเหตุ 346 ครั้งเป็นดังนี้

รถขนาดเล็ก           รถขนาดกลาง        รถขนาดใหญ่

ร้ายแรง                   67                         26                          16

ไม่ร้ายแรง              128                       63                          46

ข้อมูลชี้ว่าความถี่ของอุบัติเหตุร้ายแรงขึ้นอยู่กับขนาดของรถหรือไม่? เขียนข้อความสั้นๆ อธิบายผลทางด้านสถิติและความหมายในเชิงปฏิบัติ

14.38 แพทย์และคนไข้ที่ต้องได้รับการรักษา – มีการทดลองเพื่อดูผลกระทบของประสบการณ์ของโรงพยาบาลทั่วไปเกี่ยวกับท่าทางของแพทย์ต่อคนไข้ที่ต้องได้รับการรักษา 50 ตัวอย่างสุ่มของแพทย์ที่เพิ่งให้บริการครบ 4 สัปดาห์ในโรงพยาบาลทั่วไปและ 50 ตัวอย่างสุ่มของแพทย์ที่ไม่ถูกแยกประเภทตามความสนใจของเขากับคนไข้ที่ต้องได้รับการรักษา ข้อมูลที่ถูกแสดงในตารางมีหลักฐานที่เพียงพอจะชี้ความเปลี่ยนแปลงใน “ความสนใจ” หลังจากประสบการณ์ในโรงพยาบาลทั่วไปหรือไม่ ถ้าใช่ อธิบายลักษณะของการเปลี่ยนแปลง

การให้บริการของโรงพยาบาล

สูง           ต่ำ            รวม

ต่ำ           27          5              32

สูง           9             9              18

ส่วนหนึ่งของผล MINITAB สำหรับแบบฝึกหัด 14.38

การทดสอบไคสแควร์: สูง, ต่ำ

Chi-Sq = 6.752, DF = 1, P-Value = 0.009

14.39 การสอนให้ค้นพบ – ผู้สอนวิชาชีววิทยา 2 คนกำหนดการประเมินผลกระทบของการสอนให้ค้นพบเทียบกับการสอนด้วยการบรรยายในห้องทดลอง การสอนด้วยการบรรยายมีรายการคำสั่งให้ทำตามในแต่ละขั้นตอนของแบบฝึกหัดการทดลอง ในขณะที่การสอนให้ค้นพบถามคำถามมากกว่าจะให้แนวทาง และใช้รายงานกลุ่มเล็กๆ เพื่อตัดสินวิธีที่ดีที่สุดในการบรรลุวัตถุประสงค์ของการทดลองปฏิบัติการ หนึ่งในเทคนิคการประเมินเกี่ยวกับการเขียนการประเมินของทั้ง 2 เทคนิคโดยนักเรียนเมื่อเรียนจบหลักสูตร การเปรียบเทียบจำนวนผลตอบรับเชิงบวกและเชิงลบสำหรับทั้ง 2 เทคนิคอยู่ในตารางดังต่อไปนี้

กลุ่ม                        ประเมินเชิงบวก    ประเมินเชิงลบ      รวม

ค้นพบ                      37                         11                          48

ควบคุม                     31                         17                         48

a. มีความแตกต่างอย่างมีนัยสำคัญในสัดส่วนของผลตอบรับเชิงบวกสำหรับแต่ละวิธีการสอนหรือไม่? โดยใช้ α = .05 ถ้าใช่ คุณจะอธิบายความแตกต่างนี้อย่างไร?

b. ค่าประมาณ p ของการทดสอบในข้อ a. คือเท่าไหร่?

14.40 ท่านอนของเด็ก – ท่านอนของเด็กมีผลกระทบต่อการพัฒนาการเคลื่อนไหวหรือไม่? ในการศึกษาหนึ่ง ทารก 343 คนถูกตรวจร่างกายตอน 4 เดือนในหลายๆ ด้านของระยะพัฒนาการ เช่น การหมุนตัว, การจับของเล่น, และการเอื้อมถึงวัตถุ ท่านอนส่วนใหญ่ของเด็ก ไม่ว่าจะเป็นนอนคว่ำ (ทางท้อง) หรือ นอนหงาย (ทางหลัง) หรือ นอนตะแคง ถูกสอบถามโดยการสัมภาษณ์ทางโทรศัพท์กับพ่อแม่ ผลของตัวอย่างทารก 320 จาก 343 คนได้ข้อมูลดังแสดงในตาราง นักวิจัยรายงานว่าทารกที่นอนตะแคงหรือนอนหงายสามารถหมุนตัวได้น้อยกว่าทารกที่นอนคว่ำเป็นหลัก (P < .001) ในการตรวจร่างกายตอน 4 เดือน

นอนคว่ำ                 นอนหงายหรือนอนตะแคง

จำนวนของทารก                 121                         199

จำนวนทารกที่หมุนตัว         93                           119

a. ใช้การทดสอบตัวอย่าง z ขนาดใหญ่เพื่อยืนยันหรือปฏิเสธข้อสรุปของนักวิจัย

b. เขียนข้อมูลตัวอย่างด้วยตารางความเป็นไปได้ 2 X 2 ใหม่โดยใช้การทดสอบไคสแควร์สำหรับความเหมือนกันเพื่อยืนยันหรือปฏิเสธข้อสรุปของนักวิจัย

c. เปรียบเทียบผลของข้อ a. และ ข้อ b. แล้วยืนยันว่าสถิติการทดสอบทั้ง 2 สัมพันธ์กันแบบ z2 = X2 และค่าวิกฤตสำหรับปฏิเสธ Ho มีความสัมพันธ์เหมือนกัน

14.41 อ้างถึงแบบฝึกหัด 14.40 หาค่า p สำหรับการทดสอบตัวอย่าง z ขนาดใหญ่ในข้อ a. เปรียบเทียบค่า p นี้กับค่า p ของการทดสอบไคสแควร์ที่แสดงในส่วนหนึ่งของผล MINITAB

ส่วนหนึ่งของผล MINITAB สำหรับแบบฝึกหัด 14.41

การทดสอบไคสแควร์: นอนคว่ำ, นอนตะแคง

Chi-Sq = 9.795, DF = 1, P-Value = 0.002

14.42 ท่านอนของเด็ก 2 – นักวิจัยในแบบฝึกหัด 14.40 ยังวัดระยะพัฒนาการอื่นๆ และความสัมพันธ์ต่อท่านอนหลักด้วย ผลการวิจัยของทารก 320 คนในการตรวจร่างกายตอน 4 เดือนถูกแสดงในตารางดังนี้

ระยะพัฒนาการ                     คะแนน                   นอนคว่ำ                 นอนหงาย/ตะแคง               P

ดึงให้นั่งโดยหัวไม่หงาย               ผ่าน                    79                            144

ไม่ผ่าน                     6                               20                                <.21

การจับของเล่น                              ผ่าน                     102                         167

ไม่ผ่าน                      3                              1                                   <.13

การเอื้อมถึงวัตถุ                            ผ่าน                    107                          183

ไม่ผ่าน                      3                               5                                  <.97

ใช้ความรู้ด้านการวิเคราะห์ข้อมูลการจำแนกประเภทเพื่ออธิบายการออกแบบการทดลองโดยนักวิจัย สมมุติฐานอะไรที่เป็นที่สนใจของนักวิจัย และการทดสอบทางสถิติอะไรที่นักวิจัยใช้? อธิบายผลสรุปที่ได้จากค่า p 3 ตัวในคอลัมน์สุดท้ายของตารางและความหมายในเชิงปฏิบัติที่ได้จากผลทางด้านสถิติ มีสมมุติฐานทางด้านสถิติอะไรที่ถูกละเมิดบ้าง?

14.43 สีและทรงของดอกไม้ – นักพฤกษศาสตร์ทำการผสมข้ามสายพันธุ์ดอกเพ็ตทูเนียครั้งที่ 2 ซึ่งเกี่ยวกับปัจจัยอิสระที่กำหนดทรงของใบและสีของดอกไม้ โดยที่ปัจจัย A แทนสีแดง, a แทนสีขาว, B แทนใบกลม, และ b แทนใบยาว ตามกฎของเมนเดล ต้นไม้ควรแสดงลักษณะ AB, Ab, aB, และ ab ในสัดส่วน 9:3:3:1 จากต้นไม้ที่ใช้ทดลอง 160 ต้น ตัวเลขที่สังเกตได้มีดังนี้

AB      Ab       aB        ab

95        30        28        7

มีหลักฐานเพียงพอที่จะปฏิเสธกฎของเมลเดลที่ระดับ α = .01 หรือไม่?

14.44 เชื้อแบคทีเรีย Salmonella – ไก่งวงสำหรับวันหยุดของคุณปลอดภัยหรือไม่? การสำรวจของสหพันธ์ใหม่พบว่า 13% ของไก่งวงมีเชื้อแบคทีเรีย Salmonella ปนอยู่ซึ่งทำให้ 1.3 ล้านคนป่วยและ 500 คนตายในแต่ละปีในสหรัฐอเมริกา ใช้ตารางที่มีอยู่เพื่อตัดสินว่ามีความแตกต่างอย่างมีนัยสำคัญในระดับการปนเปื้อนใน 3 โรงงานหรือไม่ ไก่งวง 100 ตัวถูกสุ่มเลือกจากแต่ละสายการผลิตในทั้ง 3 โรงงาน

โรงงาน                   มีเชื้อแบคทีเรีย Salmonella           ขนาดตัวอย่าง

1                                 42                                                     100

2                                23                                                      100

3                                22                                                      100

มีความแตกต่างอย่างมีนัยสำคัญในระดับการปนเปื้อนของเชื้อแบคทีเรีย Salmonella ในทั้ง 3 โรงงานหรือไม่? ถ้ามีความแตกต่างอย่างมีนัยสำคัญ อธิบายลักษณะความแตกต่างนี้โดยใช้ α = .01

14.45 ยาโรคข้ออักเสบ – การศึกษาเพื่อตัดสินประสิทธิผลของยา (เซรุ่ม) โรคข้ออักเสบได้ผลในการเปรียบเทียบ 2 กลุ่ม แต่ละกลุ่มประกอบด้วยคนไข้โรคข้ออักเสบ 200 คน กลุ่มหนึ่งถูกฉีดด้วยเซรุ่ม อีกกลุ่มหนึ่งถูกฉีดด้วยยาหลอก (ยาที่เหมือนจะประกอบด้วยเซรุ่มแต่จริงๆ แล้วไม่มีผล) หลังจากช่วงเวลาหนึ่ง แต่ละคนในการศึกษาถูกถามอาการโรคข้ออักเสบว่าดีขึ้นหรือไม่ ผลเป็นดังนี้:

เซรุ่ม       ยาหลอก

ดีขึ้น                        117         74

ไม่ดีขึ้น                   83           126

คุณต้องการทราบว่าข้อมูลนี้แสดงหลักฐานที่เพียงพอจะชี้ว่าเซรุ่มมีประสิทธิผลทำให้อาการคนไข้โรคข้ออักเสบดีขึ้นหรือไม่

a. ใช้การทดสอบความเหมือนกันไคสแควร์เพื่อเปรียบเทียบสัดส่วนอาการที่ดีขึ้นในกลุ่มที่ให้ยาจริงและยาหลอก ทดสอบที่ระดับนัยสำคัญ 5%

b. ทดสอบความเท่ากันของ 2 สัดส่วนทวินามโดยใช้การทดสอบ z 2 ตัวอย่างในหน่วยที่ 9.6 ดูว่าค่ากำลัง 2 ของการทดสอบสถิติ z2 = X2 ในข้อ a. หรือไม่ และข้อสรุปของคุณเหมือนกับในข้อ a. หรือไม่?

14.46 การจอดรถในมหาวิทยาลัย – มีการสำรวจเพื่อดูความรู้สึกของนักเรียน, คณะ, และฝ่ายบริหารต่อกฎการจอดรถใหม่ในมหาวิทยาลัย การกระจายตัวของผู้ที่ชอบและต่อต้านกฎถูกแสดงในตาราง ข้อมูลมีหลักฐานที่เพียงพอจะชี้ว่าความรู้สึกเกี่ยวกับกฎการจอดรถเป็นอิสระกับสถานะนักเรียน, คณะ, และฝ่ายบริหารหรือไม่?

นักเรียน                  คณะ                        ฝ่ายบริหาร

ชอบ                        252                     107                          43

ต่อต้าน                   139                      81                            40

14.47 การทดสอบไคสแควร์ที่ใช้ในแบบฝึกหัด 14.45 เหมือนกับการทดสอบ z 2 ทางในหน่วยที่ 9.6 โดยที่ α เหมือนกันสำหรับ 2 การทดสอบ ให้แสดงว่าสถิติการทดสอบไคสแควร์ X2 เป็นกำลัง 2 ของการทดสอบสถิติ z สำหรับการทดสอบที่เหมือนกันด้วยพีชคณิต

14.48 การทำให้เหมาะกับการกระจายตัวแบบทวินาม – คุณสามารถใช้การทดสอบสารรูปสนิทดีเพื่อตัดสินว่าได้ผ่านทุกเกณฑ์ของการนำการทดลองทวินามไปใช้ สมมุติว่าการทดลองประกอบด้วย 4 การทดสอบซึ่งทำซ้ำ 100 ครั้ง จำนวนการซ้ำของตัวเลขครั้งที่สำเร็จได้ถูกบันทึกในตาราง

ผลที่เป็นไปได้ (ตัวเลขครั้งที่สำเร็จ)    จำนวนครั้งที่ได้

0                                                                  11

1                                                                   17

2                                                                  42

3                                                                   21

4                                                                   9

การประมาณค่า p (สมมุติว่าเป็นการทดลองทวินาม) ได้ประมาณความถี่ของเซลล์คาดหวังและทดสอบสารรูปสนิทดี เพื่อตัดสินตัวเลข df ที่เหมาะสมสำหรับ X2 โดยที่ p เป็นค่าประมาณโดยการรวมเส้นตรงของความถี่ที่สังเกตได้

14.49 ยาปฏิชีวนะและการติดเชื้อ – การติดเชื้อบางครั้งเกิดขึ้นเมื่อมีการถ่ายเลือดระหว่างการผ่าตัด มีการทดลองเพื่อตัดสินว่าการให้ยาปฏิชีวนะลดความน่าจะเป็นในการติดเชื้อหรือไม่ การทดสอบในคนไข้ 138 คนถูกบันทึกออกมาเป็นข้อมูลแสดงในตาราง ข้อมูลให้หลักฐานที่เพียงพอจะชี้ว่าการฉีดยาปฏิชีวนะมีผลต่อการติดเชื้อจากการถ่ายเลือดหรือไม่? ทดสอบโดยใช้ α = .05

ติดเชื้อ    ไม่ติดเชื้อ

ใช้ยาปฏิชีวนะ                    4             78

ไม่ใช้ยาปฏิชีวนะ              11            45

14.50 โรงงานในเยอรมัน – สหภาพแรงงานในอเมริกามีธรรมเนียมที่ให้การบริหารงานในบริษัทเป็นของผู้จัดการและผู้บริหารองค์กร แต่ในยุโรป แนวคิดที่พนักงานมีส่วนร่วมในการตัดสินใจด้านการบริหารเป็นที่ยอมรับและขยายวงกว้างอย่างต่อเนื่อง เพื่อศึกษาผลกระทบของการมีส่วนร่วมของพนักงานในการตัดสินใจด้านการบริหาร พนักงาน 100 คนในแต่ละโรงงานจาก 2 โรงงานในเยอรมันถูกสัมภาษณ์ โรงงานหนึ่งมีพนักงานที่มีส่วนร่วมในการตัดสินใจด้านการบริหาร อีกโรงงานหนึ่งไม่มี พนักงานแต่ละคนถูกถามว่าเขาหรือเธอเห็นด้วยกับการตัดสินใจด้านการบริหารภายในองค์กรหรือไม่ ผลการสัมภาษณ์ถูกแสดงในตาราง:

มีส่วนร่วม              ไม่มีส่วนร่วม

เห็นด้วย                  73                          51

ไม่เห็นด้วย             27                          49

a. ข้อมูลมีหลักฐานเพียงพอจะชี้ว่าการเห็นด้วยหรือไม่เห็นด้วยกับการตัดสินใจด้านการบริหารขึ้นอยู่กับว่าพนักงานมีส่วนร่วมในการตัดสินใจหรือไม่? ทดสอบโดยใช้การทดสอบทางสถิติ X2 และใช้ α = .05

b. ข้อมูลเหล่านี้สนับสนุนสมมุติฐานที่พนักงานในองค์กรที่มีส่วนร่วมในการตัดสินใจเห็นด้วยกับการตัดสินใจด้านการบริหารในองค์กรมากกว่าพนักงานในองค์กรที่ไม่มีส่วนร่วมในการตัดสินใจหรือไม่? ทดสอบโดยใช้การทดสอบ z ที่แสดงในหน่วย 9.6 ทำไมปัญหานี้เป็นปัญหาทางเดียว?

14.51 3 ทางเข้า – มีการศึกษาการจราจรซึ่งกินพื้นที่เพื่อช่วยปรับรูปแบบของอาคารสำนักงานที่มี 3 ทางเข้า ทางเลือกในการเข้าถูกบันทึกสำหรับตัวอย่าง 200 คนที่เข้าอาคาร ข้อมูลในตารางชี้ว่ามีความชอบที่แตกต่างของ 3 ทางเข้าหรือไม่? หาช่วงความเชื่อมั่น 95% สำหรับสัดส่วนของผู้ชอบเข้าทางเข้าที่ 1

ทางเข้าที่                 1          2          3

จำนวนผู้เข้า            83        61        56

14.52 ครูสอนตามบ้าน – พ่อแม่ที่ห่วงเรื่องสภาพแวดล้อมของโรงเรียนรัฐและหลักสูตรเปลี่ยนเป็นการสอนที่บ้านเพื่อควบคุมเนื้อหาและบรรยากาศการเรียนของลูกๆ ถึงแม้ว่าการจ้างครูโรงเรียนรัฐต้องมีการศึกษาระดับปริญญาตรีในด้านการศึกษาหรือวิชาที่เกี่ยวข้อง ประวัติการศึกษาของครูตามบ้านกลับค่อนข้างหลากหลาย ประวัติการศึกษาของตัวอย่างพ่อแม่ที่เกี่ยวข้องในการสอนลูก n = 500 ในปี 2003 ถูกแสดงในตารางแรกพร้อมด้วย % เรื่องเดียวกันในปี 1999 ระดับการศึกษาของพลเมืองอเมริกันโดยทั่วไปถูกแสดงในตารางที่ 2

การศึกษาของพ่อแม่                              2003    % ในปี 1999

มัธยมตอนปลายหรือต่ำกว่า                    121           18.9

วิทยาลัย / เทคนิค                                   153           33.7

ปริญญาตรี                                                127           25.1

ปริญญาโท / เอก                                     99             22.3

ระดับการศึกษา                                      % ของประชากรอเมริกันในปี 2003

มัธยมตอนปลายหรือต่ำกว่า                   47.5

วิทยาลัย                                                   25.3

ปริญญาตรีหรือสูงกว่า                            27.2

a. มีการเปลี่ยนแปลงอย่างมีนัยสำคัญในประวัติการศึกษาของพ่อแม่ที่สอนลูกที่บ้านในปี 2003 เปรียบเทียบกับปี 1999 หรือไม่? ใช้ α = .01

b. ถ้ามีการเปลี่ยนแปลงอย่างมีนัยสำคัญในประวัติการศึกษาของพ่อแม่เหล่านี้ คุณจะอธิบายการเปลี่ยนแปลงอย่างไร?

c. ใช้ตารางที่ 2 เราสามารถตัดสินว่าครูที่บ้านมีระดับการศึกษาเหมือนกับประชากรอเมริกันโดยทั่วไปหรือไม่? ถ้าไม่กลุ่มไหนที่น้อยกว่าและกลุ่มไหนที่มากกว่า?

14.53 คุณเป็นคนขับรถที่ดีหรือไม่? – คุณให้คะแนนการขับรถของคุณอย่างไร? ตามการสำรวจที่ทำโดยองค์กร Field คนแคลิฟอร์เนียส่วนใหญ่คิดว่าเขาเป็นคนขับรถที่ดี แต่มีความนับถือความสามารถในการขับของผู้อื่นเพียงน้อยนิด ข้อมูลแสดงการกระจายตัวของความเห็นเห็นเกี่ยวกับเพศใน 2 คำถาม อันแรกให้คะแนนตัวเองในฐานะผู้ขับรถและอันที่ 2 ให้คะแนนผู้อื่นในฐานะผู้ขับรถ แม้จะไม่ได้กำหนดที่มา เราถือว่ามีผู้ชาย 100 คนและผู้หญิง 100 คนในกลุ่มสำรวจ

ให้คะแนนตัวเองในฐานะผู้ขับรถ

เพศ                          ดีมาก      ดี             พอใช้

ชาย                          43          48            9

หญิง                         44          53            3

ให้คะแนนผู้อื่นในฐานะผู้ขับรถ

เพศ                          ดีมาก      ดี             พอใช้    แย่/แย่มาก

ชาย                           4           42             41         13

หญิง                          3          48              35         14

a. มีหลักฐานที่เพียงพอจะชี้ว่ามีความแตกต่างในการให้คะแนนตัวเองระหว่างผู้ขับรถชายและหญิงหรือไม่? หาค่าประมาณ p สำหรับการทดสอบ

b. มีหลักฐานเพียงพอที่จะชี้ว่ามีความแตกต่างในการให้คะแนนผู้อื่นระหว่างผู้ขับรถชายและหญิงหรือไม่? หาค่าประมาณ p สำหรับการทดสอบ

c. มีสมมุติฐานใดที่สำคัญสำหรับการวิเคราะห์ในข้อ a. และ b. ถูกละเมิดหรือไม่? ผลกระทบอะไรที่อาจมีต่อความมีเหตุผลของข้อสรุปของคุณ?

14.54 สียานพาหนะ – แต่ละรุ่นปีดูเหมือนจะมีการออกสีใหม่และสีที่ต่างออกไปสำหรับเหล่ายานพาหนะตั้งแต่รถหรู ถึงรุ่นใหญ่หรือรุ่นกลาง ไปยังรุ่นเล็ก, รถสปอร์ต, และรถบรรทุกเล็ก อย่างไรก็ตาม สีขาวและสีเงิน/เทายังอยู่ในระดับ 5 หรือ 6 สีสูงสุดในทุกประเภทของยานพาหนะเหล่านี้ 5 สีสูงสุดและเปอร์เซ็นต์ส่วนแบ่งตลาดสำหรับรถเล็ก/รถสปอร์ตถูกแสดงในตารางดังต่อไปนี้

สี             เงิน          เทา          น้ำเงิน     ดำ            ขาว/มุก

%             20           17           16          14            10

เพื่อตรวจสอบตัวเลข ตัวอย่างสุ่มของรถเล็ก/รถสปอร์ต 250 คันถูกเลือกและบันทึกสีของยานพาหนะ ตัวอย่างให้จำนวนดังต่อไปนี้สำหรับประเภทที่กล่าวด้านบน 60, 51, 43, 35, และ 30 ตามลำดับ

a. มีประเภทใดหายไปจากการจัดประเภทหรือไม่? มียานพาหนะกี่คันอยู่ในประเภทนั้น?

b. มีหลักฐานเพียงพอจะชี้ว่า % ของรถเล็ก/รถสปอร์ตต่างจากที่ให้มาหรือไม่? หาค่าประมาณ p สำหรับการทดสอบ

14.55 การ์ดตลกขบขัน – เมื่อคุณเลือกการ์ดอวยพร คุณเลือกการ์ดที่มีความตลกขบขันเสมอหรือขึ้นอยู่กับโอกาส การเปรียบเทียบที่สนับสนุนโดย 2 ผู้นำการผลิตการ์ดอวยพรในประเทศชี้ว่ามีความแตกต่างในสัดส่วนของการออกแบบที่ตลกขบขันสำหรับ 3 โอกาสที่แตกต่างกัน: วันพ่อ, วันแม่, และวันวาเลนไทน์ เพื่อทดสอบความถูกต้องของการเปรียบเทียบ ตัวอย่างสุ่มของการ์ดอวยพร 500 ใบที่ถูกซื้อในร้านขายการ์ดประจำท้องถิ่นในสัปดาห์ก่อนหน้าแต่ละวันหยุดถูกใส่ในฐานข้อมูลคอมพิวเตอร์ และได้ผลดังในตาราง ผลชี้ว่ามีสัดส่วนของการ์ดอวยพรที่ตลกขบขันแปรเปลี่ยนใน 3 วันนี้หรือไม่? (คำใบ้: จำไว้ว่าตารางรวมการ์ดอวยพรเท่ากับ 1,500 ใบ)

วันหยุด                                   วันพ่อ     วันแม่      วันวาเลนไทน์

% ของการ์ดตลกขบขัน         20           25           24

14.56 ยาที่มีรสดี – บริษัท ไฟเซอร์ (ประเทศแคนาดา) จำกัดเป็นบริษัทยาที่สร้าง azithromycin ยาปฏิชีวนะในรสเชอร์รี่เพื่อใช้รักษาการติดเชื้อแบคทีเรียในเด็ก เพื่อเปรียบเทียบรสของยากับบริษัทยาคู่แข่ง ไฟเซอร์ทดสอบเด็กที่มีสุขภาพดี 50 คน และผู้ใหญ่ที่มีสุขภาพดี 20 คน ระหว่างการทดสอบรสชาติอื่นๆ พวกเขาบันทึกจำนวนผู้ทดสอบที่ให้คะแนนยาปฏิชีวนะที่รสชาติดีที่สุดจากจำนวน 4 ตัว โดยผลแสดงดังในตาราง มีความแตกต่างในการรับรู้รสชาติที่ดีที่สุดระหว่างผู้ใหญ่และเด็กหรือไม่? ถ้ามีลักษณะของความแตกต่างคืออะไร? และทำไมมันมีความสำคัญในเชิงปฏิบัติต่อบริษัทยา?

รสของยาปฏิชีวนะ

กล้วย                      เชอร์รี่                     ผลไม้ป่า                 สตรอเบอร์รี่-กล้วย

เด็ก               14                           20                           7                              9

ผู้ใหญ่           4                             14                            0                              2

Azithromycin ถูกผลิตโดยบริษัท ไฟเซอร์ (ประเทศแคนาดา) จำกัด

14.57 การบาดเจ็บจากรักบี้ – การบาดเจ็บที่เข่าเป็นปัญหาหลักของนักกีฬาในหลายๆ กีฬาที่ต้องมีการสัมผัสกัน อย่างไรก็ตาม นักกีฬาที่เล่นในบางตำแหน่งมีโอกาสที่จะได้รับบาดเจ็บที่เข่ามากกว่าผู้เล่นอื่น และการบาดเจ็บเหล่านี้ค่อนข้างจะร้ายแรงกว่า ลักษณะเด่นและรูปแบบของการบาดเจ็บที่เข่าของนักกีฬารักบี้หญิงในวิทยาลัยถูกตรวจสอบโดยใช้คำถามง่ายๆ กับผู้ตอบใน 42 ชมรมรักบี้ จำนวนการบาดเจ็บที่เข่า 76 ครั้งถูกแยกประเภทและตำแหน่งผู้เล่น (หน้าหรือหลัง)

ชนิดการบาดเจ็บที่เข่า

ตำแหน่ง          Meniscal ฉีก          MCL ฉีก          ACL ฉีก          กระดูกสะบ้าเคลื่อน          PCL ฉีก

หน้า                    13                             14                      7                       3                                      1

หลัง                    12                             9                       14                      2                                      1

ผล MINITAB สำหรับแบบฝึกหัด 14.57

การทดสอบไคสแควร์: Meniscal ฉีก, MCL ฉีก, ACL ฉีก, กระดูกสะบ้าเคลื่อน, PCL ฉีก

a. ใช้ผล MINITAB เพื่อตัดสินว่ามีความแตกต่างในการกระจายตัวของชนิดการบาดเจ็บของผู้เล่นหน้าและหลังในกีฬารักบี้หรือไม่ มีสมมุติฐานอะไรที่สำคัญสำหรับการทดสอบไคสแควร์ที่ถูกละเมิด? ผลกระทบอะไรที่จะมีต่อความสำคัญของการทดสอบทางสถิติ?

b. ผู้ตรวจสอบรายงานความแตกต่างอย่างมีนัยสำคัญในสัดส่วนของการที่ MCL ฉีกสำหรับ 2 ตำแหน่ง (P < .05) และมีความแตกต่างอย่างมีนัยสำคัญในสัดส่วนของการที่ ACL ฉีก (P < .05) แต่ชี้ว่าการบาดเจ็บอื่นๆ มีความถี่ที่เท่ากันใน 2 ตำแหน่ง คุณเห็นด้วยกับข้อสรุปหรือไม่? จงอธิบาย

14.58 อาหารจานด่วนที่ชื่นชอบ – จำนวนคนอเมริกันที่ไปร้านอาหารจานด่วนบ่อยๆ เพิ่มขึ้นเรื่อยๆ ในทศวรรษที่ผ่านมา ด้วยเหตุนี้ ผู้เชี่ยวชาญด้านการตลาดจึงสนใจในประชากรลูกค้าร้านอาหารจานด่วน ความชอบร้านอาหารจานด่วนมีผลจากอายุของลูกค้าหรือไม่? ถ้าใช่ การโฆษณาต้องพุ่งเป้าไปที่กลุ่มอายุหนึ่ง สมมุติว่าสุ่มตัวอย่างลูกค้าร้านอาหารจานด่วน 500 คนตั้งแต่อายุ 16 ปีขึ้นไป และร้านอาหารจานด่วนของแต่ละคนในแต่ละกลุ่มอายุถูกบันทึก ดังแสดงในตาราง:

กลุ่มอายุ                 แมคโดนัลด์           เบอร์เกอร์คิง          เวนดี้ส์                    อื่นๆ

16-21                       75                           34                         10                          6

21-30                      89                           42                         19                           10

30-49                      54                           52                         28                          18

50+                          21                           25                          7                            10

ใช้วิธีที่เหมาะสมเพื่อตัดสินว่าความชอบร้านอาหารจานด่วนของลูกค้าขึ้นอยู่กับอายุหรือไม่? เขียนข้อความสั้นๆ อธิบายข้อสรุปทางด้านสถิติของคุณและความหมายในเชิงปฏิบัติสำหรับผู้เชี่ยวชาญด้านการตลาด

14.59 เป็นหวัด – โอกาสในการเป็นหวัดมีผลจากจำนวนคนที่คุณติดต่อด้วยหรือไม่? การศึกษาเมื่อเร็วๆ นี้โดย Sheldon Cohen ศาสตราจารย์ด้านจิตวิทยาที่มหาวิทยาลัย Carnegie Mellon เหมือนจะแสดงว่ายิ่งคุณมีความสัมพันธ์ด้านสังคมมาก คุณจะเป็นหวัดได้น้อยกว่า กลุ่มของชายและหญิงที่มีสุขภาพดีจำนวน 276 คนถูกแบ่งตามจำนวนความสัมพันธ์ (เช่น พ่อแม่, เพื่อน, สมาชิกในโบสถ์, เพื่อนบ้าน) พวกเขาถูกปล่อยให้เจอกับไวรัสที่จะทำให้เป็นหวัด โดยผลแสดงดังในตาราง

จำนวนความสัมพันธ์

3 หรือน้อยกว่า      4 / 5                 6 หรือมากกว่า

เป็นหวัด                 49                       43                       34

ไม่เป็นหวัด            31                       57                       62

รวม                        80                      100                     96

a. ข้อมูลมีหลักฐานที่เพียงพอจะชี้ว่าความไวต่อการเป็นหวัดมีผลจากจำนวนของความสัมพันธ์หรือไม่? ทดสอบที่ระดับนัยสำคัญ 5%

b. ด้วยผลจากข้อ a. อธิบายลักษณะของความสัมพันธ์ระหว่าง 2 ประเภทตัวแปร: การเกิดหวัดและจำนวนความสัมพันธ์ทางสังคม การสังเกตของคุณมีความเห็นที่ตรงกับข้อสรุปของผู้เขียนหรือไม่?

14.60 อาชญากรรมและการศึกษาที่ได้รับ – ผู้ชำนาญอาชญาวิทยาที่ศึกษาอาชญากรที่มีบันทึกการจับกุม 1 ครั้งหรือมากกว่าสนใจที่จะรู้ว่าระดับการศึกษาของอาชญากรมีผลกับความถี่ในการจับกุมหรือไม่ เขาจำแนกข้อมูลด้วย 4 ระดับการศึกษาคือ

A: จบเกรด 6 หรือน้อยกว่า

B: จบเกรด 7, 8, หรือ 9

C: จบเกรด 10, 11, หรือ 12

D: มากกว่าเกรด 12

ตารางความเป็นไปได้แสดงจำนวนอาชญากรในแต่ละระดับการศึกษากับจำนวนครั้งที่ถูกจับ

การศึกษาที่ได้รับ

จำนวนครั้งที่ถูกจับ                  A                     B                       C                      D

1                                              55                    40                    43                   30

2                                              15                    25                    18                    22

3 หรือมากกว่า                        7                      8                      12                    10

ข้อมูลแสดงหลักฐานที่เพียงพอจะชี้ว่าจำนวนครั้งที่ถูกจับขึ้นอยู่กับการศึกษาที่ได้รับของอาชญากรหรือไม่? ทดสอบโดยใช้ α = .05

14.61 ธุรกิจไปได้ดีกว่าในวันหยุด – ผู้จัดการห้างสรรพสินค้าอ้างว่าห้างมีลูกค้าเป็น 2 เท่าในวันศุกร์และวันเสาร์เมื่อเทียบกับวันอื่นๆ ในสัปดาห์ (ห้างปิดวันอาทิตย์) นั่นคือ ความน่าจะเป็นที่ลูกค้ามาห้างในวันศุกร์เป็น 2/8 ความน่าจะเป็นที่ลูกค้ามาห้างในวันเสาร์เป็น 2/8 ในขณะที่ความน่าจะเป็นที่ลูกค้ามาห้างในวันธรรมดาเป็น 1/8 ในสัปดาห์ที่มีลูกค้าในระดับปกติ จำนวนลูกค้าที่มาห้างเป็นดังนี้:

วัน                   จำนวนลูกค้า

จันทร์                  95

อังคาร                 110

พุธ                       125

พฤหัสบดี             75

ศุกร์                     181

เสาร์                     214

จะสามารถปฏิเสธคำอ้างของผู้จัดการที่ระดับนัยสำคัญ α = .05 ได้หรือไม่?

แบบฝึกหัดโปรแกรม

14.62 ใช้โปรแกรม Chi-Square Probabilities เพื่อหาค่าของ χ2 กับพื้นที่ α ทางขวา

a. α = .05, df = 15       b. α = .01, df = 11

14.63 ใช้โปรแกรม Chi-Square Probabilities เพื่อหาเขตปฏิเสธสำหรับการทดลองไคสแควร์ของความน่าจะเป็นที่ระบุสำหรับการทดสอบสารรูปสนิทดีที่มี k ประเภทสำหรับกรณีดังต่อไปนี้

a. k = 14, α = .005      b. k = 3, α = .05

14.64 ใช้โปรแกรม Chi-Square Probabilities เพื่อคำนวณค่า p สำหรับการทดสอบไคสแคร์ดังต่อไปนี้

a. X2 = .81, df = 3       b. X2 = 25.40, df = 13

14.65 มีคน 300 คนถูกสำรวจให้เลือกยี่ห้อคอมพิวเตอร์แล็ปท็อปที่ชอบ สมมุติว่ามีราคาเท่ากัน ผลแสดงดังในตาราง

ยี่ห้อ I    ยี่ห้อ II  ยี่ห้อ III

115      120      65

ใช้โปรแกรม Goodness-of-Fit อันแรกเพื่อตัดสินว่าลูกค้ามีความชอบ 1 ใน 3 ยี่ห้อมากกว่าหรือไม่ ถ้ามีความแตกต่างอย่างมีนัยสำคัญ อธิบายความแตกต่างในเชิงปฏิบัติ ให้ใช้ α = .01

14.66 ในแบบฝึกหัด 14.13 การกระจายตัวของสีของลูกอมช็อกโกแลตนม M&M’S ถูกให้ไว้ ให้ใช้โปรแกรม Goodness-of-Fit อันที่ 3 เพื่อตรวจสอบผลของแบบฝึกหัดที่ 14.13 ข้อมูลเหมือนกับ % ที่รายงานโดยบริษัท Mars หรือไม่? อธิบายลักษณะของความแตกต่าง (ถ้ามี)

14.67 อ้างถึงการกระจายตัวของสีในแบบฝึกหัด 14.13 ในซองเดี่ยวของช็อกโกแลตนม M&M’S ให้นับจำนวนของ M&M’S ในแต่ละสีจากทั้งหมด 6 สี ใช้โปรแกรม Goodness-of-Fit อันที่ 3 เพื่อตัดสินว่า % ที่รายงานโดยบริษัท Mars เป็นจริง อธิบายลักษณะของความแตกต่าง (ถ้ามี)

14.68 ทบทวนคำสั่งในแบบฝึกหัด 14.67 ด้วยซองเดี่ยว M&M’S อีกซอง ข้อสรุปของคุณยังเป็นเหมือนเดิมหรือไม่?

14.69 ความเห็นและพรรคการเมืองที่ชอบ – กลุ่มคน 306 คนถูกสัมภาษณ์เพื่อดูความเห็นของพวกเขาเกี่ยวกับประเด็นนโยบายต่างประเทศของอเมริกาในปัจจุบัน ในขณะเดียวกัน ความชอบในพรรคการเมืองก็ถูกบันทึกด้วย ข้อมูลในตารางแสดงหลักฐานที่เพียงพอจะชี้ความสัมพันธ์ระหว่างความชอบในพรรคและความเห็นของกลุ่มประชากรตัวอย่างหรือไม่? ใช้ โปรแกรม Chi-Square Test of Independence อันที่ 3

เห็นด้วย                  ไม่เห็นด้วย             ไม่มีความเห็น

รีพับบลิกัน             114                          53                           17

เดโมแครต             87                           27                           8

14.70 การศึกษาการตัดสินใจในการซื้อของผู้จัดการแผนการลงทุนในหุ้น A, B, และ C มีขึ้นเพื่อเปรียบเทียบจำนวนหุ้นที่ซื้อที่ให้ผลประโยชน์ในช่วงเวลาที่น้อยกว่าหรือเท่ากับ 1 ปี การซื้อ 100 ครั้งถูกสุ่มเลือกเพื่อพิจารณาผู้จัดการแต่ละคน ข้อมูลให้หลักฐานความแตกต่างระหว่างระดับความสำเร็จในการซื้อของผู้จัดการทั้ง 3 คนหรือไม่? ใช้โปรแกรม Chi-Square Test of Independence อันที่ 3

A          B           C

ให้ผลประโยชน์                       63        71        55

ไม่ให้ผลประโยชน์                  37        29        45

กรณีศึกษา

แนวทางการตลาดสามารถปรับปรุงการให้บริการของห้องสมุดได้หรือไม่?

Carole Day และ Del Lowenthal ศึกษาผลตอบรับการประเมินการให้บริการของห้องสมุดในผู้ใหญ่ตอนต้น n = 200 คน n1 = 152 คนเป็นนักศึกษาและ n2 = 48 คนไม่ใช่นักศึกษา ตารางแสดง % และจำนวนของผู้ตอบรับว่าชอบในแต่ละกลุ่มใน 7 คำถามเกี่ยวกับบรรยากาศ, เจ้าหน้าที่, และการออกแบบห้องสมุด

คำถาม                                                                 นักศึกษาที่ชอบ                 n1 = 152     คนที่ไม่ใช่นักศึกษาที่ชอบ              n2 = 48             P(χ2)

3 เป็นห้องสมุดที่เป็นมิตร                                      79.6%                              121                 56.2%                                            27                    <.01

4 เป็นห้องสมุดที่ไม่สดใส                                     77                                     117                 58.3                                               28                    <.05

5 จนท.ห้องสมุดช่วยเหลือดี                                 91.4                                  139                 87.5                                               42                    NS

6 จนท.ห้องสมุดไม่ช่วยเหลือวัยรุ่น                     60.5                                  92                   45.8                                               22                    <.01

7 ห้องสมุดเงียบจนอึดอัด                                     75.6                                 115                  52.05                                            25                    <.01

11 ห้องสมุดควรตกแต่งให้สว่างกว่านี้                  29                                      44                   18.8                                                9                      NS

13 ห้องสมุดใช้ป้ายได้ไม่ดี                                   45.4                                  69                   43.8                                                21                   NS

ที่มา: ข้อมูลจาก C. Day และ D. Lowenthal, “การใช้การสนทนากลุ่มแบบเปิดในด้านการตลาดการให้บริการของห้องสมุดต่อผู้ใหญ่ในตอนต้น” โดย C. Day และ D. Lowerthal, British Journal of Educational Psychology, 62(1992): 324-340

ข้อมูลในคอลัมน์สุดท้ายที่บอกว่า P(χ2) เป็นค่า p สำหรับการทดสอบสมมุติฐานของความไม่แตกต่างในสัดส่วนของผู้ที่เป็นนักศึกษาและไม่ได้เป็นนักศึกษาที่ตอบเรื่องความชอบในแต่ละคำถาม ดังนั้นแต่ละคำถามจึงเป็นตารางความเป็นไปได้ 2 X 2

1. สร้างการทดสอบความเหมือนกันของแต่ละคำถามและพิสูจน์รายงานการทดสอบค่า p

2. คำถามที่ 3, 4, และ 7 เกี่ยวกับบรรยากาศของห้องสมุด คำถามที่ 5 และ 6 เกี่ยวกับเจ้าหน้าที่ห้องสมุด และคำถามที่ 11 และ 13 เกี่ยวกับการออกแบบของห้องสมุด คุณจะสรุปผลของการวิเคราะห์ของคุณเกี่ยวกับ 7 คำถามนี้ในด้านภาพลักษณ์ของห้องสมุดว่าอย่างไร?

3. ด้วยข้อมูลที่มีให้ มันเป็นไปได้หรือไม่ที่จะทำการทดลองต่อไปอีกเกี่ยวกับสัดส่วนของผลตอบรับที่ชอบและไม่ชอบสำหรับ 2 คำถามหรือมากกว่าในขณะเดียวกัน?

เอกสารอ้างอิง

Kitchens, L.J. (2003) “Basic Statistics and Data Analysis.” Cengage Learning.

28 responses »

  1. Hello i am kavin, its my first occasion to commenting anyplace, when i
    read this piece of writing i thought i could also
    create comment due to this goood paragraph.

  2. I’m really loving the theme/design of your website.
    Do you ever run into any web browser compatibility
    problems? A few of myy blog visitors have complained about
    my blog not working correctly in Explorer but lookls great in Safari.

    Do you have any tips to help fix this issue?

  3. Just desire to say your article iss as astonishing.
    The clarity in your post iis just great and i can assume you’re an expert on this subject.
    Fine with your permission allow me to grab your RSS feed to keep updawted with forthcoming post.

    Thanks a million and please kewep up the rewarding work.

  4. This is very interesting, You’re ann excessively skilled blogger.

    I’ve joined your rss feed annd look forward to in quest of extra of your great post.

    Additionally, I have shared your site in my social networks

  5. What’s Happening i’m new to this, I stumbled upon this
    I have discovered It absolutely helpful and it has aided mme out
    loads. I’m hoping to give a conrribution & help
    different users like its aided me. Good job.

  6. We are a bunch of volunteers and starting a new scheme
    inn our community. Your site offered us wit helpful information to work on. You have done a formidable
    task and ouur entire neighborhood will likely be grateful to you.

  7. Whɑt’s Happening i am new to this, I stumbleԀ upߋn this I have found It absolutely helpful and it has helped mme out loads.
    I’m hopіng to give a contributіon & assist other useгs like its
    helped me. Ԍood jοb.

  8. A mοtivɑting discussion iis definitely worth comment.
    I do believe that ʏou need to write more about this
    subject, itt might nott bbe a taboo matter but generally
    people do not speak about these subjects. To the next! CҺeers!!

    • Hi!
      Thank you for your comment.
      Actually, i’m not good at the topic of categorical data analysis.
      As i state at the beginning that i’m just a translator.
      It’s part of my study.
      My e-mail is tg_sandy@yahoo.com
      I can suggest some of the book for you, but i, myself, don’t know much about it.
      haha.. sorry for that

  9. Мy partner and I absolutely love your blog and find ɑlkmost all of
    your post’s to be just what Ι’m looking for. Would
    you offfer guest writеrs to ԝrite content for yourself?
    I wouldn’t mind ϲomposing а ρost oг elaborating onn many of the subjects yoս
    write about here. Again, awesome web log!

    • Hi!
      Thank you for your comment.
      Actually, i’m not good at the topic of categorical data analysis.
      As i state at the beginning that i’m just a translator.
      It’s part of my study.
      If your content is related to mine, i’m more than welcome to post yours (with your name and link).
      Just send me an e-mail: tg_sandy@yahoo.com

  10. An oսtstanding share! I’ve just forwarded this onto a colleague
    who had Ьеen conducting a lіttle homework on this.
    And he in fact bought me dinner because I found it for him…

    lol. Sߋ let mе reword this…. Thankѕ for thee meal!!
    Вut yеah, thwnx for spending some time to discuss this
    topic hеre on your աeb site.

  11. Јust wisɦ to say ʏour article is as astonishing. The ϲlearness to youjr put up is simply
    nice аnd i could suppose you are an еxƿert in this
    suЬject. Well along with your permission aklow me too grab
    your feed to stay up tto date with impеndіng post. Thank you οne million and please keep up the enjoyable work.

  12. An іnterestіng discuѕsion is definitely worth comment.
    I do tjink that you should publish more on this topic,
    it might not be a tabo suibject but geneгally peple don’t discuss these subjects.
    To the neҳt! Best wishes!!

ใส่ความเห็น

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / เปลี่ยนแปลง )

Twitter picture

You are commenting using your Twitter account. Log Out / เปลี่ยนแปลง )

Facebook photo

You are commenting using your Facebook account. Log Out / เปลี่ยนแปลง )

Google+ photo

You are commenting using your Google+ account. Log Out / เปลี่ยนแปลง )

Connecting to %s