14 ม.ค. 2553

อาศาแห่งความอิสระ



การศึกษาวิชาสถิติมีวัตถุประสงค์ เพื่อที่จะให้ทราบถึงลักษณะต่างๆ ของประชากรที่สนใจศึกษา
ความหมายของคำว่า สถิติ
สถิติตรงกับคำว่า statistics ซึ่งมาจากคำว่า state แปลว่า รัฐ



สถิติ อาจหมายถึง ข้อมูลสถิติ (statistical data) ซึ่งหมายถึง ตัวเลข หรือ หมายถึง สถิติศาสตร์ (statistics) ศาสตร์ชนิดหนึ่งที่ว่าด้วยการจัดการต่างๆ ที่เกี่ยวกับข้อมูล ซึ่งได้แก่ การเก็บรวบรวมข้อมูล การนำเสนอข้อมูล และการวิเคราะห์ การแปลความหมายหรือแปลผล รวมทั้งนำเอาข้อมูลที่รวบรวมได้จากตัวอย่างไปใช้ในการคาดคะเนและตัดสินใจต่าง ที่เกี่ยวกับประชากร

สถิติแบ่งได้เป็น 2 ประเภทคือ
1. สถิติเชิงพรรณนา (Descriptive statistics) หรือ สถิติภาคบรรยาย เป็นสาขาของวิชาสถิติที่ว่าด้วยมาตรการในการเก็บรวมรวมข้อมูลและนำข้อมูลที่ได้มาจัดนำเสนอให้อยู่ในรูปที่กระชับ สามารถรับรู้และเข้าใจความหมายในส่วนที่เป็นผลสรุป หรือภาพรวมได้ง่าย โดยกระทำได้ในขอบเขตที่กำหนดไว้ในการศึกษาเท่านั้น ไม่สามารคาดคะเนลักษณะต่างๆ ของข้อมูลออกไปจากที่มีอยู่ได้ ซึ่งได้แก่ การนำเสนอข้อมูล การแจกแจงความถี่ การวัดแนวโน้มเข้าสู่ส่วนกลาง การวัดการกระจาย การวัดความเบ้และความโด่ง การวัดตำแหน่ง

2. สถิติเชิงอนุมาน (Inferential statistics) หรือสถิติภาคสรุปพาดพิง เป็นสาขาของวิชาสถิติที่ว่าด้วยกระบวนการของการมุ่งประมาณค่าประชากรและการทดสอบสมมุติฐานโดยอาศัยหลักของความน่าจะเป็น ในกระบวนการของการทดสอบและประมาณค่าดังกล่าว จะมีการเก็บข้อมูลจากกลุ่มตัวอย่างมาส่วนหนึ่งและนำมาจัดกระทำตามขั้นตอนที่กำหนด โดยมุ่งหวังผลที่ได้จากการทดสอบสามารถนำไปใช้อ้างอิงในประชากรทั้งหมด ได้แก่ การสุ่มตัวอย่าง การประมาณค่า การทดสอบสมมุติฐาน ซึ่งการอ้างอิงจะอาศัยวิธีการทางสถิติ 2 ประเภทคือ

1. สถิติแบบพาราเมตริก (Parametric statistics) เป็นการนำค่าที่ได้จากตัวอย่าง (sample) ซึ่งเรียกว่าค่าสถิติไปอธิบายคุณลักษณะของประชากร (population) ซึ่งเรียกว่า ค่าพารามิเตอร์ ซึ่งจะต้องเป็นไปตามข้อกำหนดเบื้องต้น (assumption) ว่าประชากรต้องมีการกระจายแบบเป็นโค้งปกติ (normal distribution) และตัวอย่างแต่ละตัวอย่าง (observations) จะต้องเป็นอิสระต่อกัน

2. สถิติแบบนอนพาราเมตริก (Non-parametric statistics) ใช้กับประชากรที่ไม่มีการกระจายแบบเป็นโค้งปกติ และใช้กับกลุ่มตัวอย่างที่มีขนาดเล็ก เหมาะกับข้อมูลที่มีระดับการวัดเป็น nominal และ ordinal scale

ประชากร (population) คือ กลุ่มของหน่วยทั้งหมดที่ต้องการจะศึกษา หรือทุกหน่วยในเรื่องที่สนใจศึกษา (universe of all unit beings studied)
พารามิเตอร์ (parameter) คือ ค่าที่แสดงคุณลักษณะของประชากร ได้แก่ ค่าเฉลี่ยของประชากร ความแปรปรวนของประชากร สัดส่วนของประชากร

ตัวอย่าง (sample) คือ ส่วนย่อยของประชากรหรือบางส่วนของประชากร
ค่าสถิติ (statistics) คือ ค่าที่คำนวณจากข้อมูลตัวอย่าง ได้แก่ ค่าเฉลี่ยของตัวอย่าง ความแปรปรวนของตัวอย่าง
ข้อมูล (data) คือ ข้อเท็จจริงเกี่ยวกับเรื่องต่างๆ ที่เราสนใจ ข้อมูลอาจจะเป็นตัวเลขหรือไม่ก็ได้

ชนิดของข้อมูล
1. แบ่งตามลักษณะของข้อมูล
1.1 ข้อมูลเชิงปริมาณ (quantitative data) คือข้อมูลที่เป็นตัวเลขที่มีค่าแน่นอน สามารถวัดค่าได้ เช่น น้ำหนัก ส่วนสูง อายุ รายได้ แบ่งได้เป็น 2 แบบคือ
1.1.1 ข้อมูลชนิดไม่ต่อเนื่อง (discrete data) คือข้อมูลที่สามารถจะนับค่าได้ว่ามีอยู่จำนวนเท่าไร่ คือเป็นจำนวนเต็มหรือจำนวนนับ เช่น จำนวนสัตว์ที่เป็นโรค (กี่ตัว) จำนวนเกษตรกรโคนมทั้งหมดในจังหวัดนครปฐม (กี่ราย) จำนวนตึก (กี่หลัง)
1.1.2 ข้อมูลชนิดต่อเนื่อง (continuous data) คือข้อมูลที่มีค่าทุกค่าได้ในช่วงที่กำหนดที่มีความหมาย ไม่สามารถจะนับค่าได้ว่ามีอยู่จำนวนเท่าไร เช่น น้ำหนักสินค้า ความสูงของคน ปริมาตร
1.2 ข้อมูลเชิงคุณภาพ (quanlitative data) คือ ข้อมูลที่ไม่ใช่ตัวเลข (หรือเป็นตัวเลขที่ค่าไม่แน่นอน) ข้อมูลที่ไม่สามารถระบุค่าได้ว่ามีมากหรือน้อย เช่น เพศ พันธุ์สัตว์ อาชีพ สีของขนม

2. แบ่งตามสเกลของหลักการวัดข้อมูล
ข้อมูลจากการวัดปรากฏการณ์ทางคลินิกมี 3 ชนิดด้วยกันคือ
2.1 ข้อมูลนามบัญญัติ (nominal scale) หรือ นามสเกล จะเป็นข้อมูลเชิงคุณภาพ เป็นการแบ่งกลุ่มโดยไม่มีการคำนึงถึงการเรียงลำดับ สามารถแบ่งได้หลายๆ กลุ่มเช่น ตัวแปรหมู่เลือด ABO แบ่งเป็นหมู่เลือด A, B, O และ AB หรือสองกลุ่ม (dichotomous) เป็นโรค/ไม่เป็นโรค ท้อง/ไม่ท้อง ชายหรือหญิง
2.2 ข้อมูลเรียงลำดับ (ordinal scale) หรืออันดับสเกล จะเป็นข้อมูลที่สามารถนำมาเรียงลำดับหรือจัดลำดับได้ เช่น ดี ปานกลาง แย่ หรือจะเป็นระดับคะแนนของ lameness score เช่น 1,2,3,4,5 หรือ Body condition score เช่น 1,2,3,4,5 เป็นต้น
2.3 ข้อมูลระดับช่วง (อันตรภาคชั้น) (interval scale) หรือช่วงสเกล จะเป็นข้อมูลในลักษณะเชิงปริมาณ เป็นข้อมูลที่สามารถนำมาเรียงหรือจัดลำดับโดยที่ช่วงระหว่างระดับมีขนาดเท่าๆ กัน ข้อมูลชนิดนี้มีสองแบบ คือ ข้อมูลแบบต่อเนื่อง (continuous) เช่น ข้อมูลทางเคมี ข้อมูลน้ำหนัก ข้อมูลน้ำนมดิบ กับข้อมูลชนิดนับ (discrete data) เช่น จำนวนท้องของโค จำนวนการป่วยด้วยโรคเต้านมอักเสบต่อเดือน เป็นต้น
2.4 ข้อมูลอัตราส่วน (ratio scale) หรือสัดส่วนสเกล จะเป็นตัวแปรที่มีสเกลการวัดที่กำหนดช่วงค่าเป็นตัวเลขในลักษณะข้อมูลต่อเนื่อง ไม่มีจุดสูงสุดหรือต่ำสุด แต่มีค่าเป็นศูนย์แท้ ที่มีความหมายว่า ไม่มีความแตกต่างระหว่างช่วงของตัวแปรมีค่าเท่ากัน

การวิเคราะห์ข้อมูลจากตัวแปรเดียว (univariate) เช่น การหาค่าเฉลี่ย ค่าความแปรปรวน ค่าต่ำสุดและค่าสูงสุด ร้อยละ สัดส่วน มัธยฐาน ลำดับ
การวิเคราะห์ข้อมูลจากสองตัวแปร (bivariate) เช่น การหาค่าสัมประสิทธิสหสัมพันธ์แบบ Pearson แบบ Spearman แบบ Kendall การหาสมการถดถอยที่แสดงความสัมพันธ์ระหว่างสองตัวแปรที่กำหนดให้ตัวแปรหนึ่งเป็นตัวแปรตามอีกตัวหนึ่งเป็นตัวแปรอิสระ
การวิเคราะห์ข้อมูลมากกว่าสองตัวแปร (multivariate) เช่น การหาสมการถดถอยที่แสดงความสัมพันธ์ระหว่างสองตัวแปรขึ้นไปที่กำหนดให้ตัวแปรหนึ่งเป็นตัวแปรตามและตัวแปรที่เหลือเป็นตัวแปรอิสระ การวิเคราะห์การถดถอยแบบโลจิท การวิเคราะห์การถดถอยแบบมัลติโนเมียล การวิเคราะห์จัดกลุ่ม

การวิเคราะห์ข้อมูลขั้นต้น หรือเรียกกันว่า สถิติเชิงพรรณนา (Descriptive statistics) จะเป็นการสรุปถึงลักษณะของข้อมูลที่เก็บรวบรวมมาหรือที่มีอยู่ ได้แก่ การนำเสนอข้อมูล การแจกแจงความถี่ (frequency distribution) การวัดแนวโน้มส่วนกลาง การวัดการกระจาย

การนำเสนอข้อมูล อาจจะเป็นการนำเสนอข้อมูลเป็นตาราง กราฟแท่ง กราฟเส้น กราฟวงกลมหรือกราฟรูปภาพ การแจกแจงความถี่ (frequency distribution)
ความถี่ (frequency) คือ จำนวนครั้งของข้อมูลที่มีค่าต่างๆ หรือจำนวนครั้งของข้อมูลที่อยู่ในช่วงต่างๆ
ความถี่สะสม (cumulative frequency) คือ ค่าผลรวมของความถี่จากน้อยไปหามาก หรือจากมากไปหาน้อย
ความถี่สัมพัทธ์ (relative frequency) คืออัตราส่วนระหว่างความถี่ กับผลรวมความถี่ทั้งหมด
การแจกแจงความถี่ มี 2 ชนิด คือ การแจกแจงความถี่ที่ไม่ได้แบ่งเป็นช่วงกับที่แบ่งเป็นช่วง เช่น
ระยะเวลาอ่านหนังสือ (ชั่วโมงต่อสัปดาห์) ของนักศึกษา 30 คน มีดังนี้คือ
15.0 23.7 19.7 15.4 18.3 23 14.2 20.8 13.5 20.7 17.4 18.6 12.9 20.3 13.7 21.4 18.3 29.8 17.1 18.9 10.3 26.1 15.7 14.0 17.8 33.8 23.2 12.9 27.1 16.6





การวัดแนวโน้มส่วนกลาง (Measures of Central tendency) คือการวัดค่ากลางของข้อมูลเชิงปริมาณว่าอยู่ที่ใด ค่าที่นิยมใช้วัดได้แก่
ค่าเฉลี่ย หรือ มัชฌิมเลขคณิต (Arithmetic Mean) คือ ค่าเฉลี่ยของข้อมูล โดยการนำเอาค่าของหน่วยข้อมูลทุกๆ หน่วยมารวมกันแล้วหารด้วยจำนวนหน่วยข้อมูลทั้งหมด
ถ้าข้อมูลมีหลายๆ ชุด และทราบค่าเฉลี่ยของข้อมูลแต่ละชุด จะสามารถหาค่าเฉลี่ยเลขคณิตรวมได้



มัธยฐาน (Median) คือค่ากึ่งกลางของข้อมูลที่เรียงลำดับจากน้อยไปหามาก หรือมากไปหาน้อย
ฐานนิยม (Mode) คือค่าของข้อมูลที่มีความถี่มากที่สุด
มัชฌิมเรขาคณิต (Geometric Mean) คือ ค่ารากที่ n ของผลคูณของข้อมูลทั้งหมด ค่ามัชฌิมเรขาคณิตจะใช้สำหรับการหาอัตราการเปลี่ยนแปลงเฉลี่ย

2 ความคิดเห็น:

  1. ไม่ระบุชื่อ31 มกราคม 2565 เวลา 14:05

    Best online casino site with no deposit bonus
    With the most comprehensive 제왕 카지노 list of casino deposit bonus codes and exclusive welcome offers, our team of experts have compiled 카지노사이트 the list of the หาเงินออนไลน์ best online casinos

    ตอบลบ
  2. The Wizard of Oz Casino & Hotel - JT Hub
    The Wizard of Oz Casino & Hotel. The Wizard 전라남도 출장샵 of Oz Casino & Hotel is 울산광역 출장마사지 a Casino in Las Vegas, Nevada 밀양 출장샵 and 순천 출장마사지 features a variety of table 전라남도 출장마사지 games

    ตอบลบ