ĐỘ CHÍNH XÁC TRONG XÁC SUẤT THỐNG KÊ LÀ GÌ

Bài này nhằm khám phá sâu rộng về Suy luận thống kê lại (Statistical Inference), vào đó, nỗ lực hiểu hơn về bạn dạng chất, ý nghĩa sâu sắc của môn...Bạn sẽ xem: Độ đúng chuẩn trong phần trăm thống kê là gì


*

Bài này nhằm tò mò sâu rộng về Suy luận thống kê lại (Statistical Inference), trong đó, cố gắng hiểu hơn về bản chất, ý nghĩa của môn học tập Thống kê vào ứng dụng giải quyết các bài bác toán thực tế trong cuộc sống, cũng như, làm rõ các quan niệm cơ phiên bản nhưng dễ dàng nhầm lẫn, như quy mô xác suất, mô hình thống kê, trưng bày xác suất, ...Mình lược dịch Chương 5.

Bạn đang xem: Độ chính xác trong xác suất thống kê là gì

Suy luận thống kê của cuốn sách Probability and Statistics: The Science of Uncertainty (Link cuối bài). Đồng thời, nội dung bài viết cũng bửa sung, tổng thích hợp thêm các kiến thức liên quan (để sách tìm hiểu thêm cuối bài), ví dụ, phần 0 của bài bác là nói lại khái niệm, những thuật ngữ về Xác suất.Phần 0. Đôi đường nét về Xác suấtPhần 1. Ý nghĩa của Thống kêPhần 2. Kiểm nghiệm sử dụng quy mô Xác suấtPhần 3. Mô hình thống kêPhần 4. Tích lũy dữ liệuPhần 5. Một vài chu chỉnh cơ bảnXác suất là vấn đề định lượng tài năng sẽ xẩy ra của một sự khiếu nại trong cuộc sống, dựa trên các quy tắc toán học để tham dự báo, cầu lượng. Nói giải pháp khác, tỷ lệ đo đạc cường độ không chắc chắn (uncertainty) của một sự kiện."Khả năng từ bây giờ trời mưa là 30%" là một trong những nhận định mà định lượng cảm giác về khả năng trời mưa. Xác suất luôn luôn được gán cho một trong những từ khoảng chừng (hoặc tỷ lệ tỷ lệ từ 0 mang đến 100%). Con số cao hơn cho thấy kết quả có rất nhiều khả năng hơn con số thấp hơn. 0 cho biết kết quả sẽ không xảy ra. Xác suất 1 cho biết kết quả chắc chắn là sẽ xảy ra.Có 3 phương pháp chủ yếu nhằm gán xác định xác suất cho 1 kết quả, sự kiện, đó là:phương pháp truyền thống (classical method), tần suất tương đối (relative frequency method) và phương pháp chủ quan lại (subjective method).Phương pháp cổ điển để gán xác suất là cân xứng khi tất cả các kết quả đều có chức năng xảy ra như nhau. Nếu có thể xay ra n tác dụng thử nghiệm, từng công dụng thử nghiệm có phần trăm là 1 / n.Phương pháp gia tốc tương đối được sử dụng khi dữ liệu có sẵn để mong tính số lần tác dụng thử nghiệm sẽ xẩy ra nếu thí điểm được lặp đi lặp lại tương đối nhiều lần. Ví dụ, khi ta tung đồng xu đến hàng vạn lần, thì tỷ lệ để đồng xu ở mặt ngửa là 0.5. Dù bí quyết hiểu theo lối tần suất này dễ hiểu, nhưng giảm bớt ở điểm: không hẳn sự khiếu nại nào trong cuộc sống thường ngày cũng rất có thể lặp đi lặp lại (ví dụ, xác suất để A được bầu chọn làm cho Tổng thống).Phương pháp khinh suất là tương thích nhất trong trường đúng theo không thể thực tiễn cho rằng các tác dụng thử nghiệm có công dụng như nhau cùng khi có ít tài liệu liên quan. Khi phương pháp chủ quan tiền được áp dụng để gán tỷ lệ cho công dụng thử nghiệm, ta có thể sử dụng bất kỳ thông tin nào có sẵn, ví dụ như kinh nghiệm hoặc trực quan của mình. Sau khoản thời gian xem xét tất cả các tin tức có sẵn, hướng đẫn một giá trị xác suất thể hiện nay mức độ tin cẩn (degreeof belief) (trên thang điểm từ 0 đến 1) rằng tác dụng thử nghiệm đã xảy ra. Bởi vì xác suất nhà quan miêu tả mức độ ý thức của một người, nó mang tính chất cá nhân. Sử dụng phương pháp chủ quan, những người dân khác nhau hoàn toàn có thể được dự kiến vẫn gán những xác suất khác nhau cho thuộc một kết quả thử nghiệm.Lý thuyết về xác suất giúp ta có thể đưa ra quyết định tốt hơn trong những điều kiện biến động trong cuộc sống.Không gian mẫu mã rời rạc (discreet)bao bao gồm hữu hạn các phần tử và không gian mẫuliên tục (continuous)bao có vô hạn những phần tử. Ví dụ, không gian mẫu về thời tiết là hữu hạn, nhưng không khí mẫu về độ cao của dân số nước ta là liên tục.Ví dụ, không gian mẫu nắng, mưa, âm u có sự kiện nắng, mưa, âm u, nắng, âm u, mưa, âm u, nắng, mưa, nắng, mưa, âm u.+ Phép đo xác suất (Probability measure): thể hiện tỷ lệ của các sự kiện. Phép đo xác suất, tuyệt phân phối xác suất (probability distribution) là một trong những hàm p mà gán một số thực P(A) cho từng sự khiếu nại A. Ta sẽ mày mò kĩ rộng ở mục 0.4. Phương pháp cổ điển, tần suất tương đối và cách thức chủ quan.Biến thốt nhiên của một mô hình xác suất là một hàm lắp 1 cực hiếm số (numeric value) cho 1 giá trị trong không gian mẫu. Ví dụ, gọi X là hàm số giới tính của người dân thành phố A. Không khí mẫu (gần như là tập khẳng định của hàm số) là Nam, Nữ, Khác. Khi đó, ta bao gồm X(Nam) = 2 triệu, X(Nữ) = 2.5 triệu, X(Khá) = 0.3 triệu. Giỏi ta có thể viết, Dân_số_VN(Nam) = 2 triệu; Dân_số_VN(Nữ) = 2.5 triệu. Hoặc theo cách khác, f(x)= Dân_số_VN. F(Nam) = 2 triệu; f(Nữ) = 2.5 triệu.Ví dụ. S = nắng, mưa, âm u. Lắp X là tiết trời trong tuần.

Xem thêm: Tải Đóng Vai Rùa Vàng Kể Lại Truyện An Dương Vương Và Mị Châu, Trọng Thuỷ

X(nắng) = 3; X(mưa) = 2; X(âm u) = 2; X = 3 lúc trời nắng; X = 2 lúc trời mưa, và X = 2 khi trời âm u. Nếu P(mưa) = 0.4; P(nắng) = 0.3; P(âm u) = 0.3. Thi P(X = 3) = P(nắng) = 0.4; P(X=4) = P(mưa) = 0.4; P(X=-1) = P(âm u) = 0.3.Một ví dụ như khác, lật một đồng xu nhị lần và gọi X là số lượng mặt ngửa. Sau đó, phường (X = 0) = p (X X) = 1/4, p. (X = 1) = p. (XN, NX) = 50% và p. (X = 2) = p (HH) = 1/4.Xác suất thống kê lại - kiểm nghiệm giả thuyết (Phần I)Bài viết gửi vày kemmanolic vào mục công nghệ - Công nghệumakarahonpo.comNhắc lại, Phân phối tỷ lệ hay phép đo tỷ lệ của biến bỗng dưng X là việc mô tả phần trăm của những giá trị có thể có của X. Hay hoàn toàn có thể nói, là của hàm số X (với biến hóa số là hiệu quả đầu ra). Một biện pháp định nghĩa khác, phép đo xác suất, giỏi phân phối tỷ lệ là một hàm p mà gán một trong những thực P(A) cho mỗi sự kiện A. Như vậy, phân phối phần trăm là một hàm số, nhưng mà "biến" một quý giá của hàm số X với một giá chỉ trị phần trăm tương ứng nằm trong tầm .Người ta thực hiện hàm phân phối dồn tích (cumulative distribution functions, CDF) để thể hiện phân phối tỷ lệ của phát triển thành ngẫu nhiên.Ngoài ra, bạn ta còn sử dụng hàm xác suất (probability function),đối vớibiến bỗng nhiên rời rạc, thì gọi là probability mass function,đối với biến hóa liên tụchàm tỷ lệ xác suất (probability mật độ trùng lặp từ khóa function). Xác suất này được hình tượng bởi tích phân, có nghĩa là phần diện tích s dưới hàm tỷ lệ xác suất. Vị đó, xác suất để X trên một điểm bất cứ bằng 0, còn xác suất để X thuộc khoảng tầm (a; b) là tích phân của hàm tỷ lệ xác suất từ bỏ a cho tới b.Probability mass function của một biến tự nhiên rời rốc là sự biến đổi của CDF trên một quý giá xác định. Đối với biến liên tục, hàm mật độ xác suất là đạo hàm của hàm CDF. (Đọc thêm tại Applied Statisticsfor Engineering).Đối với biến chuyển ngẫu nhiên, bất kỳ rời rạc tốt liên tục, tín đồ ta quan tâm tới những tham số, như quý hiếm trung bình (mean), hay quý hiếm kì vọng (expected value), phương không đúng (variance) và độ lệch chuẩn chỉnh (standard deviation) của biến bỗng dưng đó. Đồng thời, ta cũng vồ cập tới các dạng phân phối tỷ lệ điển hình, được sử dụng rộng rãi trong Thống kê, như phân phối chuẩn chỉnh (normal distribution), phân phối chi-bình phương (chi-square distribution).Cùng khám phá ví dụ về nghiên cứu sự hiệu quả của công tác ghép tim của Đại học Stanford. Nghiên cứu và phân tích này nhằm kết luận xem liệu lịch trình ghép tim của Đại học Stanford tất cả mang lại hiệu quả như đã dự định không, tức là gia tăng tuổi thọ của bệnh nhân. Nói cách khác, câu hỏi nghiên cứu đưa ra là, liệu một bệnh nhân được ghép tim có sống lâu hơn so với một người mắc bệnh không được ghép tim hay không.Khi suy xét chấp dấn một phương pháp điều trị y tế bắt đầu được khuyến nghị cho một căn bệnh, ta buộc phải xem xét những yêu tố như những cải thiện của phương thức điều trị, bỏ ra phí, cũng như âu sầu sẽ gây ra thêm cho bệnh nhân. Nếu phương thức điều trị mới chỉ tạo thành một cải tiến nhỏ, thì có thể không có mức giá trị trường hợp nó siêu tốn kém hoặc gây thêm nhiều đau khổ cho căn bệnh nhân.Ta không lúc nào có thể biết liệu một dịch nhân đã nhận được trái tim mới tất cả sống vĩnh viễn vì cấy ghép so với vấn đề không tiến hành cấy ghép xuất xắc không. Vị vậy, hi vọng duy tuyệt nhất trong việc xác minh sự tác dụng của cách thức điều trị có hiệu quả là đối chiếu tuổi thọ của người bị bệnh đã được ghép tim mới với tuổi thọ của người mắc bệnh không ghép ghép. Tuổi thọ của một người bị bệnh bị ảnh hưởng bởi những yếu tố, nhiều trong những đó sẽ không còn liên quan liêu gì đến sức mạnh của tim. Ví dụ, mỗi căn bệnh nhân gồm sự sai khác không hề ít về lối sống giỏi mắc các bệnh lý khác, và điều này sẽ có tác động lớn tới việc sai không giống về tuổi thọ giữa các bệnh nhân. Vậy làm thế nào để có thể so sánh, trả lời câu hỏi nghiên cứu vãn đã đặt ra?Một biện pháp tiếp cận vụ việc này là tưởng tượng rằng có phân phối tỷ lệ (probability distribution) diễn đạt tuổi thọ của hai nhóm bệnh nhân. Gọi tỷ lệ fT và fC là phân phối xác suất của 2 nhóm, trong những số đó T biểu lộ cho đội được ghép ghép và C thể hiện cho team không được ghép. Ở đây, cần sử dụng nhãn C cũng chính vì nhóm này được coi là một kiểm soát (control) trong nghiên cứu để mang ra một vài so sánh với câu hỏi điều trị (ghép tim). Sau đó, coi tuổi lâu của một người bị bệnh được ghép ghép như một quan sát bỗng dưng từ fT và tuổi thọ của một người bị bệnh không được cấy ghép như một quan sát ngẫu nhiên từ fC. Vì vậy, ta muốn đối chiếu fT với fC để xác minh liệu ghép ghép có kết quả hay không. Ví dụ, ta hoàn toàn có thể tính và đối chiếu tuổi thọ vừa phải của từng phân phối. Trường hợp tuổi thọ vừa đủ của fT lớn hơn fC, thì rất có thể khẳng định rằng việc điều trị là hiệu quả. Tất nhiên, ta vẫn đã phải đánh giá liệu đổi mới có đủ to để thừa qua chi phí tăng thêm và tăng phần âu sầu của người bị bệnh hay không.Nếu chúng ta cũng có thể có một số lượng lớn những quan giáp tùy ý tự fT cùng fC, thì ta có thể xác định các phân phối này với độ chính xác cao. Mặc dù nhiên, trong thực tế, ta bị tinh giảm với một số lượng quan sát kha khá nhỏ. Ví dụ, trong nghiên cứu và phân tích được trích dẫn tất cả 30 người bị bệnh trong nhóm fan không được cấy ghép với 52 người bị bệnh trong nhóm người đã được ghép ghép.Đối với mỗi người bệnh không được cấy ghép, giá trị của X - số ngày chúng ta còn sinh sống sau ngày họ được xác định là ứng viên mang đến ca ghép tim cho tới khi ngày dứt nghiên cứu - đã được ghi lại. Vì nhiều lý do, những bệnh nhân này đã làm không nhận được trái tim mới, ví dụ, họ đang chết trước lúc một trái tim mới rất có thể được tra cứu thấy mang lại họ. Những dữ liệu này, với một chỉ báo về chứng trạng của người bệnh khi chấm dứt ngày nghiên cứu, được trình diễn trong Bảng 5.1. Giá trị chỉ báo S = a biểu thị rằng người bị bệnh còn sinh sống khi chấm dứt nghiên cứu với S = d biểu lộ rằng người mắc bệnh đã chết.