Trong bài viết này ta sẽ thảo luận về tiệm cận (asymptotics), làm thế nào để miêu tả dáng điệu của thống kê khi kích thước mẫu ngày càng tiến đến vô cùng. Giả định kích thước mẫu và kích thước quần thể là vô cùng, điều này hữu ích cho việc suy diễn thống kê và xấp xĩ.
Notebooks: LoLN and CTL.
Luật số lớn (Law of Large Number: LoLN)
Giả sử là các biến ngẫu nhiên độc lập (independent random variables) được lấy mẫu trên cùng một phân bố (ví dụ phân bố Gaussian). Lúc này, ta nói rằng
là độc lập và đồng nhất phân bố (independent and identical-distributed: i.i.d). Cụ thể,
có cùng giá trị mean
và độ lệch chuẩn
. Đặt
là trung bình của
:
.
Ghi chú: là biến ngẫu nhiên. Luật số lớn và định lý giới hạn trung tâm (Central Limit Theorem: CLT) sẽ cho ta biết giá trị và phân bố của
như thế nào.
- LoLN: khi
tăng, xác suất của
bằng
sẽ tiến đến 1.
- CLT: khi
tăng, phân bố của
sẽ là phân bố chuẩn
.
Định lý giới hạn trung tâm ( Central Limit Theorem: CLT)
Cho biến ngẫu nhiên với mean
và độ lệch chuẩn
, ta chuẩn hoá
theo công thức sau:
.
Khi đó, sẽ có
và
.
Giả sử là các biến ngẫu nhiên i.i.d có cùng
và
. Đặt
là tổng và
là trung bình của
.
.
Ta có các tính chất cho mean và độ lệch chuẩn như sau:
.
Do và
tỉ lệ với nhau nên chúng có cùng dạng chuẩn hoá:
.
CLT phát biểu rằng, khi đủ lớn:
.
Để ứng dụng được CLT ta cần chuẩn bị một vài snippets cho phân phối chuẩn. Đặt là biến ngẫu nhiên có phân phối chuẩn. Ta có:
Suy ra:
Ví dụ, tung đồng xu 100 lần, ước lượng xác suất nhận được nhiều hơn 55 heads. Đặt là kết quả lần tung
, nên
là head,
là tail. Ta có:
.
Khi đó, theo tính chất của CTL ta có:
.
Do , ta có:
.
Nhờ có CTL mà ta có thể ước lượng được giá trị và phân bố của quần thể dựa vào mẫu dữ liệu thu thập được. Vì trong thực tế, phân bố của quần thể khó hoặc không thể quan sát được.