Phân phối Poisson cho xác suất nhận được sự kiện trong một khoảng cố định khi các sự kiện xảy ra độc lập và tốc độ trung bình gần như không đổi. Nếu bạn biết số cuộc gọi, lỗi, hoặc lượt đến trung bình trong một khoảng, mô hình Poisson giúp bạn tìm xác suất của một số lượng chính xác.
Điều kiện quan trọng nhất là chọn đúng mô hình, không phải biến đổi đại số. Nếu giả thiết độc lập hoặc tốc độ gần như không đổi là không hợp lý, công thức Poisson có thể trông đúng nhưng vẫn trả lời sai câu hỏi.
Công thức phân phối Poisson
Nếu tuân theo phân phối Poisson với tham số , thì với mọi số nguyên không âm ,
Ở đây, là số sự kiện chính xác mà bạn muốn xét, còn là số sự kiện kỳ vọng trong khoảng mà bạn đã chọn.
Với mô hình Poisson, kỳ vọng và phương sai đều bằng :
Điều đó không có nghĩa là mọi bộ dữ liệu thực tế đều có kỳ vọng bằng phương sai. Nó chỉ có nghĩa là mô hình Poisson dự đoán mối quan hệ đó.
có nghĩa gì theo cách dễ hiểu
là số đếm trung bình trong một khoảng cụ thể. Khoảng đó có thể là một giờ, một mét vuông, một trang, hoặc một kilômét, nhưng bạn phải xác định rõ.
Nếu một cửa hàng nhận trung bình cuộc gọi mỗi giờ, thì cho khoảng một giờ. Với khoảng hai giờ, bạn sẽ dùng chỉ khi cùng tốc độ trung bình đó vẫn hợp lý trong suốt hai giờ.
Đây là một trong những cách dễ mắc sai lầm nhất. Khi khoảng thay đổi, thường cũng thay đổi theo.
Ví dụ có lời giải: đúng 2 cuộc gọi trong 1 giờ
Giả sử một cửa hàng nhỏ nhận trung bình cuộc gọi của khách mỗi giờ. Nếu các cuộc gọi đến là khá độc lập với nhau và tốc độ trung bình ổn định, thì xác suất nhận đúng cuộc gọi trong giờ tiếp theo là bao nhiêu?
Ở đây, và , nên:
Rút gọn từng bước:
Dùng ,
Vậy xác suất xấp xỉ , hay . Trong ngữ cảnh này, điều đó có nghĩa là nhận đúng cuộc gọi trong giờ tới là một kết quả khá bình thường, không phải điều hiếm gặp.
Khi nào mô hình Poisson hợp lý
Hãy dùng mô hình Poisson khi tất cả các điều sau đây đều tương đối đúng:
- Bạn đang đếm số lần xảy ra, không phải đo một đại lượng liên tục như thời gian hay chiều cao.
- Số đếm được lấy trên một khoảng cố định như một giờ hoặc một trang.
- Tốc độ trung bình gần như không đổi trong khoảng đó.
- Một sự kiện không trực tiếp làm cho sự kiện khác có khả năng xảy ra cao hơn hoặc thấp hơn nhiều.
Đó là lý do phân phối Poisson xuất hiện trong lý thuyết hàng đợi, độ tin cậy, lưu lượng giao thông, viễn thông và kiểm soát chất lượng. Nó phù hợp nhất với dữ liệu đếm có tốc độ ổn định, không phù hợp với các tình huống có sự gom cụm mạnh hoặc ảnh hưởng rõ rệt theo thời điểm trong ngày.
Những lỗi thường gặp trong bài toán Poisson
Dùng Poisson cho dữ liệu không phải dữ liệu đếm
Phân phối Poisson áp dụng cho . Nó không mô hình hóa các phép đo liên tục như chiều cao, thời gian hoặc nhiệt độ.
Quên đổi lại thang của
Nếu mỗi giờ, điều đó không có nghĩa là mỗi phút. Với nửa giờ, tham số tương ứng sẽ là nếu cùng tốc độ trung bình vẫn đúng.
Nghĩ rằng "sự kiện hiếm" là toàn bộ quy tắc
"Sự kiện hiếm" giúp trực giác dễ hình dung hơn, nhưng đó không phải toàn bộ quy tắc. Câu hỏi thực sự là liệu một khoảng cố định, một tốc độ trung bình gần như không đổi và tính độc lập gần đúng có hợp lý hay không.
Xem kỳ vọng bằng phương sai như một định luật tự nhiên
Với mô hình Poisson, kỳ vọng và phương sai đều bằng . Dữ liệu thực tế không phải lúc nào cũng tuân theo điều đó một cách gọn gàng, nên sự bằng nhau này là tính chất của mô hình, không phải định luật tự nhiên.
Poisson so với nhị thức
Dùng mô hình Poisson khi bạn đếm xem có bao nhiêu sự kiện xảy ra trong một khoảng và bài toán không có sẵn một số phép thử cố định.
Dùng mô hình nhị thức khi bạn đã có một số phép thử cố định, mỗi phép thử có cùng xác suất thành công. Ví dụ, đếm số bóng đèn lỗi trong mẫu gồm bóng được kiểm tra là bài toán nhị thức vì số phép thử được cố định là .
Thử một bài tương tự
Hãy thử phiên bản của riêng bạn với trung bình lần giao hàng mỗi ngày. Tìm xác suất có đúng lần giao hàng vào ngày mai, rồi đổi khoảng sang nửa ngày và xác định điều gì xảy ra với trước khi tính.
Cần trợ giúp giải bài?
Tải câu hỏi lên và nhận lời giải từng bước đã được xác minh trong vài giây.
Mở GPAI Solver →