دالة الكثافة الإحتمالية - Probability Density Function

 



ذاكر احصا


في هذا الدرس نقدم مفهوما مهما يتعلق بالتوزيعات الإحصائية. وهي دالة كثافة الاحتمال the probability density function " ، و نقدم أيضا مفهوم استخدام المساحة أسفل المنحنى" area under the curve"  كمقياس للاحتمال، ولماذا في التوزيع المستمر يكون احتمال ناتج معين دائما صفرا. قبل أن نتطرق إلى التوزيع الطبيعي Normal Distribution”، نحتاج إلى فهم مفهوم آخروهو دالة كثافة الاحتمال المعروفة أيضا باسم PDF.


سنحاول جعل التفسير بسيطا قدر الإمكان. في الدرس السابق، رأينا الفرق بين البيانات المنفصلة " Discrete Data " والبيانات المستمرة" Continuous Data”.


 قلنا لأنفسنا أيضا أن التوزيع الإحصائي الذي يتعامل مع البيانات المنفصلة يسمى التوزيع المنفصل " Discrete Distribution " والتوزيع الإحصائي الذي يتعامل مع البيانات المستمرة يسمى التوزيع المستمر" Continuous Distribution" .


واحدة من التوزيعات الإحصائية الأكثر شعبية التي لم نقدمها بعد هي التوزيع الطبيعي. وهو ما يحدث بشكل مهم ليكون توزيعا مستمرا. ومع ذلك، كما ذكرنا سابقا ، لا بأس كثيرا في بعض الأحيان في تطبيقات الأعمال لتقريب البيانات المنفصلة حتى مع التوزيع المستمر مثل العادي .


ما هي دالة كثافة الاحتمال؟ إنها قاعدة تعين الاحتمالات لمختلف القيم المحتملة التي تأخذها المتغيرات العشوائية عندما يتم تقريبها بواسطة توزيع إحصائي معين. دعونا نفهمها في سياق البيانات المنفصلة. حيث بدلا من أن يطلق عليها دالة كثافة الاحتمال، يطلق عليها دالة كتلة الاحتمال " Probability Density Function "  أو PMF.

على سبيل المثال ، إذا قمنا برمي عملة معدنية ، فإن الجدول الموضح يعطي احتمالات المرتبطة  بنتيجة الرمية.

نتيجة الرمي

الاحتمال

وجه (Heads)

0.5

ظهر (Tails)

0.5

الاجمالي

1

 

الحصول على الوجه له احتمال 0.5 والحصول على ظهر له احتمال 0.5 وبالتالي إجمالي الاحتمال هو1.  هذا الجدول هو القاعدة التي تحكم احتمال النتائج المختلفة للمتغير العشوائي المرتبط برمي العملة. يمكن تسمية المتغير العشوائية هنا باسم نتيجة الرمي . يعرف هذا الجدول أو القاعدة أيضا باسم دالة كتلة الاحتمال لناتج رمي عملة معدنية.

لاحظ  جانبين مهمين لدالة الكتلة الاحتمالية :

 أولا، الاحتمال المرتبط بأي نتيجة معينة أو تحقيق المتغير العشوائي يكون دائما بين 0 و1.

 ثانيا، والأهم من ذلك، أن مجموع جميع الاحتمالات هو. 1 هذه هي الدالة التي تغطي جميع القيم الممكنة للمتغير العشوائي. من السهل كتابة دالة كتلة الاحتمال لرمي عملة معدنية.


ماذا عن دالة كتلة الاحتمال لعملية أكثر تعقيدا؟ على سبيل المثال، عدد العملاء الذين سيصلون إلى عداد الخروج من محل بقالة في ساعة واحدة، وهنا ما يتم فعله هو أننا نقارب هذه العملية بتوزيع إحصائي ونستخدم دالة كتلة الاحتمال من هذا التوزيع. ستخصص دالة كتلة الاحتمال احتمالات لنتائج محتملة مختلفة. 0 عملاء يصلون إلى عداد الخروج، 1 عميل قادم، 2 عملاء قادمون، 3 ، 4 ، 5 وهلم جرا. لاحظ أن عدد العملاء الذين يصلون إلى مكتب تسجيل المغادرة في ساعة واحدة هو بيانات منفصلة.


هنا لا يمكن أن يكون لديك ، على سبيل المثال  أربعة عملاء ونصف.  سيكون إما 4 أو 5 ، لا شيء بينهما. بالمعنى الدقيق للكلمة، يمكنك استخدام توزيع منفصل لتقريب هذه العملية للعملاء الذين يصلون إلى عداد الخروج. ستخصص دالة الكتلة الاحتمالية للتوزيع المنفصل بعض الاحتمالات ، على سبيل المثال ، وصول 4 عملاء ، وبعض الاحتمالات الأخرى لوصول 5 عملاء وهكذا. سيكون هناك احتمال0 مرتبط بأي رقم بينهم ، على سبيل المثال ، وصول 4 و 5 عملاء. الوضع مشابه جدا عند استخدام التوزيع المستمر. ومع ذلك ، هناك بعض الاختلافات. أولا ، تسمى دالة الكتلة الاحتمالية الآن دالة كثافة الاحتمال أو PDF.


التعريف لا يزال هو نفسه وهي أن PDF أو دالة التوزيع الاحتمالي هي قاعدة تعين الاحتمالات لمختلف القيم المحتملة التي يأخذها المتغير العشوائي.


 الفرق الثاني هو أكثر أهمية وفارق بسيط ، هو أن احتمال نتيجة معينة لمحتوى التوزيع هو دائما صفر. دعونا نتوسع في هذه الفكرة أكثر قليلا. خذ على سبيل المثال ، الارتفاعات المحتملة للرجال والنساء في منطقتك. هذه بيانات مستمرة ، لأنه إذا أخذت أي الارتفاعين ، على سبيل المثال 5و6 ، ثم القيمة المحتملة للارتفاعات التي يمكن أن تحدث بين 6،5 لا حصر لها. إذا سألت بعد ذلك ، فما احتمال أن يكون ارتفاع شخص ما 5.2 ؟ الجواب هو 0 ، لأنه حتى لو كان ارتفاع صديقك 5.2 ، سيكون ردي أنك تحصل على أداة قياس أفضل وستجد أن الارتفاع ليس 5.2، ولكن قل 5.201 يمكن تقديم مثل هذا النوع من الحجة لأي طول تتوصل إليه ، مما يعني أن احتمال وجود ارتفاع معين لشخص ما هو دائما صفر .


هذا هو السبب في أننا ، عند استخدام التوزيع المستمر ، نأخذ في الاعتبار دائما مدى النتائج. على سبيل المثال ، ما هو احتمال أن يكون طول شخص ما بين 5.2 و 5.5 ، احتمال يكون مدى من النتائج. ما احتمال أن يكون ارتفاع شخص ما أقل من 5 أقدام؟ مرة أخرى، مدى من النتائج. ما احتمال أن يكون طول شخص ما أكبر من 5 بوصات؟ وهكذا.


ولكن   ما احتمال أن يكون طول شخص ما 5 بوصات بالضبط؟ إنها منطقة أسفل المنحنى عند النقطة 5 ستكون هذه مساحة خط مستقيم ، وهي ومن هنا جاءت العبارة القائلة بأن احتمال أن يكون ارتفاع شخص ما بالضبط هو 0 أي في التوزيع المستمر ، يكون احتمال أن يأخذ المتغير العشوائي قيم محددة هو دائما  0

إرسال تعليق

أحدث أقدم
مجلة

Facebook

Random Posts

Recent Comments

Recent Posts

Latest in Tech

Follow Us