الوسيط، الأرباع، النسب المئوية، المدى الربيعي واكتشاف القيم الشاذة — دليل شامل

الوسيط، الأرباع، النسب المئوية، المدى الربيعي واكتشاف القيم الشاذة — دليل شامل

الوسيط، الأرباع، النسب المئوية، المدى الربيعي واكتشاف القيم الشاذة — دليل عملي وشامل

موجز: هذا المقال يشرح بمقدمة واضحة ماهية الوسيط، كيفية حساب الأرباع (Q1, Q2, Q3)، معنى النسب المئوية (Percentiles)، كيفية احتساب المدى الربيعي (IQR)، وكيفية استخدامه في كشف القيم الشاذة (outliers). ستجد أمثلة رقمية خطوة-ب-خطوة، وصيغ قابلة للنسخ، وأمثلة برمجية بلغة Python وR.

الوسيط، الأرباع، النسب المئوية، المدى الربيعي واكتشاف القيم الشاذة

مقدمة سريعة

في التحليل الوصفي للبيانات، نريد غالبًا معرفة مركز التوزيع ومقدار تشتت القيم ومكان كل قيمة داخل مجموعة البيانات. من أهم الأدوات التي تساعدنا على ذلك: الوسيط، الأرباع، والنسب المئوية. كما يساعدنا المدى الربيعي (IQR) في قياس تشتت منتصف البيانات واكتشاف القيم الشاذة.

الوسيط (Median)

الوسيط هو القيمة التي تقسم مجموعة البيانات المرتبة إلى نصفين متساويين. نصف القيم تكون ≤ الوسيط والنصف الآخر ≥ الوسيط. الوسيط مقاوم للقيم الشاذة مقارنةً بالمتوسط.

كيفية الحساب (قابل للنسخ)

خطوات إيجاد الوسيط:

  1. رتّب القيم تصاعديًا.
  2. إذا كان عدد القيم n فرديًا، فالوسيط هو القيمة في المركز: (n+1)/2.
  3. إذا كان n زوجيًا، فالوسيط هو متوسط القيمتين في المركزين: n/2 و(n/2)+1.
مثال سريع: البيانات: 1, 11.5, 6, 7.2, 4, 8, 9, 10, 6.8, 8.3, 2, 2, 10, 1 بعد الترتيب: 1,1,2,2,4,6,6.8,7.2,8,8.3,9,10,10,11.5 عدد النقاط = 14 (زوجي) → الوسيط = متوسط القيمة السابعة والثامنة = (6.8 + 7.2)/2 = 7.

الأرباع (Quartiles): Q1, Q2, Q3

الأرباع تقسم البيانات المرتبة إلى أربعة أجزاء متساوية:

  • Q1: الربع الأول — القيمة التي تفصل الـ25% الدنيا عن الباقي.
  • Q2: الربع الثاني — هو الوسيط (الـ50%).
  • Q3: الربع الثالث — القيمة التي تفصل الـ75% الدنيا عن الـ25% العليا.

طرق حساب الأرباع — لماذا توجد طرق مختلفة؟

يوجد أكثر من طريقة لحساب الربع الأول والثالث خاصة عندما لا يقسم عدد النقاط المجموعة بشكل متساوٍ؛ أشهر الطرق:

  • طريقة Tukey (الطريقة الشائعة في boxplot): تقسيم البيانات عند الوسيط إلى نصفين ولا تشمل الوسيط نفسه إذا كان عدد النقاط فرديًا.
  • طريقة الطريقة المتوسطة (Inclusive/Exclusive): بعض الطرق تشمل الوسيط في النصفين، وبعضها لا يشمله.
  • النهج الموحد (Percentile-based): تحديد الربيع كنسبة مئوية (Q1 = 25th percentile, Q3 = 75th percentile) مع طرق تقريبيّة لحساب الموضع.

في الممارسة العملية، الافتراض الأكثر شيوعًا: Q1 هو الـ25th percentile وQ3 هو الـ75th percentile — أي نقاط التوزيع التي تجعل جزءًا من القيم أقل منها.

مثال عملي لحساب Q1 وQ3

نعود لمجموعة البيانات نفسها:

القيم المرتبة:
1, 1, 2, 2, 4, 6, 6.8, 7.2, 8, 8.3, 9, 10, 10, 11.5
    

الوسيط (Q2) = 7. الجزء السفلي (القيم الأقل من الوسيط) = 1,1,2,2,4,6,6.8 → Q1 = وسط هذه المجموعة = 2.

الجزء العلوي = 7.2,8,8.3,9,10,10,11.5 → Q3 = وسط هذه المجموعة = 9.

النسب المئوية (Percentiles)

النسبة المئوية p هي القيمة التي تجعل نسبة p% من القيم أقل منها أو تساويها. على سبيل المثال، إذا كنت في الـ90th percentile فهذا يعني أن 90% من القيم ≤ نتيجتك و10% ≥ نتيجتك.

توضيح عملي على معنى النسبة المئوية

في الامتحانات، أن تكون في الـ90th percentile لا يعني أنك حصلت على 90% من الدرجة بالضرورة، بل أنك تفوق 90% من الطلاب.

المدى الربيعي (Interquartile Range — IQR)

المدى الربيعي هو مقياس لتشتت منتصف البيانات (الوسط 50%). يُحسب كالتالي:

IQR = Q3 − Q1

مثال: في المثال السابق Q3 = 9 وQ1 = 2 → IQR = 9 − 2 = 7.

ما الذي يُظهره IQR عمليًا؟

IQR يُظهر مدى انتشار نصف البيانات الأوسط؛ قيمة صغيرة تعني أن نصف البيانات مركزة حول الوسيط، وقيمة كبيرة تعني تشتت أوسع.

اكتشاف القيم الشاذة (Outliers) باستخدام IQR

القاعدة المتعارف عليها لتحديد القيم الشاذة المحتملة:

  • القيمة تعتبر شاذة إن كانت < Q1 − 1.5 × IQR
  • أو إن كانت > Q3 + 1.5 × IQR

مثال تطبيقي

باستخدام المثال السابق: Q1 = 2, Q3 = 9, IQR = 7

الحد الأدنى المقبول = Q1 − 1.5 × IQR = 2 − 1.5×7 = 2 − 10.5 = −8.5

الحد الأعلى المقبول = Q3 + 1.5 × IQR = 9 + 1.5×7 = 9 + 10.5 = 19.5

بما أن كل القيم في مجموعة المثال تقع بين −8.5 و19.5، فلا قيمة شاذة وفق هذه القاعدة في هذا المثال.

ملاحظة حول القيم الشاذة

القيم الشاذة المحتملة تُستدعى للتحقيق — قد تكون خطأً في الإدخال، قياسًا خاطئًا، أو ظاهرة حقيقية ومهمة (مثل عميل استثنائي أو حدث نادر). لا تحذف القيم الشاذة تلقائيًا دون تحقق.

الرسم الصندوقي (Boxplot) وعلاقته بالأرباع وIQR

الصندوق في boxplot يمتد من Q1 إلى Q3 مع خط عند الوسيط (Q2). "الشواية" (whiskers) تمتد عادة إلى أقرب قيمة تختلف عن القيم الشاذة حسب قاعدة 1.5×IQR، ونقاط منفصلة قد تمثل القيم الشاذة.

لماذا قد نفضل الوسيط أو IQR على المتوسط والانحراف المعياري؟

الوسيط وIQR هما مقاييس مقاومة robust — أي أقل تأثرًا بالقيم الشاذة. المتوسط والانحراف المعياري يتأثران بشدة بوجود قيم شاذة. لذلك في بيانات ذات توزيع مائل (skewed) أو عند وجود قيم متطرفة نستخدم الوسيط وIQR لتوصيف أفضل للمركز والتشتت.

ختلاف طرق حساب النسب المئوية والأرباع في البرمجيات

ملاحظة عملية مهمة: لغات البرمجة وحزم الإحصاء تتبع طرقًا مختلفة في حساب النسب المئوية (مثل R، NumPy، Excel). لذا قد تلاحظ فروقًا بسيطة بين النتائج حسب الأداة. إذا أردت نتائج متطابقة عبر أدوات، تأكد من اختيار نفس طريقة التقريب/التوسيط (interpolation method).

أمثلة تطبيقية (Python وR):

# Python (pandas & numpy)
import numpy as np
data = np.array([1,1,2,2,4,6,6.8,7.2,8,8.3,9,10,10,11.5])
np.median(data)      # الوسيط
np.percentile(data,25) # Q1
np.percentile(data,75) # Q3
IQR = np.percentile(data,75) - np.percentile(data,25)
print("IQR:", IQR)
# R
data <- c(1,1,2,2,4,6,6.8,7.2,8,8.3,9,10,10,11.5)
median(data)         # الوسيط
quantile(data, 0.25) # Q1
quantile(data, 0.75) # Q3
IQR(data)             # IQR مدمج في R

تطبيقات عملية للأرباع والنسب المئوية والـ IQR

تُستخدم هذه المقاييس في تطبيقات كثيرة ومنها:

  • التعليم: تحليل توزيع درجات الطلاب، تحديد الاختيارات بناءً على Percentiles.
  • الاقتصاد: دراسة دخل الأسرة باستخدام النسب المئوية لتحديد الفئات الدنيا والوسطى والعلوية.
  • الصحة: تتبع مقاييس بيومترية كضغط الدم وقياس انتشار الوسط 50% دون تأثر بالقيم القصوى.
  • الأعمال: فهم سلوك العملاء، والكشف عن معاملات استثنائية (مثل مشتريات غير عادية).

إرشادات عملية للمحلل

  1. ابدأ دائمًا بترتيب البيانات وفحص القيم الشاذة بصريًا (boxplot) ورقمياً (1.5×IQR).
  2. استخدم الوسيط وIQR عندما تكون البيانات مائلة أو تحتوي قيمًا متطرفة.
  3. عند المقارنة بين مجموعتين استخدم medians & IQRs إذا كانت التوزيعات غير طبيعية.
  4. توخَّ الحذر في تفسير Percentiles: لا تخلط بينها وبين النسبة المئوية للدرجة (score%).
  5. احفظ طريقة حساب percentiles وquartiles لأن النتائج قد تختلف حسب الدالة/الأداة.

أمثلة محلولة مفصّلة (تمرين وحل)

التمرين: لدينا الدرجات التالية لطلاب مادة: 45, 55, 60, 60, 65, 70, 72, 75, 78, 80, 85, 90. أوجد: الوسيط، Q1، Q3، IQR، واكتشف إذا كانت هناك قيم شاذة.

الحل — خطوة بخطوة:

  1. الترتيب: البيانات مرتبة بالفعل (n = 12).
  2. الوسيط: n زوجي → متوسط القيم 6 و7 → (70 + 72)/2 = 71 → الوسيط = 71.
  3. تقسيم البيانات إلى نصفين: - النصف السفلي: 45,55,60,60,65,70 → Q1 = وسط هذه المجموعة = متوسط 3rd & 4th = (60+60)/2 = 60. - النصف العلوي: 72,75,78,80,85,90 → Q3 = وسط هذه المجموعة = (78+80)/2 = 79.
  4. IQR = Q3 − Q1 = 79 − 60 = 19.
  5. حدود القيم الشاذة: - Lower fence = Q1 − 1.5×IQR = 60 − 1.5×19 = 60 − 28.5 = 31.5 - Upper fence = Q3 + 1.5×IQR = 79 + 28.5 = 107.5 لا توجد قيم أقل من 31.5 أو أعلى من 107.5 → لا شذوذ.

قيود وملاحظات علمية

  • تعريف القيم الشاذة يعتمد على قاعدتي 1.5×IQR و3×IQR للتمييز بين القيم الغريبة والشذوذ الشديد — هذه قواعد إرشادية وليست قوانين مطلقة.
  • في مجموعات صغيرة جدًا قد لا يكون IQR مستقرًا ويجب توخي الحذر.
  • الطريقة المثلى للتحقق من شذوذ هي مزج الفحص العددي (IQR) مع الفحص البصري (boxplot) ومعرفة سياق البيانات.

الخلاصة

الوسيط، الأرباع، والنسب المئوية هي أدوات مركزية في الإحصاء الوصفي لفهم موقع القيم داخل مجموعة البيانات. المدى الربيعي (IQR) هو مقياس قوي لتشتت منتصف البيانات ويعد أداة فعالة لاكتشاف القيم الشاذة المحتملة. عند التعامل مع بيانات مائلة أو تحتوي قيمًا متطرفة، يفضل الاعتماد على الوسيط وIQR بدل المتوسط والانحراف المعياري. لا تنسَ التحقق من طريقة الحساب في الأدوات البرمجية التي تستخدمها لأن النتائج قد تختلف قليلًا حسب طريقة التقريب.

© 2025 ذاكر احصا — دليل إحصائي عملي. للمزيد من الأمثلة أو ملف PDF مُنسق من هذا المقال اطلب وسيتم تجهيز نسخة قابلة للطباعة.

إرسال تعليق

أحدث أقدم
مجلة

Facebook

Random Posts

Recent Comments

Recent Posts

Latest in Tech

Follow Us