الإحصاء، المتسلسلات الإحصائية، الجدول الإحصائي، الميزة الإحصائية، أنواع البيانات الإحصائية،المنوال، القيمة الوسطية، المعدل الحسابي، التردد، الحصيص، المبيانات الإحصائية، وسيطات الوضع، وسيطات التشتت
يعتبر درس تنظيم ومعالجة البيانات الذي يقدم في المستويات الابتدائية تمهيدا لدرس الإحصاء الذي يتم تقديم مبادئه الأولية منذ السنة الأولى من التعليم الإعدادي، فتمكن المتعلم من حل مسائل عن طريق اختيار واستخدام أسلوب مناسب لمعالجة البيانات، بما في ذاك جمعها وتدوينها في بيانات متصلة أو إنشاء مخططات وأعمدة بيانية ومدرجات وقطاعات دائرية للتعبير عنها أو القيام بعملية عكسية مع التفسير والاستنتاج والتنبؤ... كل هذه المهارات والمكتسبات تساعد المتعلم في بناء تعلماته الخاصة بدرس الإحصاء الذي يتلقاه لأول مرة بالمستوى الأول من التعليم الثانوي الإعدادي..
وكنا قد تطرقنا في مقال سابق إلى درس تنظيم ومعالجة البيانات تحدثنا فيه عن المهارات التي من الواجب أن يكتسبها المتعلم والتي تساعده ليس فقط في الرياضيات وإنما في مواد دراسية أخرى وفي مجالات أخرى خارجية يمكن الرجوع إلى هذا الدرس بالنقر على الرابط من هنا.
وفي مقال اليوم سنتحدث عن درس الإحصاء في الرياضيات، باعتباره تمديدا لدرس تنظيم ومعالجة البيانات، كما أشرنا إلى ذلك، سنتطرق فيه إلى معلومات جديدة، ومهارات إضافية تساعد على اكتساب وبناء تعلمات جديدة يمكن توظيفها في مجالات أخرى.
وسنقوم بذلك عبر جزأين أساسيين:
-الأول (الجزء النظري): سنخصصه للحديث عن الإحصاء نظريا، سنتحدث فيه عن تعريف للإحصاء، تاريخه، الغرض منه واستعمالاته في الحياة اليومية.
- الثاني (الجزء التطبيقي): سنخصصه لتطبيقات الإحصاء والعمليات التي تمر منها عملية الإحصاء والمفاهيم والمهارات المرتبطة بها، من خلال أمثلة وتداريب متنوعة.
✹✹✹✹✹✹
الجزء الأول: الجزء النظري
👈الإحصاء (بالإنجليزية: Statistics) هو أحد فروع الرياضيات الهامة ذات التطبيقات الواسعة. وهو علم يهتمّ بجمع البيانات، ومن ثم تنظيمها، وترتيبها، وتحليلها، بهدف الوصول إلى نتائج معينة لتوضيح ظاهرة أو حالة ما ووضع استنتاجات تساعد في إيجاد حلول لمشاكل مختلفة في شتى المجالات: في العلوم الطبية، علم الاجتماع، الاقتصاد، الصناعة، الكيمياء، الرياضة، الإدارة، وغيرها...
👈 تاريخيا، مفهوم الإحصاء ليس وليد اليوم، منذ القديم اعتمدت عدة حضارات عمليات إحصائية في عدة مجالات كإحصاء الأراضي، وإحصاء السكان، وإحصاء مصادر العيش... وكان أول كتاب تحدث عن الإحصاء يرجع إلى الباحث العربي الكندي (801-873) قدم فيه وصفًا تفصيليًا لكيفية استخدام الإحصائيات وتحليل التردد لفك تشفير الرسائل المشفرة. وفي أواخر القرن التاسع عشر وأوائل القرن العشرين، ظهر مجال الإحصاء الحديث، وكانت الموجة الأولى في مطلع القرن حيث تم تحويل الإحصاء إلى نظام رياضي صارم يستخدم في التحليل، ليس فقط في العلوم، وإنما أيضا في الصناعة والسياسة. (للمزيد من المعلومات حول تاريخ الإحصاء يمكن الرجوع إلى الموقع wikipedia عبر الرابط من هنا)
وفي عصرنا الحالي، ولكي يتمكن الإنسان من إعداد مخططات مستقبلية لتحسين ظروف عيشه، أصبح من الضروري القيام بعملية الإحصاء وتحليل البيانات واستخدام النتائج في التنبؤات الممكنة واتخاد القرارات بناء على ذلك، وكمثال على ذلك:
إحصاء السكان الذي تقوم به كثير من الدول بعد كل 10 سنوات، كان الهدف منه هو الحصول على معلومات مفصّلة متعلّقة بالسكان، وتسجيلها بصورة منطقيّة ومنهجية تساعد في اتخاذ قرارات وتنبؤات مستقبليّة، وزيادة التخطيط للتنمية الاقتصاديّة والاجتماعيّة للدولة من جهة كما تساهم في تحديد حجم المشكلات الاقتصادية والاجتماعية، وتحديد المصادر المتوفرة لحل هذه المشكلات من جهة أخرى.
👈 وينقسم علم الإحصاء إلى قسمين:
- علم الإحصاء الوصفي: الذي يهتم بجمع البيانات الإحصائية وتحليلها وتفسيرها وتمثيلها باستخدام الخرائط، أو الجداول الإحصائية، أو الرسومات والمنحنيات البيانية التي توضّح الظواهر بشكل أفضل من أي أسلوب آخر. وهذا النوع هو ما نحن بصدده في مقال اليوم وما نقوم بتعليمه في المدراس.
- علم الإحصاء الاستدلالي، ويسمى أيضا علم الإحصاء التحليلي الذي يهتم بوضع القرارات المبنية على النتائج المستخرجة من البيانات التي جمعت بعد تحليلها وتفسيرها وذلك بناء على عدة أساليب منها التقدير واختبار الفرضيات..
👈 وللقيام بعملية الإحصاء من الضروري المرور عبر مجموعة من المراحل وهي:
- جمع البيانات: وهي قيم يتم جمعها من خلال مصادر معينة أو ملاحظات أو القيام بطرح أسئلة أو إجراء استفتاء ... ويتم ذلك باستخدام طريقتين:
← طريقة المسح الشامل (Enquête exhaustive): يتم إجراء مسح شامل إذا تم جمع معلومات حول جميع عناصر ما يسمى بالمجتمع الإحصائي، نعني به الفئة (أشخاص أو أشياء) التي نريد جمع البيانات المتعلقة بها (سنتطرق إلى هذه المفردة في الفقرات الموالية)، كما هو الحال عند إحصاء عدد المواليد في مدينة ما خلال فترة معينة. هذه العملية دقيقة للغاية وبسيطة وآمنة.
←طريقة العَيِّنة أو المسح الجزئي (L’ enquête partielle): نقوم بها عندما تكون عناصر المجتمع الإحصائي كبيرة جدا، مثل الأسماك في البحر أو النجوم في الفضاء الخارجي... في هذه الحالة ندرس مجموعة فرعية من هذه العناصر، تسمى "العينة"، لأسباب تتعلق باختصار الوقت والجهد وتخفيض الكلفة... وبذلك نستطيع استخلاص خواص المجتمع الأصلي الذي أخذت منه هذه العينية، لكن تبقى هذه العملية أقل دقة لما يصاحبها من أخطاء يطلق عليها: أخطاء الصدفة وأخطاء التحيز. كما توجد طرق خاصة لاختيار العينة من المجتمع الإحصائي وآليات خاصة لحساب نسبة الخطأ المسموح به وحجم العينة وغير ذلك... (للمزيد من المعلومات يمكن الرجوع إلى كتاب «مبادئ الإحصاء» لمؤلفه طه حسين الزبيدي بالنقر على الرابط من هنا)
- تنظيم وعرض البيانات: بعد جمع البيانات يتم تنظيمها في جداول مناسبة أو عرضها في رسوم بيانية أو أشكال هندسية...
- تحليل البيانات: معالجة البيانات واستخراج قيم ومقارنات...
- استقراء النتائج واتخاد القرارات: إصدار أحكام ووضع استنتاجات حول المجتمع الإحصائي في ضوء النتائج المتوصل إليها.
👈 ومن أساليب جمع البيانات:
- الأسلوب المباشر: بطريقة مباشرة كما يحدث بالنسبة للإحصاء السكاني.
- الأسلوب غير المباشر: عن طريق البحث في السجلات أو المراجع أو الوثائق
- أسلوب الاستبيان: عبارة عن صفحات ورقية أو مواقع اليكترونية تحتوي على مجموعة من الأسئلة تعبأ من طرف الشخص الخاضع للبحث.
- أسلوب المقابلات الشخصية: أي طرح أسئلة مباشرة.
- أسلوب الاختبارات الخاصة: وهو أسلوب خاص يتم اعتماده في حالات محدودة مثل اختبارات الذكاء عند مجموعة من الأطفال.
👈أما فيما يخص نوع البيانات والتي سنطلق عليها فيما بعد باسم الميزة الإحصائية، فيمكن أن تكون:
- بيانات صفات نوعية أي لا يمكن قياسها مباشرة بأرقام عددية، مثل الحالة الاجتماعية (غني، متوسط الحال، فقير)
- بيانات كمية أي يمكن قياسها بأرقام عددية مثل الطول، الوزن، عدد الأشخاص ...
✹✹✹✹✹✹
الجزء الثاني: الجزء التطبيقي
أولا: مصطلحات إحصائية
👈سنتعرف أولا على بعض المصطلحات التي لها علاقة بالإحصاء:
✪ المجتمع الإحصائي (بالفرنسية Population statistique وبالإنجليزية Statistical population، ويسمى أيضا الساكنة الإحصائية)، ونقصد به مجموعة الأشخاص أو الأشياء التي نريد إنجاز دراسة حولها والتي تهم الباحث. أمثلة:
✪ الوحدة الإحصائية: (بالفرنسية Individu statistique وبالإنجليزية Statistical unit) نقصد بها كل مكون من مكونات المجتمع الإحصائي، لنأخذ الأمثلة السابقة:
✪ الميزة الإحصائية: (بالفرنسية Caractère statistique) ويسمى أيضا المتغير الإحصائي (بالإنجليزية Statistical variable) هي الخاصية التي يمكن ملاحظتها أو قياسها على كل الوحدات الإحصائية، وبتعبير آخر الميزة الإحصائية هي الظاهرة موضوع الدراسة وهي إما أن تكون كمية أو كيفية:
← كمية (quantitative): هي التي يمكن ترجمتها بواسطة قياسات أو أعداد وتنقسم بدورها إلى قسمين:• متغيرات كمية منفصلة (أو متقطعة)( variable discrète)، وهي التي يمكن تعدادها ولا يمكن تجزئتها ، مثل عدد السكان، مقادير الأشياء: عدد القصص، عدد الأشجار ...
• متغيرات كمية مستمرة (أو متصلة)( variable continue)، وهي التي يمكن قياسها ولا يمكن تعدادها وتأخذ كل القيم الممكنة لمجال الدراسة، مثل: القامة، السن، الوزن ...فعند جرد البيانات الخاصة بالوزن مثلا لمجموعة من الأطفال، سنجدها كثيرة ومتقاربة أو أحيانا متساوية لتمثيلها نحتاج إلى جدول متعدد الخانات لذا نقوم بعرضها داخل مجالات كما يوضح المثال الثاني ضمن الأمثلة السابقة.
←كيفية (qualitative): هي التي لا يمكن التعبير عنها بأعداد ولا يمكن قياسها كميا، تأخذ فقط أوصافا أو أشياء وتنقسم بدورها إلى قسمسن:
• متغيرات كيفية قابلة للترتيب(Variable qualitative ordinale)، وهي التي يمكن ترتيبها ولها معنى عند ترتيبها (تصاعديا أو تنازليا) ، مثل علامات الطلاب ( ضعيف، متوسط، حسن ، جيد ممتاز)
• متغيرات كيفية غير قابلة للترتيب(Variable qualitative nominale)، وهي التي لا يمكن ترتيبها وليس لها أي معنى عند ترتيبها، مثل الأجهزة المنزلية (ثلاجة، تلفاز، فرن...)
✪ المتسلسلة الإحصائية: (بالفرنسية Série statistique وبالإنجليزية Statistical series) نقصد بها النتائج التي تم الحصول عليها بعد إجراء عملية الإحصاء. يمكن لمتسلسلة إحصائية أن تكون غير منظمة ويمكن أن تكون منظمة وتُقدم في جدول كما يمكن أن تمثل في رسومات بيانية.
✪ الجدول الإحصائي: ويسمى أيضا جدول الحصيص (Tableau des effectifs). وهو الجدول التي يتم فيه تنظيم البيانات المحصل عليها بعد إجراء الإحصاء، ويتكون من ثلاث سطور:
← السطر الأول: نضع فيه قيم الميزات الإحصائية (كمية كانت أو كيفية) ونرمز لها بالحرف xi
←السطر الثاني: نضع فيه الحصيص: (بالفرنسية Effectif وبالإنجليزية frequency) هو عدد الوحدات الإحصائية التي لها نفس قيمة الميزة الإحصائية. وبتعبير آخر عدد مرات تكرار كل قيمة من قيم الميزات الإحصائية. ونرمز له بالحرف ni
←السطر الثالث: نضع فيه الحصيص المتراكم (بالفرنسية Effectif cumulé وبالإنجليزية cumulative frequency) والحصيص المتراكم لقيمة ميزة إحصائية هو مجموع حصيص هذه القيم وحصيصات القيم التي تسبقها. ونرمز لها بالحرف Ni
👈لنأخذ الأمثلة السابقة، بالنسبة للمثال الأول:
👈 وبالنسبة للمثال الثالث 👈 وهذا النوع من الحصيص المتراكم يسمى الحصيص المتراكم التصاعدي(effectifs cumulés croissants) لأننا بدأنا من القيمة الأولى، أما إذا بدأنا من القيمة الأخيرة فإننا سنحصل على الحصيص المتراكم التنازلي(effectifs cumulés décroissants)✪ الحصيص الإجمالي: (بالفرنسية Effectif total وبلإنجليزية Total of Frequency) هو مجموع الوحدات الإحصائية المكونة للمجتمع الإحصائي، وبصيغة أخرى هو مجموع الحصيصات. ونرمز له بالحرف N.
👈 لنأخذ المثالين السابقين بالنسبة للمثال الأول:
👈 وبالنسبة للمثال الثالث✪ الصنف الإحصائي: (Classe statistique) هي المجالات التي تُجمًّع فيه قيم الميزة الإحصائية، هذه المجالات لها نفس السعة (Amplitude)، ونمز له بالشكل التالي: [a ; b [، حيث a و b طرفي هذا الصنف و b لا ينتمي إلى هذا الصنف. كما يوضح المثال الثاني من الأمثلة السابقة:
ملاحظات:👈 يتم اللجوء إلى الصنف الإحصائي في حالة ما إذا كان عدد القيم الميزة الإحصائية كبيرا جدا.
👈 يمكن إضافة سطر آخر إلى الجدول الإحصائي الخاص بالأصناف، نضع فيه مركز كل صنف (Centre de classe ) ويساوي مجموع طرفي المجال مقسوم على 2.
✪ التردد: ( بالفرنسية Fréquence)، تردد قيمة من قيم الميزة الإحصائية هو خارج قسمة حصيصها على الحصيص لإجمالي، والتردد النسبي (Fréquence relative) هو النسبة المئوية التي يمثله التردد، أي نضرب التردد في 100 ونكتب النتيجة بإضافة الرمز (%). لنأخذ الأمثلة السابقة، بالنسبة للمثال 1
👈وبالنسبة للمثال الثاني 👈وبالنسبة للمثال الثالث✪ التردد المتراكم (fréquence cumulée) نقوم بحسابه كما قمنا بحساب الحصيص المتراكم، أي أننا نقوم بإضافة التردد إلى مجموع الترددات السابقة له. وبنفس الطريقة بالنسبة للتردد النسبي المتراكم، وفي الأخير نحصل على 1 بالنسبة للتردد المتراكم والنسبة 100%بالنسبة للتردد المتراكم النسبي. لنأخذ المثال الأول:
✪ المبيانات الإحصائية (Les diagrammes statistiques): إذا كانت الجداول الإحصائية تزودنا بمعطيات عددية مضبوطة فإن ترجمة هذه الجداول إلى رسوم بيانية تمكننا من قراءة سريعة وتعطينا فكرة عامة حول الظاهرة المدروسة. وسنتطرق في فقرة خاصة موالية إلى أنواع الرسوم البيانية.
------------------------------------------------
ثانيا: وسيطات الوضع
👈بعد أن تعرفنا على بعض المصطلحات الخاصة بالمفهوم الإحصاء، سننتقل الآن إلى التعرف على قواعد حساب وتحديد وسيطات الوضع (Paramètres de postions) في متسلسلة إحصائية،
ووسيطات الوضع نقصد بها القيم التي تميز موقع المتسلسلة الإحصائية وهي: المنوال والقيمة الوسطية والمعدل الحسابي(وتجدر الإشارة أن هذه القواعد ليس لها معنى في المتسلسلة الإحصائية الكيفية أي التي لا يمكن التعبير عنها بالقياسات أو الأعداد مثل الجنس، المنتوج، نوع الأشجار...)
✽✽المنوال (Mode)
منوال متسلسلة إحصائية هو كل قيمة أو صنف للميزة التي لها أكبر حصيص. لنأخذ الأمثلة السابقة
👈بالنسبة للمثال الأول:
👈بالنسبة للمثال الثاني: 👈بالنسبة للمثال الثالث: (هنا لدينا متسلسلة إحصائية كيفية لكن يمكن معرفة المنوال في هذه المتسلسلة) ملاحظات:↤الهدف من المنوال هو معرفة قيمة الميزة الإحصائية التي لها أكبر حصيص ضمن مجموعة القيم، ويمكن توظيفه في بعض الحالات مثل معرفة المترشح الفائز في انتخابات معينة. ويبدو ذلك أوضح في الرسوم البيانية، كما هو الحال في المثال الثالث، يبدو أن العمود الذي يمثل عدد مبيعات التلفاز هو الأكبر.
↤ يمكن للمتسلسلة الإحصائية أن تقبل منوالين أو أكثر، إذ تضمنت منوالا واحدا تسمى متسلسلة إحصائية أحادية المنوال (unimodale)، وإذا تضمنت منوالين تسمى متسلسلة إحصائية ثنائية المنوال (bimodale)، وإذا تضمنت أكثر من منوال تسمى متسلسلة إحصائية متعددة المنوال (plurimodale).↤ عندما يتعلق الأمر بالأصناف، فإننا نتحدث عن الصنف المنوال (La classe modale) (انظر المثال الثاني)
✽✽القيمة الوسطية لمتسلسلة إحصائية (بالفرنسية La médiane وبالإنجليزية Median)
هي قيمة الميزة التي تقسم هذه المتسلسلة إلى جزأين لهما نفس الحصيص، وبتعبير آخر هي القيمة التي تقسم المتسلسلة الإحصائية إلى جزأين أحدهما يحتوي على جميع القيم التي هي أكبر من أو تساوي هذه القيمة والآخر يحتوي على جميع القيم التي هي أصغر من أو تساوي هذه القيمة.
👈كيفية حساب القيمة الوسطية لمتسلسلة إحصائية:
← في متسلسلة إحصائية غير منظمة (سنضيف هنا أمثلة توضيحية أخرى: مثال 4 و5 و6)
◀نقوم بترتيب القيم ترتيبا تزايديا أو تناقصيا ( لا يمكن معرفة القيمة الوسطية إذا لم نقم بترتيب القيم)
◀نحدد الحصيص الإجمالي N: (يعني مجموع القيم)
◀في حالة N عدد فردي، نطبق العلاقة : 2÷(1+N)، وفي هذه الحالة توجد قيمة في الوسط وهي التي توجد في الصف الذي يوافق هذا العدد الذي حصلنا عليه. مثال:
◀في حالة N عدد زوجي، نحسب 2÷N و 1+(2÷N) وأي قيمة محصورة بين القيمتين اللتان تمثلان رتبة العددين المحصل عليها تعتبر قيمة وسطية، وغالبا ما نختار معدل القيمتين. وفي حالة ما إذا كانت رتبتا العددين تشيران إلى نفس القيمة فإن القيمة الوسطية هنا هي إحدى هاتين القيمتين.← في متسلسلة إحصائية منظمة في جدول إحصائي معطى بقيم. (كما هو الشأن بالنسبة للمثال الأول)
◀ نحدد الحصيص المتراكم والحصيص الإجمالي N: (يعني مجموع القيم)
◀ نحسب 2÷N ونحدد أصغر حصيص متراكم أكبر من أو يساوي 2÷N ثم نحدد القيمة الموافقة لهذا الحصيص.
◀ هذه القيمة هي القيمة الوسطية لهذه المتسلسلة الإحصائية
مثال:
← متسلسلة إحصائية منظمة في جدول إحصائي معطى بأصناف (كما هو الشأن بالنسبة للمثال الثاني)
👈هنا إذا طلب منا تحديد الصنف الذي توجد فيه القيمة الوسطية نطبق ما يلي: (في هذه الحالة نحسب الصنف الوسطي)
◀ نحدد الحصيص المتراكم والحصيص الإجمالي N
◀ نحسب 2÷N ونحدد أصغر حصيص متراكم أكبر من أو يساوي 2÷N (أي الحصيص المتراكم الأكبر والذي يأتي مباشرة بعد 2÷N أو الذي يساويه) ثم نحدد الصنف الموافق لهذا الحصيص.
◀ القيمة الوسطية توجد داخل هذا الصنف وهذا الصنف هو الصنف الوسطي.
لنأخذ المثال الثاني
👈 أما إذا طلب منا تحديد القيمة الوسطية بالضبط نطبق ما يلي:◀ نحدد أولا الصنف الوسطي (الطريقة السابقة) ثم نطبق العلاقة التالية:
نعود مرة أخرى إلى المثال الثاني:
✽✽المعدل الحسابي لمتسلسلة إحصائية (بالفرنسية Moyenne arithmétique وبالإنجليزية Arithmetic mean)
👈وتسمى أيضا القيمة المتوسطة أو المتوسط الحسابي وهو خارج قسمة مجموع القيم الملاحظة على عدد القيم، وبتعبير آخر هو خارج مجموع جداءات قيم الميزة (أو مراكز الأصناف) في الحصيصات الموافق لها على الحصيص الإجمالي، ويرمز له بالحرف m.
وبالتعبير الرياضياتي:
👈 طريقة حساب المعدل الحسابي :
← متسلسلة إحصائية غير منظمة (سنعود إلى المثال الرابع السابق)
◀ نقوم بقسمة مجموع القيم على عدد القيم:
← متسلسلة إحصائية منظمة في جدول إحصائي معطى بقيم (سنعود إلى المثال الأول):
نقوم بما يلي:
◀ تحديد الحصيص الإجمالي
◀ ضرب كل قيمة في الحصيص المقابل لها
◀ جمع الجداءات المحصل عليها
◀ قسمة النتيجة المحصل عليها على الحصيص الإجمالي
← متسلسلة إحصائية منظمة في جدول إحصائي معطى بأصناف (كما هو الشأن بالنسبة للمثال الثاني)
◀ نحدد الحصيص الإجمالي
◀ نحدد مركز كل صنف: (الطرف الأول + الطرف الثاني) مقسوم على 2
◀ نضرب كل مركز في الحصيص المقابل معه.
◀ نجمع الجداءات المحصل عليها
◀ نقسم النتيجة على الحصيص الإجمالي.
ملاحظات:
👈 يمكن أيضا حساب المعدل الحسابي لمتسلسلة إحصائية انطلاقا من الترددات:
لنأخذ المثال الأول:👈 يجب التمييز بين القيمة والمتوسطة والقيمة الوسطية التي هي المعدل الحسابي، فالأولى تحدد القيمة التي توجد وسط المتسلسلة الإحصائية، تتغير بتغير عدد القيم ولا تتغير بتغير القيم، والثانية تتغير بتغير القيم وعدد القيم:
--------------------------------
ثالثا: وسيطات التشتت
👈تعرفنا على وسيطات الوضع لكن هذه الوسيطات تبقى غير كافية لكونها أولا تمثل سلسلة إحصائية بعنصر واحد، وثانيا لكونها تعبر عن متسلسلة إحصائية واحدة مستقلة أي لا تتيح لنا إمكانية مقارنة متسلسلات إحصائية عن نفس الظاهرة ، لذا فمن الضروري تحديد بعض القياسات الاحصائية الإضافية لتمثيل الخصائص بشكل كاف، من بين هذه القياسات قياسات التشتت أو ما يعرف بوسيطات التشتت (Paramètres de dispersions) ونقصد بها الحد الذي من المحتمل أن تختلف فيها قيم الميزات الإحصائية مع المعدل الحسابي للمتسلسلة الإحصائية، أي أن وسيطات التشتت لها علاقة بالمعدل الحسابي للمتسلسلة الإحصائية. فماذا نقصد بالتشتت، وما هي وسيطات التشتت لمتسلسلة إحصائية؟
👈 نقول إن متسلسلة إحصائية أقل تشتتا (من متسلسلة إحصائية أخرى) إذا كانت قيم ميزتها الإحصائية قريبة من المعدل الحسابي لهذه المتسلسلة. مثال:
👈 تلاحظون أنه لقياس تشتت متسلسلة إحصائية نقوم بحساب القيمة المطلقة|xi-m| للفرق بين كل قيمة والمعدل الحسابي للمتسلسلة. هذا الفرق يسمى بالانحراف.
👈وسيطات التشتت لمتسلسلة إحصائية:
❉❉المدى (بالفرنسية L’étendue وبالإنجليزية Range):
هو أبسط أنواع مقاييس التشتت ويمكن حسابه على الشكل التالي:
← بالنسبة لمتسلسلة إحصائية معطاة بقيم (نموذج المثال الأول)
◀ نحسب الفرق بين أكبر قيمة وأصغ قيمة
← بالنسبة لمتسلسلة إحصائية معطاة بأصناف (نموذج المثال الثاني)◀ نحدد أولا مراكز كل صنف، ثم نحسب الفرق بين أكبر مركز وأصغر مركز
❉❉الانحراف المتوسط (بالفرنسية L’ écart moyen وبالإنجليزية Mean Deviation)
هو عبارة عن معدل انحرافات قيم المتسلسلة عن معدلها الحسابي، وبصيغة أخرى معدل القيمة المطلقة للفرق بين كل قيمة من قيم الميزات الإحصائية والمعدل الحسابي للمتسلسلة، ويمكن حسابه بتطبيق للعلاقة التالية:
نطبق هذه العلاقة في المثال الأول:
👈 يساعدنا الانحراف المتوسط في مقارنة متسلسلتين إحصائيتين أو أكثر فيما يخص معيار التشتت، فإذا كان الانحراف المتوسط صغيرا فإن تشتت المتسلسلة الإحصائية يكون أقل والعكس صحيح.
❉❉المغايرة (بالفرنسية La variance وبالإنجليزية Variance)
نرمز له بالحرف V وهو مجموع جداءات مربع انحراف كل قيمة في الحصيص المقابل لهذه القيمة مقسوم على الحصيص الإجمالي، وبصيغة الرياضيات:
نطبق هذه العلاقة في المثال الأول:👈 المغايرة هو معيار آخر يعتمد عليه لمقارنة مدى تشتت المتسلسلة الإحصائية، كلما ارتفعت قيمته إلا وارتفع تشتت المتسلسلة، أما إذا يساوي 0 فإن المتسلسلة غير مشتتة وجميع قيمها تساوي المعدل الحسابي.
❉❉الانحراف الطرازي (بالفرنسية L’écart type وبالإنجليزية Standard Deviation)
ويسمى أيضا الانحراف المعياري،نرمز له بالحرف σ ويساوي جدر مربع المغايرة
👈يعتبر الانحراف الطرازي معيارا آخر لمقارنة المتسلسلات الإحصائية، بفضله يتم تحديد مدى تشتت المتسلسلات داخل مجالات محددة كما يمكننا من فهم أكثر للمتسلسلة الإحصائية من خلال معرفة المجالات التي تتمركز فيها القيم أكثر من الأخرى.
👈هذا كل ما يخص وسيطات التشتت، لكن توجد مقاييس أخرى يمكنكم الاطلاع عليها من خلال الرابط هنا باللغة الإنجليزية أو من خلال هذا الرابط باللغة الفرنسية أو من خلال تحميل هذا الكتاب من هنا باللغة العربية.
👈 كما لوحظ بعد الاطلاع على هذه المراجع وأخرى التباين وغياب التجانس بين القواعد الإحصائية من مرجع إلى آخر، لا ندري السبب في ذلك؟؟
-----------------------------------
رابعا: الرسوم البيانية
👈سنتطرق في هذه الفقرة إلى أنواع الرسوم البيانية المستعملة في الإحصاء، أما في ما يخص طريقة تمثيل البيانات على رسوم بيانية فيمكنكم الرجوع إلى درس تنظيم ومعالجة البيانات لأخد فكرة عن طريقة التمثيل ( يمكن الرجوع إلى الدرس بالنقر هنا)
👈 توجد أنواع كثيرة من الرسوم البيانية نذكر منها:
✺✺الرسم البياني بالأعمدة أو بالأشرطة (العمودية أو الأفقية)( Le diagramme à bandes horizontales ou verticales)
↤ يستعمل هذا النوع لتمثيل البيانات الكيفية وأيضا البيانات الكمية المنفصلة (راجع تعريف الميزة الإحصائية)،
↤ وهذه بعض خصائص ومميزات الرسوم البيانية بالأعمدة:
◀ على المحور الأفقي ( محور الأفاصيل) نمثل القيم وفق وحدة اعتباطية وبشكل ترتيبي في حالة البيانات الكمية وفي حالة البيانات الكيفية القابلة للترتيب أما إذا كانت غير قابلة للترتيب فيمكن وضعها عشوائيا.
◀ على المحور العمودي (محو الأراتيب) نمثل الحصيصات وفق وحدة اعتباطية موحدة وبالترتيب.
◀ يتم رسم عمود أو شريط يدل كل واحد منها على عدد الحصيصات الخاص بكل قيمة.(كلما كان عدد الحصيص كبيرا كلما كان طول الشريط كبيرا)
◀ يجب أن تكون المسافة بين كل شريطين متساوية ويجب أن يكون عرض الأشرطة موحدا.
◀ وضع عنوان مناسب للرسم البياني وتسميات كل محور.
◀ يمكن تمثيل الأشرطة بشكل عمودي أو أفقي. كما يمكن استعمال العصي بدل الأشرطة. (رسم بياني عصوي)
👈 النموذج الأول يوضح المواد الدراسية المفضلة لدى مجموعة من المتعلمين، البيانات هنا بيانات كيفية غير قابلة للترتيب، أي يمكن البدء بأي مادة تريد ولا مشكلة في ذلك، عكس النموذج الثالث الذي بدوره يمثل بيانات كيفية لكنها قابلة للترتيب، هنا لتمثيلها يجب البدء بكتابة العبارات التي تدل على القيمة الدنيا ( ضعيف ←متوسط← لا بأس به← جيد← ممتاز). أما النموذج الثاني يوضح بيانات كمية منفصلة هي عدد الأطفال لدى مجموعة من الأسر.✺✺ الرسم البياني بخط منكسر (Le diagramme à ligne brisée)
↤ يستعمل هذا النوع لتمثيل البيانات الكمية (المنفصلة أو المستمرة) التي تتطور وتتغير مع الزمن.
↤ هذا الرسم البياني له تقريبا نفس الخصائص والمميزات السابقة، إلا أن في هذا الرسم البياني:
◀ على المحور الأفقي نمثل الشريط الزمني وفق وحدة معينة، وعلى المحور العمودي نضع تلك العناصر التي تغير مع الزمن وفق وحدة معينة أيضا.
◀ هنا بدل الأشرطة نرسم النقط التي تحدد تغير كل عنصر حسب الزمن، وفي الأخير نربط بينها فنحصل على خط يدعى خط منكسر.
◀ لا يجب أن ننسى كتابة العنوان وتسمية كل محور، وأيضا المفتاح في حالة وجود أكثر من خط منكسر واحد.
✺✺القطاع الدائري (Le diagramme circulaire)
↤ يستعمل القطاع الدائري لتمثيل البيانات الكيفية، وهو نوعان قطاع دائري وقطاع نصف دائري، ويتميز بما يلي: (يمكن الرجوع إلى درس سابق تحدثنا فيه عن طريقة تمثيل البيانات باستعمال القطاع الدائري أو نصف الدائري بالنقر هنا)
◀ كل مساحة داخل القطاع الدائري لها علاقة مع قيم الميزات الإحصائية.
◀ غالبا ما تقدم هذه البيانات بالنسب المئوية (حساب الترددات والترددات النسبية)
◀ كل زاوية مركزية في القطاع الدائري متناسبة مع الحصيصات أو الترددات.
◀ نعلم أن مجموع الترددات هو 1 ومجموع الترددات النسبية (النسبة المئوية) هو 100 ، وأيضا مجموع قياسات الزوايا المركزية في القطاع الدائري يساوي °360 بالنسبة للقطاع الدائرة و°180 بالنسبة للقطاع نصف الدائري.
◀ يجب عدم نسيان كتابة عنوان مناسب ومفتاح لبيان ما يدل عليه كل لون من الألوان المستعملة في الرسم.
✺✺الرسم البياني ذات الأشرطة المتصلة (L’histogramme)
↤ الفرق بينه وبين الرسم البياني الأول هو أن الشرطة في هذا الرسم متصلة وفي هذا الرسم تكون منفصلة، ونستعمل هذا النوع من الرسوم البيانية لتمثيل البيانات الكمية خاصة المستمرة التي يتم تقسيمها حسب مجالات ( أو أصناف).
↤ مميزات هذا الرسم البياني هي نفسها التي تطرقنا إليها في الرسم البياني الأول، الفرق، كما قلنا، هو عند رسم الأشرطة يجب أن تكون متصلة، وعند تمثيل الأشرطة يجب أن يكون عرضها مساو للطول المخصص للمجالات في المحور الأفقي.
خلاصة عامة لمراحل حل مسألة مرتبطة بعملية الإحصاء:
1- التعرف على المجتمع الإحصائي (الساكنة الإحصائية) مع الوحدات الإحصائية المكون لها داخل هذه المسألة.
2- تحديد الميزة الإحصائية التي هي موضوع الدراسة والتعرف على نوعها (كمية أو كيفية)
3- رسم جدول إحصائي، يتكون في بداية الأمر من سطرين، في الأول نضع قيم أو متغيرات الميزة الإحصائية، وفي الثاني نضع الحصيص أي عدد تكرار كل قيمة.
4- نضيف سطر آخر نضع فيه الحصيص المتراكم لكل قيمة، وهذه العملية تفيدنا في معرفة مجموع الحصيصات الأكبر أو الأصغر المرتبط بقيمة معينة.
5-نحدد الحصيص الإجمالي وهو مجموع الحصيصات. والحصيص الإجمالي يساعدنا في تحديد التردد والتردد النسبي، أي النسبة التي تمثلها كل قيمة ضنم مجموع القيم.
6- نضيف سطر آخر ونحدد فيه التردد أوالتردد النسبي بقسمة حصيص كل قيمة على الحصيص الإجمالي.
7- نضيف سطر آخر نضع فيه التردد المتراكم كما قمنا في الحصيص المتراكم.
8- يمكن أن نقوم بتمثيل الجدول الإحصائي مبيانيا.
الآن انتهينا من الجدول ونمر إلى حساب وسيطات الوضع:
9- حساب المنوال وهو القيمة التي لها أكبر حصيص.
10- القيمة الوسطية وهي القيمة الموجودة في الوسط.
11- المعدل الحسابي وهو قسمة مجموع جداءات القيم والحصيص على الحصيص الإجمالي
انتهينا من وسيطات الوضع، ونمر إلى وسيطات التشتت:
12- حساب المدى وهو الفرق بين أكبر قيمة وأصغر قيمة في المتسلسلة الإحصائية.
13- حساب الانحراف المتوسط الذي يساعدنا على مقارنة متسلسلتين إحصائيتين أو أكثر من حيث معيار التشتت.
14- حساب المغاير، يمكن الرجوع لمعرفة علاقة حسابه.
15- حساب الانحراف الطرازي أو الانحراف المعياري ويساوي جدر مربع المغايرة.
وهكذا نكون قد انتهينا من تحليل مسألة إحصائية في الرياضيات، لكن هل فعلا قد قمت بذلك بصفة نهائية؟؟
بالطبع لا، بل هناك مراحل أخرى وخصائص أخرى وعلاقات أخرى أكثر عمقا تدرس في المستويات العليا وفي الجامعات، نحن هنا أشرنا فقط إلى مبادئ علم الإحصاء، فعلم الإحصاء بحر شاسع على غرار علوم أخرى.
إلى هنا نأتي إلى نهاية هذا الدرس حول الإحصاء، وإذا استفدت منه فعلا فلا تنس الدعاء لنا بالخير وأن تضع كلمة شكر وتشارك المحتوى حتى تعم الفائدة.
المراجع:
- https://ar.wikipedia.org
- https://mawdoo3.com/
- https://www.alarabiya.net/
- https://warmaths.fr/
- https://www.geeksforgeeks.org/
- https://www.alloprof.qc.ca/fr/eleves
- https://public.iutenligne.net/
- https://www.supagro.fr/
- كتاب « مبادئ الإحصاء» لكاتبه طه حسين الزبيدي
- كما نضع بين أيديكم مجموعة من الملخصات ضمن ملف واحد ، اخترناها لكم من الانترنيت يمكن تحميلها بالنقر هنا، ثم تختارون الأنسب لكم.
المرجو عدم نشر تعليقات غير مناسبة للمحتوى