آمار و احتمال: اصول کلی و کاربردها
آمار و احتمال، مفاهیم مهمی در مطالعه اعداد و دادهها هستند. این دو پایه علمی تحلیل داده را تشکیل میدهند و به ما امکان فهم، تعامل و استفاده از حجمهای عظیم اطلاعات را به طور غیر قابل تصوری میدهند. احتمال به ما کمک میکند تا از میزان احتمال رخداد وقایع همچون حدس زدن یک پدیده، مطلع شویم. در سوی دیگر، آمار شامل جمعآوری،تحلیل و تفسیر داده برای بدست آوردن نتایج با معنی میشود که مثال آن میتواند یادگیری از مشاهده یک سری اعداد باشد. این دو مبحث، با هم به ما در گرفتن تصمیمهای هوشمندانه و ملاحظه الگوهای موجود در اطلاعات اطراف ما کمک بسیاری میکنند.
در این مقاله، مفاهیم مختلف آمار و احتمال به طور خلاصه و مفید مرور میشوند. در اینجا، تعاریف، فرمولها، انواع رخدادها، قواعد احتمال و برخی عنواین مرتبط دیگر با این دو مبحث بررسی میشوند.
تعریف احتمال
احتمال، یک اندازهگیری از شانس یا احتمال رخداد یک پدیده است. این مفهوم به صورت یک عدد بین صفر و یک بیان میشود که صفر به منزله پدیده غیرممکن و یک به منزله پدیده حتمی است. احتمال رخداد یک پدیده به صورت تقسیم تعداد نتایج مطلوب بر تعداد کل رخدادهای ممکن بدست میآید. شکل زیر این مفهوم را برای پرتاب تاس نشان میدهد:
شکل ۱- تعریف احتمال وقوع یک پدیده مشخص از میان کل نتایج ممکن
به صورت ساده میتوان گفت، این عدد، میزان احتمال یک نتیجه را از میان یک مجموعه از نتایج مختلف نشان میدهد و همین آن را به پایه و اساس عمل پیشبینی و تصمیمگیری در زمینههای مختلف شامل ریاضیات، آمار و زندگی روزمره تبدیل میکند.
تعریف آمار
آمار، شاخهای از ریاضیات است که شامل جمعآوری، تحلیل، تفسیر، نمایش و سازماندهی داده میشود. این شاخه، روشهایی برای استنباط کردن درباره جمعیتهای آماری از نمونههای داده را فراهم میکند. به طور کلیتر میتوان گفت، آمار کمک میکند تا میزان عدم قطعیت و تغییرات در داده را اندازهگیری کنیم و با این کار، محققان، تحلیلگران و تصمیمگیرندگان را در نیل به نتایج با معنی و گرفتن تصمیمهای آگاهانه، توامند سازیم. آمار حاوی روشهای مختلف شامل آمار توصیفی برای خلاصهسازی داده و آمار استنباطی برای انجام پیشبینی یا تست کردن فرضیه درباره مجموعه دادههای بزرگتر است.
مفاهیم مرتبط با آمار و احتمال
آزمایش تصادفی (Random Experiment): آزمایش، یک مجموعه از گامهای عملیاتی است که نتایج واضح ارائه میکند. یک آزمایش تصادفی، آزمایشی است که شما نمیتوانید نتیجه دقیق آن را پیشبینی کنید.
نتیجه (Outcome): نتیجه به معنی هر نوع نتیجه ممکن در یک گروه از نتایج است که به آن فضای نمونه (Sample Space) میگوییم و با نماد نشان داده میشود. برای مثال، زمانیکه یک سکه را پرتاب میکنید، فضای نمونه به صورت
است که همان شیر یا خط است.
فضای نمونه (Sample Space): فضای نمونه، مجموعه تمام نتایج ممکن در یک آزمایش است. مشابه آنچه که در پرتاب سکه به آن اشاره شد.
پدیده یا رخداد (Event): یک پدیده، هر بخشی از یک فضای نمونه میتواند باشد. اگر رخداد A بوقوع بپیوندد، به این معنی است که یکی از نتایج در A رخ داده است. برای نمونه، اگر رخداد A، ملاحظه یک عدد زوج در پرتاب تاس ۶-وجهی باشد، مواجهه با اعداد ۲ یا ۴ یا ۶ به منزله وقوع رخداد A است. ولی اگر اعداد ۱ یا ۳ یا ۵ دیده شوند، پدیده A رخ نداده است.
امتحان (Trial): امتحان یا تست به معنی هر بار انجام یک آزمایش است، مشابه پرتاب سکه. در آمازیش پرتاب سکه، هر پرتاب یک امتحان به شمار میرود.
میانگین (Mean): میانگین یک متغیر تصادفی، متوسط یا میانگین مقادیری است که در طول این آزمایش تصادفی به دست میآورد.
مقدار متوسط (Expected Value): مقدار متوسط، میانگین یک متغیر تصادفی است. برای مثال، اگر یک طاس را پرتاب کنیم، مقدار متوسط برابر با میانگین تمام نتایج ممکن است که ۳.۵ میشود.
فرمولهای آمار و احتمال
برخی از فرمولهای اصلی و رایج در آمار و احتمال در این بخش ارائه میشود.
فرمولهای احتمال
از آنجاییکه احتمال برابر با درصد وقوع یک پدیده است، مقدار آن از طریق فرمول زیر محاسبه میشود:
که در آن، برابر با احتمال رخداد پدیده A است،
، تعداد نتایج مطلوب که در آن
به وقوع پیوسته ، است و
تعداد کل نتایج ممکن است.
به عبارت دیگر و البته سادهتر میتوان گفت، احتمال، نسبت نتایج موفقیت به کل نتایج ممکن است. نتیجه، یک عدد بین صفر و یک است. این عدد با ضرب در عدد ۱۰۰ به صورت درصد نیز قابل بیان است.
مثال: اگر بخواهیم احتمال وقوع عدد ۴ در پرتاب یک تاس ۶-وجهی را محاسبه کنیم، ملاحظه میشود که تنها یک نتیجه مطلوب (عدد ۴) از میان ۶ نتیجه ممکن (۶ وجه مختلف تاس)، وجود دارد. بنابراین:
این فرمول، یک راه اساسی برای بیان احتمال وقوع رخدادها به صورت ریاضی را فراهم میکند.
فرمول قاعده جمع
قاعده جمع احتمال، زمانی استفاده میشود که میخواهیم احتمال رخداد حداقل یکی از دو پدیده انحصاری متقابل (mutually exclusive) یا ناسازگار با هم را محاسبه کنیم. برای دو پدیده و
که چنین باشند، احتمال رخداد حداقل یکی از آنها (که با
نمایش داده میشود)، با جمع احتمال رخداد هر کدام بدست میآید:
اگر دو پدیده، انحصاری متقابل نباشند، یا به عبارت دیگر، احتمال رخداد هر دو با هم وجود داشته باشد، احتمال رخداد حداقل یکی از آنها به صورت زیر محاسبه میشود:
که در آن، ، احتمال رخداد مشترک دو پدیده است.
فرمول احتمال شرطی
احتمال شرطی، احتمال رخداد یک پدیده در شرایطی است که حتما پدیده دیگری رخ داده باشد. این احتمال به صورت زیر محاسبه میشود:
با یک مثال، این مفهوم بهتر درک میشود. فرض کنید که به دانشآموزان یک کلاس، دو آزمون مختلف ریاضی داده شده است. در آزمون اول، ۶۰ درصد دانشآموزان حد نصاب را بدست آوردهاند در حالیکه فقط ۴۰ درصد در هر دو آزمون به این حد نصاب رسیدهاند. چند درصد از دانشآموزانی که آزمون اول را قبول شدهاند، در آزمون دوم نیز موفق بودهاند؟
در اینجا احتمالهای مختلف به شکل زیر بیان میشوند:
احتمال قبولی در آزمون اول را و قبولی در آزمون دوم را
و قبولی در هر دو آزمون را فرض میکنیم. حال جواب مساله همان احتمال شرطی
است که برای آن داریم:
فرمول قاعده ضرب
قاعد ضرب در احتمال برای محاسبه احتمال رخداد توأم دو پدیده مستقل از هم استفاده میشود. اگر و
به یکدیگر وابسته باشند، احتمال رخداد هر دو با هم برابر با ضرب احتمال
و احتمال شرطی
است:
قاعده بیز
قاعده بیز (Bayes rule)، فرمولی برای به روز رسانی احتمالها بر اساس مشاهدات جدید است. این فرمول، احتمال رخداد A را با توجه به رخداد دیگر، مثلا B محاسبه میکند. فرمول بیز به شکل زیر است:
در اینجا:
– ، احتمال رخداد A به شرط آن است که رخداد B اتفاق افتاده باشد.
– ، احتمال رخداد B به شرط آن است که رخداد A اتفاق افتاده باشد.
– و
به ترتیب برابر با احتمالهای رخدادهای
و
هستند.
مثال:
فرض کنید که تست HIV میتواند بیماران مبتلا به این ویروس را با دقت ۹۹ درصد تشخیص دهد و همچنین میتواند با دقت مشابه، یعنی ۹۹٪، افراد سالم را نیز تشخیص به عدم مبتلا بودن بدهد. در اینجا، میدانیم که تنها ۰/۳ درصد از کل جمعیت، مبتلا به ویروس HIV هستند. میخواهیم احتمال مبتلا بودن فرد به ویروس را به شرط مثبت بودن تست آن، محاسبه کنیم. برای این مساله داریم:
رخداد A: مبتلا بودن به HIV
رخداد B: مثبت بودن تست
برابر با ۰/۰۰۳
برابر با ۰/۹۹
خواست مساله محاسبه است. بنابراین داریم:
دقت کنید که که احتمال مثبت بودن تست است دو حالت دارد: فرد واقعا حاوی ویروس باشد که احتمال آن در کل جمعیت ۰/۰۰۳ است و حاوی ویروس نباشد که احتمال آن ۰/۹۹۷ است. اگر حاوی ویروس باشد، احتمال مثبت بودن تست ۰/۹۹ است و اگر نباشد، ۰/۰۱ است. بنابراین:
در نهایت داریم:
برخی دیگر قواعد و فرمولهای اساسی
احتمال عددی بین صفر و یک است: احتمال رخداد یک پدیده از مقدار صفر (حالت غیرممکن) تا مقدار یک (حالت حتمی) تغییر میکند. احتمال برابر با ۰/۵ به معنی شانس برابر بین دو حالت گفته شده است.
جمع تمام احتمالها برابر با واحد است: وقتی که تمام حالتهای ممکن از نتیجه یک رخداد را در نظر میگیریم، احتمال کلی برابر با یک میشود. مثلا اگر در یک آزمایش، دو حالت داشته باشیم و احتمال رخداد یک نتیجه ۰/۳ باشد، چون جمع دو حالت باید یک شود، احتمال رخداد حالت دیگر، ۰/۷ است.
قاعده مکمل (complement): احتمال رخداد یک پدیده به علاوه احتمال عدم رخداد همان پدیده، برابر با یک میشود. معمولا احتمال عدم رخداد مثلا پدیده را به جای
با
نمایش میدهند.
فرمولهای آمار
برخی از مهمترین و پرکاربردترین فرمولهای آمار در ادامه آمده است:
میانگین
میانگین (mean)، برابر با مقدار متوسط یک مجموعه از اعداد است. برای محاسبه آن، تمام اعداد موجود در مجموعه داده با هم جمع شده و نتیجه بر تعداد مقادیر، تقسیم میشود. نماد مقدار میانگین معمولا به صورت یک خط بالای نماد متغیر است:
که در آن داریم:
– مقدار متوسط یا میانگین است.
– برابر با جمع همه مقادیر روی مجموعه داده است.
– تعداد کل اعضا مجموعه داده است.
میانه
میانه (Median)، مقدار قرار گرفته در موقعیت مکانی وسط در حالتی است که مجموعه داده به ترتیب اندازه، مرتب شده باشد (ترتیب افزایشی یا کاهشی). البته با توجه به تعداد المانهای مجموعه، دو حالت برای محاسبه مقدار میانه وجود دارد: اگر تعداد زوج باشد، مقدار میانه برابر با میانگین دو مقدار وسط است و اگر فرد باشد، مقدار وسط در چیدمان گفته شده در بالا.
برای مجموعه با عضو که
فرد باشد داریم:
برای مجموعه با عضو که
زوج باشد نیز، داریم:
مود
مود (Mode)، مقدار عددی است که بیشتر از بقیه در مجموعه داده تکرار میشود. یک مجموعه داده ممکن است یک مود داشته باشد که آن را تکمود (Unimodal) میگویند، بیش از یک مود داشته باشد که چندمود (Multimode) گفته میشود یا اینکه اصلا مود نداشته باشد.
واریانس
واریانس (Variance)، میزان گستردگی مقادیر حول مقدار متوسط را اندازهگیری میکند. این مقدار از طریق محاسبه مقدار متوسط مربع اختلاف بین مقادیر دادهها و مقدار متوسط آنها، بدست میآید. این پارامتر معمولا با نماد نمایش داده میشود:
که در آن داریم:
– مقدار واریانس است.
– برابر با جمع مربع اختلاف بین مقادیر دادهها با مقدار میانگین آنها روی مجموعه داده است.
– مقدار متوسط یا میانگین است.
– تعداد کل اعضا مجموعه داده است.
انحراف معیار
انحراف معیار (Standard Deviation) برابر با جذر یا ریشه دوم مقدار واریانس است. این مقدار نسبت به میانگین، اطلاعات با تفسیرپذیری بهتری در رابطه با گستردگی دادهها ارائه میکند:
که در آن داریم:
– هر نمونه از مجموعه داده است.
– واریانس است.
– انحراف معیار است.
– میانگین است.
برخی از عنوانهای مهم در آمار و احتمال
در ادامه برخی از عنوانهای مهم تحت عنوان کلی آمار و احتمال را بررسی میکنیم:
رویدادها در احتمال
در مبحث احتمال، انواع مختلفی از رویدادها (events) وجود دارد:
رویداد ساده
یک رویداد ساده (Simple event) زمانی رخ میدهد که یک نتیجه خاص فقط یک امکان داشته باشد. برای نمونه، در پرتاب سکه، دریافت کردن نتیجه شیر یا خط یک رویداد ساده است. احتمال یک رویداد ساده از طریق فرمول زیر حاصل میشود:
P(رویداد ساده) = مجموع نتایج ممکن/1
رویداد ترکیبی
یک رویداد ترکیبی (Compound event) شامل دو یا چند رویداد ساده میشود. برای مثال، دو بار پرتاب سکه و دریافت دو شیر در هر دو پرتاب یک رویداد ترکیبی است. احتمال یک رویداد ترکیبی با ضرب احتمالهای هر یک از رویدادهای ساده مستقل حاصل میشود:
P(رویداد ترکیبی) = P(رویداد اول) * P(رویداد دوم)
رویداد مستقل
رویداد مستقل (Independent event) آن است که نتیجه آن تاثیر بر سایر رویدادها نداشته باشد. پرتاب یک سکه سالم مثال این نوع رویداد است که در هر پرتاب شانس یکسانی در نتیجه شیر یا خط وجود دارد.
رویداد وابسته
رویداد وابسته (Dependent event) متاثر از نتیجه یک رویداد دیگر است. برای نمونه، برداشتن مهره از یک ظرف بدون جایگذاری مجدد، احتمال برداشتهای بعدی را تغییر میدهد و یک رویداد وابسته است.
رویداد مکمل
مکمل (Complement) یک رویداد (که با نمایش داده میشود)، شامل تمام نتایجی است که در رویداد اصلی
وجود ندارد. اگر احتمال آمدن یک عدد زوج در پرتاب یک تاس ۶-وجهی، برابر با
باشد، آنگاه احتمال نیامدن عدد زوج (یا آمدن عدد فرد) که مربوط به رویداد مکمل است، به شکل زیر محاسبه میشود:
توزیع احتمال
توزیع احتمال (Probability Distribution)، نحوه توزیع و گستردگی احتمال نتایج مختلف را بر روی مقادیر ممکن برای یک متغیر تصادفی، توصیف میکند. این تابع، یک دید کلی از نتایج محتمل را ارائه میدهد و به فهم عد قطعیت مرتبط با رخدادهای تصادفی، کمک موثری میکند. به طور کلی دو نوع توزیع احتمال وجود دارد:
– توزیع احتمال گسسته (Discrete Probability Distribution)
– توزیع احتمال پیوسته (Continuous Probability Distribution)
توابع احتمال
توایع احتمال (Probability Functions) یک نمایش ریاضی از احتمالهای مربوط به مقادیر مختلف یک متغیر تصادفی را ارائه میکنند. دو نوع رایج از اینگونه توابع، توابع جرم احتمال (Probability Mass Functions – PMFs) برای متغیرهای گسسته و توابع چگالی احتمال (Probability Density Functions – PDFs) برای متغیرهای پیوسته هستند.
عنوانهای مهم در آمار
برخی از عنوانهای کلیدی و مهم در آمار به شرح زیر است:
آمار توصیفی
آمار توصیفی (Descriptive Statistics)، شاخهای از آمار است که بر روی خلاصهسازی داده تمرکز دارد و به شکلهای مختلف همچون گرافهای و جداول، نتایج خود را نشان میدهد. این ابزار شامل استفاده از خلاصه آمار برای ارائه فهم درست و شفاف از داده میشود. آمار توصیفی به شکل یک نمایش فشرده از داده عمل میکند. در ادامه مثالهایی از آمار توصیفی آمده است:
معیارهایی از گرایش مرکزی
گرایش مرکزی (Central Tendency) یک مجموعه داده، توسط روشهای زیر اندازهگیری میشود:
میانگین (Mean): مقدار متوسط یک مجموعه از دادهها. تمام مقادیر با هم جمع شده و نتیجه بر تعداد دادهها، تقسیم میشود.
میانه (Median): مقدار وسط در مجموعه داده در حالتیکه دادهها به ترتیب اندازه مرتب شده باشند.
مود (Mode): مقداری که بیشترین تعداد تکرار در کل مجموعه داده را دارد.
مثال: برای مجموعه داده {80, 85, 90, 92, 95} مقدار متوسط برابر با 88=5/(80+85+90+92+95) است، مقدار میانه برابر با 90 و مقدار مود در اینجا وجود ندارد چون هیچ کدام از مقادیر بیش از یک بار تکرار نشده است.
معیارهای تغییرپذیری
انحراف معیار (Standard Deviation): نحوه گستردگی مقادیر نسبت به مقدار میانگین را نشان میدهد.
واریانس (Variance): مقدار متوسط مربع اختلاف مقادیر داده از مقدار میانگین است.
مثال: در دو مجموعه از نمرات {A={70, 75, 80, 85, 90}, B={60, 65, 70, 75, 80 مقدار میانگین برای هر دو مجموعه برابر با 80 است ولی مجموعه دوم، واریانس بالاتر و در نتیجه تغییرپذیری بالاتری نشان میدهد.
آمار استنباطی
در شرایط کاربردی و واقعی، جمعآوری داده از تمام جمعیتها، اغلب چالشی و دشوار است. آمار توصیفی از طریق خلاصهسازی و سازماندهی داده موجود برای ارائه دید مناسب از داده، به عنوان یک راهحل مناسب مطرح میشود. برای مثال، محاسبه مقدار میانگین (متوسط) و انحراف معیار از یک مجموعه داده، میتواند نسبت به گرایش مرکزی و میزان تغییرپذیری در مجموعه داده، دید خوبی بدهد.
هر چند که، برای داده در مقیاس بزرگ که تقریبا جمعآوری در آن دشوار است، آمار استنباطی (Inferential Statistics) وارد عمل میشود. این ابزار شامل نتیجهگیری درباره کل جمعیت بر پایه نمونههای محدود است. برای مثال، تخمین نمره میانگین دانشآموزان دبیرستانی در درس فیزیک در سراسر کشور به نظر خیلی گسترده و دشوار است و در اینجا آمار استنباطی، امکان نتیجهگیری از یک مجموعه داده نمونه قابل مدیریت را فراهم میکند. این رویکرد، تصمیمگیری مبتنی بر اطلاعات را میسر میسازد حتی وقتی که جمعآوری کل داده غیرممکن باشد.
نمایش داده
نمایش داده (Data Representation)، شامل نمایش اطلاعات به شکل با معنی و قابل فهم است. در آمار، این کار برای تحلیل و تفسیر داده به طور موثر، ضروری است. روشهای معمول برای نمایش داده به شرح زیر است:
نمایش گرافیکی (Graphical Representation)
چارت دایروی (Pie Chart)
نمودار خطی (Line Graph)
نموار میلهای (Bar Graph)
نموار پراکندگی (Scatter Plot)
جداول توزیع تکرار (Frequency Distribution Table)
نمودار جعبهای (Box and Whisker Plot-Boxplot)
نمودار نقطهای (Dot Plot)
گراف تصویر (Pictogram)
روشهای نمونهبرداری
روشهای نمونهبرداری (Sampling Methods) برای انتخاب یک زیرمجموعه از نمونهها یا موارد مورد نظر از یک مجموعه جمعیت بزرگتر به قصد استنباط درباره آن جمعیت، استفاده میشوند. تکنیکهای مختلف نمونهبرداری بر پایه طبیعت تحقیق مورد نظر و خصوصیات جمعیت، به کار گرفته میشوند. در اینجا برخی از روشهای مرسوم نمونهبرداری آمده است:
نمونهبرداری ساده (Simple Sampling)
نمونهبرداری طبقهای (Stratified Sampling)
نمونهبرداری سیستماتیک (Systematic Sampling)
نمونهبرداری خوشهای (Cluster Sampling)
نمونهبرداری در دسترس (Convenience Sampling)
نمونهبرداری سهمیهای (Quota Sampling)
نمونهبرداری هدفمند (Purposive Sampling)
آمار و احتمال برای ریاضیات مهندسی
آمار و احتمال، بخش مهمی از ریاضیات مهندسی را شکل میدهند و پایه و زیرساختی برای انجام تصمیمگیری مبتنی بر اطلاعات و حل مسائل پیچیده مهندسی ارائه میدهند. در اینجا، خلاصه کوتاهی از نحوه استفاده از این مباحث ریاضی در مهندسی آمده است:
احتمال در مهندسی
ارزیابی ریسک و تحلیل امنیت: مهندسین از احتمال برای ارزیابی ریسکهای مرتبط با پروژهها و فرآیندهای مختلف مهندسی استفاده میکنند. این کار به طراحی ساختمانها، وسايل نقلیه و سیستمهای با ایمنی بیشتر کمک میکند.
مهندسی کنترل کیفیت و قابلیت اطمینان: مدلهای احتمال در تعیین میزان قابلیت اعتماد به اجزاء و سیستمهای مختلف مهندسی کمک میکند و نقاط معیوب را پیشبینی میکنند. همچنین از طریق تستهای دشوار و پیچیده، باعث بهبود کیفیت محصولات میشوند.
پردازش سیگنال: در مهندسی برق و مخابرات، احتمال به منظور، تحلیل و فیلتر کردن سیگنالها، تعامل با ویژگی تصادفی بودن سیگنالها و نویز در ارسال داده، استفاده میشود.
تصمیمگیری در شرایط عدم قطعیت: احتمال در فرآیند تصمیمگیری، زمانیکه نتایج قطعی نیستند، کمک میکند و منابع و استراتژیها را در شرایطی که اطلاعات کامل نیستند، بهینه میکند.
آمار در مهندسی
تحلیل و تفسیر داده: مهندسین، دادهها را جمعآوری و تحلیل میکنند تا روندها را درک کرده و نتیجهگیریهای لازم را انجام دهند و در نهایت از فرآیندهای تصمیمگیری، پشتیبانی کنند.
طراحی و تحلیل آزمایشگاهی: روشهای آماری برای طراحی آزمایشها، تحلیل نتایج و تایید تئوریها و مدلها در حوزههای مختلف از علوم مواد گرفته تا مهندسی محیط زیست، به کار میروند.
بهبود فرآیند و کیفیت: ابزارهای آماری همچون چارتهای کنترل و طراحی آزمایشها (Design of Experiments – DoE)، در تولید کارخانهای و مهندسی صنعتی به منظور بهینهسازی فرآیند و بهبود کیفیت، بسیار نقش حیاتی دارند.
ارائه مدلهای پیشبینی کننده: آمار، از تولید مدلهایی که رخدادها و رفتارهای آینده را پیشبینی میکنند و در زمینههای تجدیدپذیر، مدیریت ترافیک و توسعه زیرساختها بسیار کلیدی هستند، پیشتیبانی میکند.
منبع: https://www.geeksforgeeks.org https://www.analyticsvidhya.com
دیدگاه ها (0)