۰ نفر

منظور از توزیع نمونه گیری چیست؟

۱۸ اردیبهشت ۱۴۰۲، ۱۸:۰۴
کد خبر: 713593
منظور از توزیع نمونه گیری چیست؟

توزیع نمونه‌ گیری، توزیع احتمال آماره‌ای است که از طریق نمونه گیری مکرر از یک جامعه خاص به دست می آید.

​در آمار، جامعه به کل مجموعه ای گفته می شود که یک نمونه آماری از آن استخراج می شود. جامعه ممکن است به یک گروه کامل از افراد، اشیاء، رویدادها، بازدید از بیمارستان یا اندازه گیری ها اشاره کند. بنابراین، می‌توان گفت که جامعه آماری، مشاهده کلی آزمودنی‌هایی است که براساس یک ویژگی مشترک با هم در یک گروه گروه‌بندی شده‌اند.

نکات کلیدی

این توزیع طیفی از نتایج ممکن یک آماره خاص مانند میانگین یا نمای برخی از متغیرها را برای یک جامعه آماری توصیف می کند.

اکثریت داده هایی که محققان تحلیل می‌کنند در واقع از بررسی نمونه‌ها حاصل شده‌اند و نه کل جمعیت.

آشنایی با توزیع نمونه‌ گیری

بسیاری از داده هایی که دانشگاهیان، آماردانان، محققان، بازاریابان، تحلیلگران و غیره ترسیم و استفاده می‌کنند، در واقع از نمونه‌ها به دست آمده‌اند و نه جمعیت. نمونه زیر مجموعه ای از یک جامعه است. به عنوان مثال، یک محقق پزشکی که قصد دارد میانگین وزن همه نوزادان متولد شده در آمریکای شمالی از سال 1995 تا 2005 را با نوزادانی که در آمریکای جنوبی در همان بازه زمانی متولد شده‌اند مقایسه کند، نمی‌تواند داده‌های کل جمعیت بیش از یک میلیون زایمانی را که در بازه زمانی ده ساله اتفاق افتاده است در مدت زمان معقولی تهیه کند. این محقق در عوض فقط از وزن مثلاً 100 نوزاد در هر قاره برای نتیجه گیری خود استفاده خواهد کرد. وزن 100 نوزاد استفاده شده در این پژوهش نمونه و میانگین وزن محاسبه شده میانگین نمونه خواهد بود.

حال فرض کنید که این محقق پزشکی به جای استفاده از یک نمونه متشکل از وزن 100 نوزاد از هر قاره، نمونه های تصادفی مکرری را از جمعیت عادی هریک از این دو قاره اخذ و میانگین نمونه را برای هر گروه از نمونه‌ها محاسبه می کند. بنابراین، این محقق برای نمونه‌گیری از قاره آمریکای شمالی داده های وزن 100 نوزاد ثبت شده در کشورهای ایالات متحده، کانادا و مکزیک را به شرح زیر جمع آوری می‌کند: چهار نمونه 100 عضوی از بیمارستان های منتخب ایالات متحده، پنج نمونه 70 عضوی از کانادا، و سه نمونه 150 عضوی از مکزیک که در مجموع وزن 1200 نوزاد تازه متولد شده در 12 مجموعه گروه بندی شده را به دست می‌دهد. این محقق همچنین داده‌های نمونه از وزن 100 نوزاد هنگام تولد را از هر یک از 12 کشور آمریکای جنوبی جمع آوری می‌کند.

مهم

هر نمونه میانگین نمونه خاص خود را دارد و توزیع میانگین نمونه به توزیع نمونه معروف است.

میانگین وزن محاسبه‌شده برای هر مجموعه نمونه، توزیع نمونه‌ گیری میانگین است. نمونه‌ها تنها برای محاسبه میانگین استفاده نمی‌شوند. سایر آماره‌ها مانند انحراف معیار، واریانس، نسبت و دامنه را می توان از داده های نمونه محاسبه کرد. انحراف معیار و واریانس پراکندگی توزیع نمونه‌ گیری را اندازه‌گیری می‌کنند.

تعداد مشاهدات در یک جامعه، تعداد مشاهدات در یک نمونه و روشی که برای استخراج مجموعه‌های نمونه استفاده می‌شود، پراکندگی توزیع نمونه‌ گیری را تعیین می‌کنند. انحراف معیار توزیع نمونه‌ گیری، خطای استاندارد نامیده می‌شود. در حالی که میانگین توزیع نمونه‌گیری برابر با میانگین جامعه است، خطای استاندارد به انحراف معیار جامعه، اندازه جامعه و اندازه نمونه بستگی دارد.

اطلاع از میزان پراکندگی میانگین‌های هر یک از مجموعه‌های نمونه از یکدیگر و از میانگین جامعه، نشان‌دهنده نزدیکی میانگین‌های نمونه‌ها به میانگین جامعه است. خطای استاندارد توزیع نمونه‌ گیری با افزایش اندازه نمونه کاهش می یابد.

ملاحظات ویژه

یک جامعه یا یک مجموعه نمونه از اعداد دارای توزیع نرمال خواهد بود. با این حال، از آنجا که توزیع نمونه‌ گیری شامل مجموعه‌های متعددی از مشاهدات می‌شود، لزوماً شکل منحنی زنگوله‌ای نخواهد داشت.

پیرو مثال ما در بالا، میانگین وزن جمعیت نوزادان در آمریکای شمالی و آمریکای جنوبی دارای توزیع نرمال خواهد بود، زیرا برخی از نوزادان کم وزن (زیر میانگین) خواهند بود و برخی دیگر اضافه وزن (بالاتر از میانگین) خواهند داشت و وزن اکثر نوزادان در این بین (نزدیک به میانگین) قرار می گیرد. اگر میانگین وزن نوزادان در آمریکای شمالی هفت پوند باشد، میانگین نمونه وزن نوزادان در هر یک از 12 مجموعه مشاهدات نمونه ثبت شده برای آمریکای شمالی نیز نزدیک به هفت پوند خواهد بود.

با این حال، اگر هر یک از میانگین‌های محاسبه‌شده در هر یک از 1200 گروه نمونه را بر روی نموداری ترسیم کنید، شکل حاصل ممکن است توزیع یکنواختی را نشان دهد، اما پیش‌بینی قطعی اینکه شکل واقعی چه خواهد شد دشوار است. هر چه محقق نمونه های بیشتری از جمعیت بیش از یک میلیون وزنی نوزادان تازه متولد شده استخراج کند، شکل نمودار بیشتر به شکل توزیع نرمال نزدیک‌تر خواهد شد.