آزمون نرمال بودن داده ها یا ارزیابی نرمالیتی داده در SPSS
آزمون نرمال بودن داده ها روشی برای تشخیص آن است که مشخص شود توزیع دادههای گردآوری شده از توزیع طیبیعی یا نرمال برخوردار است. قبل از هر گونه آزمونی که با فرض نرمال بودن دادهها صورت میگیرد باید آزمون نرمال بودن صورت گیرد. برای این منظور روشهای متعددی وجود دارد. در آمار استنباطی شرط اصلی برای انواع آزمونهای آمار پارامتریک و ناپارامتریک به توزیع دادهها بستگی دارد. اگر توزیع دادهها نرمال باشد در اینصورت از روشهای پارامتریک استفاده میشود و اگر نرمال نباشد نباید از روشهای پارامتریک استفاده شود. آزمونهای ناپارامتریک ربطی به توزیع دادهها ندارد. برخی از آزمون های بررسی نرمال بودن داده ها عبارتند از:
- چولگی و کشیدگی دادهها
- ترسیم نمودار هیستوگرام
- آزمون کولموگروف-اسمیرنوف
- آزمون شاپیرو-ویلک
آزمون کولموگروف-اسمیرنوف یا شاپیرو ویلک
علاوه بر بررسی عادی یا نرمال بودن کشیدگی و یا چولگی توزیع دادهها، از آزمون شاپیرو-ویلک یا آزمون کولموگروف-اسمیرنوف استفاده می شود برای آزمون نرمال بودن داده ها استفاده میشود.
هنگام بررسی نرمال بودن دادهها ما فرض صفر مبتنی بر اینکه توزیع دادهها نرمال است را در سطح خطای ۵% تست میکنیم. بنابراین اگر آماره آزمون بزرگتر مساوی ۰.۰۵ بدست آید، در این صورت دلیلی برای رد فرض صفر مبتنی بر اینکه داده نرمال است، وجود نخواهد داشت. به عبارت دیگر توزیع دادهها نرمال خواهد بود. برای آزمون نرمالیته فرضهای آماری به صورت زیر تنظیم میشود:
H0 : توزیع دادههای مربوط به هر یک از متغیرها نرمال است
H1 : توزیع دادههای مربوط به هر یک از متغیرها نرمال نیست
جهت انجام این دو آزمون فرمان زیر را اجرا کنید:
Analyze/Descriptive Statistics/Explore
در کادر باز شده متغیرهای موردنظر را وارد لیست Dependent list کنید و سایر جاها را خالی بگذارید. سپس روی دکمه plots کلیک کرده و در کادر جدید گزینه Normality plots with tests را تیک دار کنید.
با این عمل خروجی شامل جدولی تحت عنوان Tests of Normality است که به شما دو مقدار سطح معناداری را برای هر کدام از متغیرها به طور مجزا می دهد. این مقادیر در تشخیص نرمال بودن دادهها تعیین کننده است. چنانچه سطح معناداری در آزمون Shapiro-Wilk یا آزمون کولموگروف-اسمیرنوف که در این جدول با sig. نمایش داده می شود بیشتر از ۰.۰۵ باشد می توان دادهها را با اطمینان بالایی نرمال فرض کرد. در غیر این صورت نمیتوان گفت که داده ها توزیعشان نرمال است.
و…