1403/04/01

۱۰ مرحله نحوه محاسبه نقاط پرت

محاسبه نقاط پرت یک تکنیک آماری مهم است که برای شناسایی نقاط داده ای که به طور قابل توجهی با بقیه مجموعه داده ها متفاوت هستند، استفاده می شود. نقاط پرت ممکن است به دلایل مختلفی مانند خطاهای اندازه گیری، خطاهای ورود داده ها یا مشاهدات غیرعادی واقعی رخ دهند. شناسایی و رسیدگی به موارد پرت در بسیاری از زمینه ها از جمله مالی، مراقبت های بهداشتی و تحقیقات علمی بسیار مهم است. در اینجا 10 مرحله برای محاسبه موثر ضرایب پرت آورده شده است:

مرحله 1: درک داده ها

قبل از محاسبه مقادیر پرت، ضروری است که درک خوبی از مجموعه داده داشته باشید. با متغیرها، واحدهای اندازه گیری آنها و هر دانش مربوط به حوزه آشنا شوید. این درک به شما کمک می‌کند تا تعیین کنید که چه چیزی در زمینه خاص شما یک امر پرت را تشکیل می‌دهد.

مرحله ۲: تجسم داده‌ها

تجسم داده‌ها می‌تواند بینش‌های ارزشمندی را در مورد توزیع آن و شناسایی موارد دور از دسترس ارائه دهد. هیستوگرام ها، نمودارهای جعبه، نمودارهای پراکنده یا سایر نمایش های گرافیکی میتوانند به شما در درک شکل داده ها و شناسایی هرگونه مشاهدات شدید کمک کنند.

مرحله 3: یک روش تشخیص پرت را انتخاب کنید

روش‌های مختلفی برای تشخیص موارد پرت وجود دارد که هر کدام نقاط قوت و محدودیت‌های خود را دارند. تکنیک های رایج مورد استفاده شامل روش Z-score، روش Z-score اصلاح شده، نرده های Tukey و فاصله Mahalanobis است. روشی را انتخاب کنید که مناسب توزیع داده ها و اهداف تحقیق شما باشد.

مرحله 4: محاسبه آمار توصیفی

قبل از اعمال هر روش تشخیص پرت، آمار توصیفی مانند میانگین، میانه، انحراف استاندارد، چارک ها، یا محدوده بین ربعی (IQR) را محاسبه کنید. این آمار به عنوان یک نقطه مرجع در هنگام شناسایی نقاط پرت عمل خواهد کرد.

مرحله 5: روش انتخابی را اعمال کنید

هنگامی که یک روش تشخیص بیرون را انتخاب کردید، آن را در مجموعه داده خود اعمال کنید. مراحل خاص ممکن است بسته به تکنیک انتخابی متفاوت باشد. به عنوان مثال، اگر از روش Z-score استفاده می کنید، امتیاز Z را برای هر مشاهده با کم کردن میانگین و تقسیم بر انحراف معیار محاسبه کنید.

مرحله 6: یک آستانه تنظیم کنید

برای تعیین اینکه کدام نقاط داده باید به صورت پرت در نظر گرفته شوند، یک آستانه یا نقطه برش تعیین کنید. این آستانه می‌تواند بر اساس معناداری آماری یا دانش خاص حوزه باشد. آستانه هایی که معمولاً مورد استفاده قرار می گیرند شامل امتیاز Z بیشتر از مقدار معین، مقادیر خارج از محدوده تعریف شده توسط حصارهای توکی یا مشاهدات با فواصل ماهالانوبیس زیاد است.

مرحله 7: شناسایی نقاط پرت

هر مشاهده را با آستانه تعیین شده مقایسه کنید. اگر مشاهده ای از آستانه فراتر رود، آن را به عنوان نقطه پرت طبقه بندی می کنند. موارد پرت شناسایی شده در طول این فرآیند را پیگیری کنید.

مرحله 8: بررسی موارد پرت

هنگامی که موارد پرت شناسایی شدند، بررسی بیشتر آنها برای درک ماهیت و علل بالقوه آنها بسیار مهم است. زمینه نقطه داده را بررسی کنید، ارزیابی کنید که آیا این یک خطای اندازه گیری است یا یک مشاهده شدید واقعی، و هر عامل خارجی را که ممکن است بر مقدار آن تأثیر گذاشته باشد، در نظر بگیرید.

مرحله 9: در مورد مدیریت موارد پرت تصمیم بگیرید

پس از بررسی موارد پرت، باید تصمیم بگیرید که چگونه آنها را مدیریت کنید. بسته به موقعیت، ممکن است انتخاب کنید که مقادیر پرت را از مجموعه داده حذف کنید، آنها را با مقادیر مناسب تری جایگزین کنید، یا اگر مشاهدات معتبری هستند، آنها را همانطور که هست نگه دارید.

مرحله 10: سند و گزارش

در نهایت، تمام مراحل انجام شده در طول تشخیص و رسیدگی به موارد دور از دسترس را مستند کنید. جزئیات مربوط به روش انتخابی، آستانه، نقاط پرت شناسایی شده و هر اقدام انجام شده را درج کنید. گزارش شفاف رویه‌های تشخیص پرت برای تکرارپذیری و اطمینان از اعتبار تحلیل‌های بعدی ضروری است.

با دنبال کردن این مراحل، می‌توانید به طور موثر مقادیر پرت را در مجموعه داده خود محاسبه کنید و در مورد درمان آنها تصمیمات آگاهانه بگیرید.

 

 


فرم در حال بارگذاری ...