تالار گفتمان مانشت

نسخه‌ی کامل: پیش پردازش داده ها
شما در حال مشاهده‌ی نسخه‌ی متنی این صفحه می‌باشید. مشاهده‌ی نسخه‌ی کامل با قالب بندی مناسب.
با سلام و عرض قبولی طاعات و عبادات،
دوستان، من راجع به پیش پردازش داده ها چندتا سوال داشتم، ممنون میشم راهنمایی بفرمایید:

1- توی یک دیتاست که از قبل اطلاعات دقیقی راجع به اون نداریم، چطور میتونیم نویز رو تشخیص بدیم؟

2- از کجا باید متوجه بشیم که برای کدوم ویژگیها احتیاج به نرمال سازی داریم و اینکه این نرمالسازی باید توی چه بازه ی عددی باشه؟

3- از کجا باید متوجه بشیم که دیتاست رو از لحاظ ابعاد(ستونها) و موارد(سطرها) چقدر باید کاهش بدیم؟

4- برای هر کدوم از مراحل پیش پردازش، از کجا باید متوجه بشیم که کدوم الگوریتم مناسبترین هست؟

من برای موارد بالا، با الگوریتم ها آشنایی داریم و پیاده سازی اونها هم برای من مشکل نیست (البته من متلب کار میکنم)، ولی توی موارد بالا مشکل دارم. و به عنوان سوال آخر:

5- من از PCA برای کاهش ابعاد استفاده کردم که خودش بطور خودکار نرمالسازی رو هم تا حدودی در بر داره، آیا بازهم احتیاج به نرمال سازی داده ها دارم؟

دیتاستی که الان مد نظر من هست، این دیتاست هست:

مهمان عزیز شما قادر به مشاهده پیوندهای انجمن مانشت نمی‌باشید. جهت مشاهده پیوندها ثبت نام کنید.
لینک مرجع