تجزیه و تحلیل داده ها 101: انواع تجزیه و تحلیل شما می توانید انجام دهید

ساخت وبلاگ

در اینجا ما به شما کمک می کنیم تا با نمایش انواع مختلفی از تجزیه و تحلیل که می توانید انجام دهید ، اطلاعات را پاک کنید و تحت چه شرایطی باید از آنها استفاده کنید.

فهرست مطالب
  1. تعریف اصطلاحات
  2. تجزیه و تحلیل توصیفی
  3. تجزیه و تحلیل استنباطی
  4. تجزیه و تحلیل تشخیصی
  5. تجزیه و تحلیل پیش بینی کننده
  6. تجزیه و تحلیل تجویز شده

دلیل خوبی وجود دارد که تجزیه و تحلیل داده ها می تواند بسیار زیاد باشد: طیف گسترده ای از روش های انجام آن وجود دارد! پس از آن باید انتخاب کنید؟این مقاله به شما کمک می کند تا با نشان دادن انواع مختلفی از تجزیه و تحلیل که می توانید انجام دهید ، و در صورت استفاده از آنها ، موارد را پاک کنید.

تعریف اصطلاحات

این بخش شامل لیست تعاریف اصطلاحاتی است که ما در این مقاله اغلب از آنها استفاده خواهیم کرد. تعاریف از دانشگاه کالیفرنیا برداشته می شود - واژه نامه آماری برکلی:

  1. جمعیت - مجموعه ای از واحدهای مورد مطالعه. واحدها می توانند افراد ، مکان ها ، اشیاء ، دوره ها ، مواد مخدر ، روشها یا موارد دیگر باشند.
  2. نمونه - مجموعه ای از واحدها از یک جمعیت.
  3. متغیر - یک مقدار عددی از یک ویژگی. هم پارامتر و هم آماری متغیرها هستند.
  4. پارامتر - خاصیت عددی یک جمعیت ، مانند میانگین آن.
  5. آماری - عددی که می توان از یک نمونه داده محاسبه کرد. از آمار برای برآورد پارامترهای جمعیت استفاده می شود.

تجزیه و تحلیل توصیفی

تجزیه و تحلیل توصیفی ساده ترین این نوع تجزیه و تحلیل است ، نه تنها در هدف خود بلکه در روشهای ریاضی و آماری آن. این هدف به سادگی توصیف ویژگی های اساسی داده های شما ، بدون ایجاد استنباط یا پیش بینی است. تجزیه و تحلیل توصیفی قبل از انجام هرگونه تجزیه و تحلیل دیگر یک الزام است ، زیرا به فرد کمک می کند تا روش مناسب ریاضی یا آماری را برای استفاده در مجموعه داده انتخاب کند.

اولین چیزی که شما باید در مجموعه داده خود مشخص کنید ، تعداد متغیرهای درگیر است. شما می توانید یک مجموعه داده با یک متغیر واحد یا دو یا چند متغیر داشته باشید. اگر یک متغیر واحد دارید ، می توانید تجزیه و تحلیل تک متغیره را انجام دهید. اگر دو یا چند متغیر دارید ، می توانید تجزیه و تحلیل چند متغیره نیز داشته باشید ، که به شما امکان می دهد بعداً تجزیه و تحلیل های پیشرفته تری انجام دهید که مربوط به دو یا چند متغیر است. اگر دو یا چند متغیر دارید ، می توانید تجزیه و تحلیل تک متغیره را به صورت جداگانه به هر متغیر انجام دهید.

هنگامی که متغیرها را مرتب کردید ، می توانید هر یک از موارد زیر (یا هر چهار نفر) را انجام دهید ، همانطور که توسط CampusLabs ذکر شده است:

  1. اقدامات فرکانس: نشان می دهد که چند بار اتفاق می افتد. مقادیری که در این گروه قرار می گیرند شامل فرکانس ، فرکانس نسبی و فرکانس نسبی تجمعی است. می توانید فرکانس را با استفاده از توزیع فرکانس تجسم کنید.
  2. اقدامات گرایش مرکزی: میانگین مجموعه داده های شما را نشان می دهد. این موارد شامل میانگین ، متوسط و حالت است.
  3. اقدامات پراکندگی یا تغییر: نشان می دهد که مقادیر مجموعه داده چگونه پراکنده یا متنوع است. این موارد شامل دامنه ، واریانس ، انحراف استاندارد ، پوستی و کورتوز است.
  4. اقدامات موقعیت: نشان می دهد که چگونه مقادیر در رابطه با یکدیگر قرار می گیرند. این موارد شامل رده های صدک و کوارتیل است.

تجزیه و تحلیل استنباطی

از طرف دیگر ، تجزیه و تحلیل استنباطی به دنبال تجزیه و تحلیل مجموعه داده ها یا مجموعه داده ها ، یافتن رابطه بین دو یا چند متغیر یک یا چند مجموعه داده مرتبط یا آزمایش فرضیه در مورد مجموعه داده است. مجموعه داده ها در این حالت نمونه ای از جمعیت بزرگتر است و نتیجه گیری های حاصل از نمونه استنباط می شود تا برای جمعیت بزرگتر اعمال شود ، اما با عدم اطمینان ذاتی. تجزیه و تحلیل استنباطی هنگام انجام تحقیقات بازار ، به ویژه هنگام اندازه گیری اثرات یک کمپین بر روی نمونه ها ضروری است

برای تجزیه و تحلیل استنباطی ، مهمترین مرحله شامل فرآیند جمع آوری نمونه ، به نام نمونه گیری است ، زیرا نمونه باید نمایانگر جمعیتی باشد که نمونه از هرچه بیشتر از نزدیک گرفته شده است. این مهم است زیرا - بیشتر داده های جمع آوری زمان از کل جمعیت غیرممکن است

با توجه به تنوع آرایش احتمالی نمونه ها ، زرادخانه بزرگی از روشهای ریاضی و آماری تحت تجزیه و تحلیل استنباطی قرار می گیرد. استفاده آنها به دو روش انجام می شود:

  • برآورد پارامتر شامل محاسبه آمار نمونه برای برآورد پارامترهای جمعیت است.

برآورد پارامتر می تواند یک تخمین نقطه یا فاصله اطمینان باشد.

برآورد نقطه یک مقدار واحد است که نزدیکترین مقدار ممکن (از نظر نمونه داده شده) برای پارامتر است. برآورد نقطه به اندازه نمونه و کیفیت آن بستگی دارد. برای یک نمونه به اندازه کافی بزرگ ، برآورد نقطه برابر با پارامتری است که نشان می دهد.

فاصله اطمینان طیف وسیعی از مقادیر ممکن پارامتر در محدوده قابل قبول خطا است که توسط تحلیلگر یا محقق تعیین شده و بسته به کیفیت نمونه تنظیم شده است. برآورد نقطه در بازه اطمینان قرار می گیرد.

  • آزمایش فرضیه شامل آزمایش اعتبار اظهارات مربوط به جمعیت با تجزیه و تحلیل نمونه ها است. آزمایش فرضیه چهار مرحله اصلی دارد:

مرحله اول شامل تنظیم دو فرضیه است: فرضیه تهی یا این ادعا که هیچ ارتباطی بین دو یا چند متغیر وجود ندارد ، و فرضیه جایگزین یا این ادعا که یک متغیر بر متغیر دیگری تأثیر می گذارد. فرضیه ها را می توان از مرزهای داده شده تعیین کرد. شما اساساً با توجه به داده هایی که دارید ، به احتمال زیاد آزمایش می کنید که کدام یک از این دو به احتمال زیاد صحیح است.

مرحله دوم شامل تعیین سطح اهمیت است که معیار اصلی مورد استفاده در انتخاب فرضیه تهی یا فرضیه جایگزین است. سطح اهمیت همچنین میزان قابل قبولی از انحراف را که آمار مربوطه می تواند از همتای پارامتر خود داشته باشد ، تعیین می کند.

در مرحله سوم ، شما آمار آزمون را محاسبه می کنید. آمار آزمون مقداری است که ما به منظور تعیین اینکه کدام یک از دو فرضیه به احتمال زیاد صحیح است ، محاسبه خواهیم کرد. در مرحله چهارم ، ما از آمار آزمون برای انتخاب صحیح فرضیه تهی یا فرضیه جایگزین استفاده می کنیم.

این دو روش اصلی است که آمار استنباطی انجام می شود. استفاده از آنها بسته به سوال مورد نظر بسیار گسترده است.

تجزیه و تحلیل تشخیصی

از خود این کلمه ، تجزیه و تحلیل تشخیصی به دنبال این است که ببیند چه چیزی منجر به وقوع یک رویداد خاص شده است. غالباً ، کلمه "تشخیص" به معنای بررسی موارد اشتباه است - اما نیازی به محدود کردن فقط در حوادث منفی نیست. شما می توانید تجزیه و تحلیل تشخیصی را برای پیشرفت های غیر منتظره در عملکرد مشاغل خود اعمال کنید.

در حالی که شما می توانید از تجزیه و تحلیل استنباطی برای آزمایش روابط احتمالی بین دو یا چند متغیر استفاده کنید ، تجزیه و تحلیل تشخیصی نیاز به یک دید گسترده تر دارد ، به طور فعال به دنبال الگوهای و همبستگی های ممکن در مورد داده ها است که به دلایل احتمالی که باعث ایجاد یک رویداد خاص می شود ، می باشد. به گفته QuickStart ، ایجاد مجموعه ای از شاخص های کلیدی عملکرد (KPI) در تماشای روندها برای دیدن الگوهای و ناهنجاری های غیرمعمول بسیار مهم است ، که می تواند نشانگر یک رویداد قریب الوقوع یا مداوم باشد. برای کسب اطلاعات بیشتر در مورد KPIS اینجا را کلیک کنید.

مرحله 1: ناهنجاری ها را مشخص کنید. برخی از رویدادها و روندهای خاص ممکن است وقتی برای اولین بار به آنها نگاه می کنید معنی نداشته باشد. برای کشف شرایطی که باعث بروز آنها شده است ، باید این وقایع را تشخیص دهید.

مرحله 2: به داده ها بپردازید. همه داده ها برای تجزیه و تحلیل تشخیصی مفید نخواهند بود ، اما ممکن است مشخص نباشد که چه داده هایی به روشنایی علل ناهنجاری کمک می کند. برای انجام این کار ، تحلیلگر نه تنها باید به مجموعه داده های موجود نگاه کند بلکه مجموعه داده های خارجی را نیز در نظر بگیرد که یک ناهنجاری مشابه را توصیف می کند و می بیند که چگونه آنها به تشخیص ناهنجاری مشابه کمک می کنند. از اینجا ، داده های مربوطه قابل شناسایی است.

مرحله 3: تعیین روابط علی. سپس تکنیک های تجزیه و تحلیل داده ها می توانند به منظور کشف روابط پنهان که منجر به ناهنجاری می شود ، روی داده های مربوطه اعمال شود. از تکنیک های مختلف مانند تئوری احتمال ، تجزیه و تحلیل رگرسیون ، فیلتر و تجزیه و تحلیل داده های سری زمانی استفاده می شود.

تکنیک یا تکنیک های دقیق استفاده بستگی به رویداد داده شده دارد. یک مثال داده کاوی است. به گفته ویکی پدیا ، داده کاوی روشهای یادگیری ماشین ، آمار و مدیریت سیستم های پایگاه داده را به منظور استخراج الگوهای بین متغیرهای موجود در مجموعه داده ترکیب می کند. از آنجا که تجزیه و تحلیل تشخیصی اغلب در هنگام وقوع یک رویداد یا رفتار غیر منتظره اعمال می شود ، داده کاوی در کشف الگوهای قبلاً ناشناخته که به توضیح آنچه منجر به یک رویداد خاص می شود ، بسیار مهم است.

تجزیه و تحلیل پیش بینی کننده

از ابزارهای ریاضی و ابزارهای آماری نه تنها می توانند برای تجزیه و تحلیل گذشته و حال ، مانند انواع قبلی تجزیه و تحلیل ، بلکه برای دیدن آنچه که به احتمال زیاد در آینده اتفاق می افتد ، استفاده شود. اینجاست که تجزیه و تحلیل پیش بینی وارد تصویر می شود. با مقدار کافی داده ، می توان دید که ممکن است در آینده چه اتفاقی بیفتد.

موارد زیر برخی از کاربردهای متداول تجزیه و تحلیل پیش بینی کننده است:

  • کاهش خطر
  • پیش بینی رفتار مشتری
  • امکان تعیین قیمت های مطلوب
  • اولویت بندی سرب
  • هدف قرار دادن و تقسیم مشتری
  • تقویت کمپین های بازاریابی
  • تشخیص کلاهبرداری
  • بهبود عملیات

یکی از تکنیک های مورد استفاده در تجزیه و تحلیل پیش بینی ، تجزیه و تحلیل رگرسیون است. تجزیه و تحلیل رگرسیون یک روش آماری برای برآورد رابطه بین دو یا چند متغیر است. یکی از این متغیرها متغیر وابسته نامیده می شود و دیگری متغیر مستقل است. اغلب در نظر گرفته می شود که تغییر در متغیر مستقل منجر به تغییر در متغیر وابسته می شود. نتیجه تجزیه و تحلیل رگرسیون یک مدل به شکل یک معادله است.

رایج ترین و ساده ترین نوع تجزیه و تحلیل رگرسیون رگرسیون خطی است. رگرسیون خطی فرآیند تعیین و قرار دادن یک مدل خطی برای توصیف رابطه بین دو متغیر شرح داده شده در داده ها است. بیایید داده های زیر را در نظر بگیریم:

هنگامی که رگرسیون خطی را برای آن اعمال می کنید ، نتیجه گیری زیر را دریافت خواهید کرد:

برای هر سکه ای که دارید ، 0. 10 دلار دریافت می کنید.

این نمونه ای از یک مدل خطی است. مدل خطی افزایش یا کاهش متغیر وابسته را به افزایش یا کاهش متغیر مستقل مربوط می کند. به آن خطی گفته می شود زیرا میزان افزایش یا کاهش ثابت است.

می توانید از مدل خطی برای پیش بینی محتمل ترین مقدار با توجه به ورودی استفاده کنید. به عنوان مثال در بالا ، اگر 7 سکه دارید ، اطلاعاتی در مورد ارزش پول نداریم. برای دانستن مقدار مربوط به پول معادل آن ، می توانید از مدل خطی استفاده کنید. ارزش پول 7 سکه 7 * 0. 10 دلار = 0. 70 دلار است. می توانید آن را در مقادیر بالاتر اعمال کنید: اگر 20 سکه دارید ، پس از آن پولی که دارید 20 * 0. 10 دلار = 2. 00 دلار است.

برای کسب اطلاعات بیشتر در مورد تجزیه و تحلیل رگرسیون می توانید مقاله تازه سازی بازنگری هاروارد را بخوانید.

تجزیه و تحلیل تجویز شده

تجزیه و تحلیل تجویز نوع نهایی تجزیه و تحلیل است ، که به دنبال تجویز بهترین دوره عمل با استفاده از تمام داده ها و بینش های موجود ، با در نظر گرفتن عدم اطمینان ذاتی موجود در کلیه داده ها است. تجزیه و تحلیل تجویز اغلب گسترش تجزیه و تحلیل پیش بینی کننده است ، زیرا پیش بینی ها در رسیدن به بهترین دوره عمل مهم هستند. تجزیه و تحلیل تجویز از هوش مصنوعی ، یادگیری ماشین ، تشخیص الگوی و سایر ابزارهای پیشرفته برای تجزیه و تحلیل داده ها ، یافتن اقدامات ممکن و وزن گیری نتیجه هر عمل استفاده می کند ، بنابراین به کاربر تجزیه و تحلیل بهترین دوره عمل را می دهد.

یک نکته مهم در استفاده از تجزیه و تحلیل تجویز این است که می توان از آن به صورت غیر اخلاقی ، حتی به طور تصادفی استفاده کرد. بسته به وضعیت مورد نظر ، روشها به طور بالقوه می توانند انصاف و/یا حریم خصوصی را نقض کنند. والامیس نمونه ای از استفاده از تجزیه و تحلیل تجویز شده در داده های دانشجویی را ذکر می کند. روشهای فعلی تجزیه و تحلیل تجویز می تواند داده های دانشجویی را تفسیر کرده و در مورد موفقیت های آینده آنها پیش بینی کند. موضوعات اخلاقی پیرامون این وجود دارد. آیا دانش آموزان از این نوع استفاده از داده های خود رضایت دارند؟چه کسی به آن دسترسی دارد؟

Valamis پیشنهاد می کند ، راه حل ، یک استراتژی قوی مدیریت داده ها و یک فرآیند اعتبار سنجی برای مدلهای تجویز است. تجزیه و تحلیل پیش بینی امروز استراتژی حاکمیت داده ها را به عنوان یک روش تجاری برای تعریف نحوه نامگذاری ، ذخیره ، پردازش و به اشتراک گذاری داده ها تعریف می کند. مهم در حاکمیت داده ها مجموعه ای از مقررات است که نحوه برخورد داده ها توسط برنامه ها و کارمندان را اداره می کند. مجموعه مقررات نه تنها در کاغذ نوشته شده است بلکه باید با کد اجرا شود. سیستم حاصل باید داده ها را به راحتی در دسترس همه کاربران مجاز قرار دهد در حالی که اجازه نشت آن را به موارد غیرمجاز نمی دهد.

اعتبار سنجی یکی دیگر از فرایندهای مهم به ویژه برای مدلهای تجویز است. اعتبار سنجی تضمین می کند که مدل ها خروجی تولید می کنند که تا حد امکان به آنچه ممکن است در واقعیت رخ دهد نزدیک است. این کار با تغذیه داده های تاریخی و سپس بررسی خروجی مدل با نتایج واقعی انجام می شود. اگر خروجی مدل نزدیک به نتایج واقعی باشد ، به این معنی است که می توان به مدل ها اعتماد کرد تا همانطور که انتظار می رود کار کنند.

خلاصه

به طور خلاصه ، در اینجا پنج نوع تجزیه و تحلیل که می توانیم انجام دهیم وجود دارد:

  • تجزیه و تحلیل توصیفی ویژگی های اساسی داده های شما را توصیف می کند ، بدون اینکه هیچ گونه استنتاج و پیش بینی ای انجام شود.
  • تجزیه و تحلیل استنباطی با تجزیه و تحلیل یک نمونه مجموعه داده و سپس یافتن رابطه بین دو یا چند متغیر یک یا چند مجموعه داده مرتبط و/یا آزمایش فرضیه در مورد مجموعه داده ، در مورد جمعیت بزرگتر استنباط می کند.
  • تجزیه و تحلیل تشخیصی به دنبال کشف الگوهای و روابط قبلی ناشناخته است تا ببیند چه چیزی منجر به یک رویداد خاص شده است.
  • تجزیه و تحلیل پیش بینی کننده داده های موجود را از گذشته فرآیند می کند تا ببیند چه چیزی به احتمال زیاد در آینده اتفاق می افتد.
  • تجزیه و تحلیل تجویز با هدف تجویز بهترین دوره عمل با استفاده از تمام داده ها و بینش های موجود ، با در نظر گرفتن عدم اطمینان ذاتی موجود در کلیه داده ها.

انواع بیشتری از تجزیه و تحلیل وجود دارد ، اما پنج نوع داده شده ای که ما در مورد آنها بحث کردیم این است که یک تجارت باید برای تقویت رشد آنها انجام دهد.

شما می توانید با در نظر گرفتن برنامه ما Lido ، تمام موارد پیچیده ریاضی و آمار را که در همه این تحلیل ها درگیر است ، پرش کنید. نه تنها با چندین سیستم عامل تجارت الکترونیکی و بازاریابی ادغام می کند ، بلکه ابزارهای تجزیه و تحلیل خاص خود را نیز در اختیار شما قرار نمی دهد تا شما دردسر انجام مراحل طولانی ریاضی و آمار را انجام ندهید و در عوض به خط پایان تصمیم واقعی بروید-ساخت. علاقه مند؟ثبت نام رایگان.

آموزش تحلیل گری...
ما را در سایت آموزش تحلیل گری دنبال می کنید

برچسب : نویسنده : ملیکا زارعی بازدید : 33 تاريخ : پنجشنبه 14 ارديبهشت 1402 ساعت: 20:15