توی جلسات قبلی در مورد چیستی آمار و کاربردهاش صحبت کردیم. در مورد جمع آوری داده مفصل بحث کردیم و آمار توصیفی رو هم به صورت کاربردی راجع بهش صحبت کردیم. حالا رسیدیم به بحث آمار استنباطی.
گفتیم که به طور طبیعی، ما صرفا نمیخوایم داده ها رو شناسایی یا توصیف کنیم. بلکه مایلیم از این داده ها برای قضاوت در مورد گذشته یا پیش بینی آینده استفاده کنیم. یعنی مایلیم اون چیزی رو که به دست آوردیم به گروه های بزرگتر تعمیم بدیم و از این اطلاعاتی که جمع آوری کردیم، برای شناسایی بهتر دنیا استفاده کنیم. مثلا نظریاتی در مورد چگونگی کارکرد دنیا ارائه کنه. خب در همین راستا لازمه که مجهز به ابزارهای استنباطی در آمار باشیم.
اینکه این یه نقطه ضعف برای آماره یا نقطه قوت رو دقیق نمیشه گفت. ولی به هر حال استنباط آماری معمولا براساس آن چیزی که تا حالا اتفاق افتاده آینده رو پیش بینی میکنه. یعنی فرض میگیره که یه سری روندها توی داده ها ثابت و تکرار شونده هستند. خب این البته به وضوح با دنیای واقعی ما مطابقت نداره و هر چیزی یه شروع اولیه ای داره و پیش از اون اثری ازش نبوده. ولی خب بشر معمولا از داده های قبلی برای شناسایی دنیا استفاده میکنه.
بذارین اینطوری توضیح بدم. فرض کنید که ما یه سری داده به عنوان نمونه آماری جمع آوری کردیم و اون ها رو قالب یه اسکترپلات داریم توصیف میکنیم. یعنی هر نقطه نماینده یه فرد یا مورد مطالعه ست که محور افقی و عمودی هر کدوم در موردش اطلاعاتی رو ارائه میدن. حالا میخوایم در مورد روند تغییرات این داده ها صحبت کنیم. مثلا بفهمیم که تو جامعه آماری، اگه مولفه x داده مقدار مشخصی رو داشته باشه، مولفه y چه مقداری داره و برعکس.
خب بیاین اول ببینیم که چه حالت هایی ممکنه. یه حالت اول اینه که تغییر توی مولفه x داده، اصلا ربطی به تغییر تو مولفه y نداشته باشه. یعنی اینکه بدونیم مقدار مولفه x چقدره خیلی به ما تو پیش بینی مقدار مولفه y کمک نکنه. در این صورت میگیم میزان همبستگی دو مولفه صفره. مشابه این نمودار.
حالت دیگه ش اینه که اینا خیلی به هم ربط داشته باشن و رابطشون هم خطی باشه. یعنی مثلا هر چی مقدار x زیاد بشه، مقدار y هم زیاد بشه، یا برعکس، کم بشه. در این صورت میزان همبستگی دو مولفه به ترتیب یک و منفی یک ه. شبیه این دو نمودار. سمت چپی همبستگی نزدیک به یک رو نشون میده و سمت راستی نزدیک به منفی یک.
ممکنم هست که نه انقدر بی ارتباط باشن به هم و نه انقدر مرتبط. در این صورت مقدار همبستگی این دو مولفه یه چیزی بین منفی یک و یک میشه. شبیه این نمودار که به نظر میاد رابطه کلی منفی باشه، یعنی با زیاد شدن x تقریبا y کم میشه ولی انقدر هم دو مولفه در ارتباط نیستن که رابطشون منفی یک باشه.
حالت های دیگه هم هست. مثلا اینکه رابطه مولفه ها خطی نباشه. مثلا یه رابطه ای شبیه تابع درجه دوم یا توابع دیگه داشته باشن. در این صورت با اینکه مقدار همبستگی کم گزارش میشه، اما در واقع دو تا داده ارتباط زیادی با هم دارن. مثلا تو این نمودار به وضوح رابطه درجه دوم مشاهده میشه، در حالی که ممکنه همبستگی خیلی کم باشه.
یا مثلا ممکنه به اصطلاح داده ها خوشه ای باشن. یعنی توی چند بخش مختلف بشه با فرمول های ساده ای رابطه مولفه های x و y رو نشون داد.
خب. حالا فرض کنید که ما فهمیدیم که این دو مولفه یه همبستگی یا ارتباط با هم دارن. اونوقت نتیجش چیه؟ میتونیم بگیم یکیشون علت اون یکی هست؟
مثلا وقتی میبینیم تعداد کسایی که شب دیر میخوابن نوشابه مصرف میکنن، میتونیم نتیجه بگیریم که خوردن نوشابه باعث بی خوابی میشه؟ یه خرده بهش فکر کنید...
خب واقعیت اینه که جواب منفی ه. ما به دلایل مختلفی نمیتونیم بگیم که وجود ارتباط بین دو مولفه x و y به این معنیه که یکیشون علت اون یکیه. ممکنه هیچ کدوم علت اون یکی نباشن ولی رابطه به وضوح مشاهده بشه. دقت کنید که این مبنای خیلی از اشتباهات و کلک های آماریه.
یه حالت ساده اینه که یه عاملی وجود داشته باشه که باعث هر دوشون بشه. مثلا تو همین مثال نوشابه، آدم های افسرده معمولا هم مشکل خواب دارن و هم تمایلشون برای خوردن مواد قندی بیشتره. پس اون چیزی که عامل بدخوابی بوده، در واقع افسردگیه و نه خوردن نوشابه.
یا مثلا ممکنه جایی مشاهده بشه که زمانی که فروش بستنی افزایش پیدا میکنه، وبا هم بیشتر میشه. خب آیا از این میشه نتیجه گرفت که بستنی عامل افزایش وباست؟
این ادعا هم اگه دقت کنید میبینید که احتمالا اشتباهه. توی فصل تابستون، هم فروش بستنی افزایش پیدا میکنه و هم به خاطر گرمی هوا، شیوع بیماری وبا بیشتر میشه. پس در واقع دلیل هر دو اتفاق گرمای هوا بوده و اینا با هم رابطه علی نداشتن.
پس ما هر وقت میخوایم ببینیم رابطه دو متغیر با هم چیه یا در یه بیان دقیق تر، اثر تغییرات یه متغیر بر تغییرات یه متغیر دیگه چیه، باید اول بیایم تا حد امکان عواملی که روی هر دو تا موضوع تاثیر میذارن رو فهرست کنیم و اصلی ترین عامل ها رو پیدا کنیم. یعنی مثلا تو همین مثالی که گفتیم گرمای هوا عامل اصلی تریه از خوردن بستنی، چون باعث هر دو اتفاق شده، پس عامل رو فعلا گرم شدن هوا در نظر میگیریم. هی سعی میکنیم اصلی ترین عامل رو پیدا کنیم تا جایی که دیگه نتونیم عامل اصلی تری پیدا کنیم. در این حالت به اصطلاح متغیرهامون از هم مستقل هستن. یعنی تغییراتشون رو هم اثر معنی داری نمیذاره ولی همشون باعث تغییر متغیر مورد نظرمون میشن.
مثلا شیوع زیاد بیماری هم مهمه، ولی اینکه فاصله اون منطقه تا خط استوا و نصف النهار چقدره، هم میتونه کم و بیش نشون بده که دمای هوا توش چقدر گرمه و هم اینکه موقعیت جغرافیایی اون کشور رو نشون بده تا ببینیم تا ببینیم چقدر بیماری پیش رفته و به اون منطقه رسیده. پس شاید دو مولفه طول و عرض جغرافیایی باز عوامل اصلی تری باشن در این زمینه.
بعد از اون، وقتی همه این عوامل اصلی رو پیدا کردیم، اون موقع میتونیم با استفاده از راهکارهای نسبتا ساده ریاضی به اسم محاسبه رگرسیون و با استفاده از نرم افزارهایی که کارمون رو راحت میکنن، بسنجیم که واقعا هر عامل چقدر روی تغییرات مقدارهای یه متغیر تاثیرگذاره.
یعنی مثلا با محاسبه براساس داده هایی که داریم، میسنجه که مقدار طول جغرافیایی، عرض جغرافیایی و سایر متغیرهایی که موثرن رو متغیر اصلی مورد بررسیمون، یعنی میزان شیوع وبا، چقدر موثرن. یعنی یه واحد زیاد و کم شدن عرض جغرافیایی، یعنی یه واحد که رو نقشه حرکت کنیم، میزان شیوع وبا براساس داده هامون تقریبا چقدر عوض میشه. این به ما کمک میکنه که اگه یه نقطه جدید جغرافیایی هم معرفی شد، بتونیم بفهمیم که حدودا میزان شیوع وبا اونجا چقدره.
البته همونطور که پیش تر گفتیم ما به دنبال پیدا کردن جواب کاملا قطعی نیستیم و اصلا تو دنیای واقعی امکان این هم وجود نداره که جواب کاملا قطعی پیدا کنیم. به خاطر همین هر مدلی که ارائه بدیم حتما مقداری از عدم قطعیت رو داره و یعنی جواب رو حدودی بهمون میده. یعنی یه میزان قطعیتی داره که اون رو با متغیرهایی مثل p-value نمایش میدن. نمیخوایم خیلی وارد جزئیات بحث بشیم، فقط اینکه اینکه بدونید جواب این مدلسازی ها هم میتونه میزان هایی از عدم قطعیت رو به همراه خودش داشته باشه.
خب تا حالا گفتیم آمار استنباطی یکی از کاربری هایی که داره اینه که بهمون کمک کنه براساس اتفاق هایی که تو گذشته افتاده، آینده رو پیش بینی کنیم. که برای این کار باید از رگرسیون استفاده کنیم. اما آمار استنباطی همونطور که تو بخش اول گفته بودیم، یه کاربری دیگه هم داره و اون ارزیابی کارهای گذشته یا کارهاییه که میخوایم الان انجام بدیم.
مثلا فرض کنید میخوایم واکسن کرونا تزریق کنیم. یا به یه عده قبلا تزریق کردیم و میخوایم میزان اثرگذاریش رو بسنجیم. خب باید چی کار کنیم؟
یه راهکار خیلی معروفی که ازش استفاده هم شد اینه که افراد رو توی دو گروه در نظر بگیریم: گروه اثر و گروه کنترل یا شاهد. گروه اثر اون هایی هستن که واکسن رو بهشون تزریق میکنیم و گروه کنترل یا همون شاهد، اونایی هستن که واکسن رو دریافت نمیکنن.
برای اینکه تنها چیزی که روی تغییرات جسمی و علائم مردم اثر میذاره فقط واکسن باشه و اثر بقیه چیزها رو تو محاسبمون نیاریم، باید هر دو گروه رو تصادفی انتخاب کنیم. حتی بهتره در عین حال که به افراد میگیم قراره برای کارآیی واکسن مورد آزمایش قرار بگیرن، به خود این افراد نگیم که قراره واقعا واکسن بهشون تزریق بشه یا شبه دارو دریافت کنن. یعنی به همشون به ظاهر واکسن تزریق کنیم، در حالی که تو سرنگ برای گروه اثر مواد دارویی وجود داره و تو سرنگ گروه شاهد آب مقطر. این اثر تلقین کردن رو خنثی میکنه. مثلا ممکنه بعضی افراد از واکسن کلا بترسن و حتی اگه بهشون آب مقطر تزریق کنی، از فکر اینکه واکسن زدن تب کنن. خب برای اینکه اینجور چیزها تو نتایج پژوهش اثر نذاره این مدل پژوهش انتخاب میشه. البته بهتره در انتهای آزمایش حتما گروه کنترل هم واکسینه بشن.
در نهایت از مقایسه تغییرات جسمی گروه اثر و گروه شاهد معلوم میشه که اثر واقعی واکسن چقدر بوده. مثلا میزان ابتلای دو گروه به کرونا با هم مقایسه میشه و اگه گروهی که واکسن زدن به میزان معناداری کمتر از اون یکی گروه مبتلا شده بودن، گفته میشه که واکسن اثربخش بوده. به این روش میگن روش تفاضل در تفاضل.
این روش خیلی تو عرصه پزشکی برای ارزیابی فواید و آسیب های راهکارهای مختلف مفیده. مثلا برای ارزیابی اثر تشعشعات رادیویی یا لوازم آرایشی بهداشتی جدید روی افراد، آزمایش های مشابهی روی موش های آزمایشگاهی انجام میشه. یعنی یه گروهی به عنوان گروه شاهد کنار گذاشته میشه به صورت رندم و گروه اثر ماده مورد نظر رو دریافت میکنه و تفاوت این دو گروه تو عرصه های مختلف سنجیده میشه. تو سرطان زا بودن، تو وضعیت گوارش، درمان شدن و... دلیل اینکه این آزمایش ها روی انسان پیاده نمیشه اینه که به خاطر آسیب هایی که دارن، غیراخلاقی و غیرقانونی هستن.
برای ارزیابی محصول هم این روش خیلی کاربری داره. مثلا برای اینکه ببینیم چقدر وجود یه رنگ توی محصول باعث میشه اون محصول بیشتر خریداری بشه، به صورت رندم به بعضی از محصولات که تقریبا مشابهن اون رنگ رو بزنیم و به مخاطب ها عرضه کنیم. این هم یه جور ایجاد گروه شاهد و گروه اثره که تفاوت میزان استقبال از محصولات گروه اثر و گروه شاهد، نشون بده که وجود اون رنگ چقدر موثر بوده.
حالا بیاین یه راه دیگه ای رو مرور کنیم که بهمون کمک میکنه برای اینکه ببینیم یه برنامه ای که قبلا پیش گرفتیم یا میخوایم پیش بگیریم چه اثری میذاره. بهش میگن روش رگرسیون گسسته.
فرض کنید یه آزمون برگزار کردیم مثه که 100 نفر اول آزمون رو میفرستیم مدرسه تیزهوشان و بقیه رو میفرستیم مدارس دیگه. حالا میخوایم ببینیم که اثر تحصیل آدم ها توی مدرسه تیزهوشان چیه و چه فرقی با رفتن به مدارس دیگه داره. در واقع میخوایم بفهمیم افرادی که تو آزمون جزو 100 تای اول شدن، چون خودشون با استعداد بودن تونستن بعد از رفتن به مدرسه تیزهوشان کلی موفقیت به دست بیارن یا فضای این مدارس یه جوریه که هر کسی که بره اونجا موفق میشه.
برای محاسبه اثر رفتن به مدرسه تیزهوشان مستقل از اینکه افراد چقدر استعداد دارن، راهکاری که استفاده میشه اینه که مثلا بیاین 10 نفر رو در نظر بگیرن که کمترین نمره رو تو بین 100 نفر اول آوردن. یعنی آخرین ده نفری که مدرسه تیزهوشان قبول شدن. و از اون طرف هم 10 نفری رو در نظر بگیرین که بیشترین نمره رو تو بین قبول نشده ها داشتن. یعنی اولین ده نفری که مدرسه تیزهوشان قبول نشدن.
خب اینا رو میشه گفت از جهت نمره آزمون خیلی به هم نزدیک بودن. شاید فرقشون یکی دو تا تست باشه. یعنی نمیتونیم بگیم هوش و استعدادشون خیلی زیاد فرق داشته. بعد دستاوردهاشونو باید مقایسه کنیم. اگه خیلی فرق داشت، اون چیزی که باعث تفاوت شده رفتن و نرفتن به مدرسه تیزهوشانه که باید مقدار دقیقشو با محاسبات ریاضی دربیاریم. اگرم فرق زیادی نداشت، معنیش اینه که مدرسه تیزهوشان کار خاصی نمیکنه و بیشتر استعداد خود افراده که رو موفقیت هاشون اثر میذاره.
مثلا یه راهکار برای سنجش اثر ارائه یارانه به مردم، البته اگه یارانه ها رو براساس دهک بندی درآمدی بدیم، اینه که بعد از مدتی آخرین نفرات دهک پایین تر وضعیت زندگیشون چقدر در مقایسه با وضعیت زندگی اولین نفرات دهک بالاتر تغییر کرده. اون معمولا میتونه نشون دهنده اثر یارانه روی معیشت افراد باشه.
کلا روش RCT از یه بعد، نشون دهنده میزان عادلانه یا ناعادلانه بودن یه سیاسته. نشون میده که سوا کردن یه عده و اعمال یه سیاست خاص روش، چقدر توی تغییر مسیر اون افراد تاثیر داشته و چقدر در واقع از این طریق یه رانت ویژه ای براشون اعمال کردیم.
یه راه دیگه برای سنجش اثر یه برنامه ای که اجرا میکنیم اسمش هست روش تطابق یا مچینگ. فرض کنید ما اومدیم به دانش آموزای مدارس غیرانتفاعی برای جلوگیری از پوکی استخوان سهمیه شیر دادیم. و حالا میخوایم بسنجیم ببینیم این باعث بهبود سلامتی دانش آموزها شده یا نه.
خب چون ما این کارو قبلا انجام دادیم، بررسی اینکه اثر انجام این کار چی بوده سخت تره. مثلا ما نمیتونیم دیگه یه گروه شاهد در نظر بگیریم، چون همه دانش آموزای مدرسه غیرانتفاعی شیر خوردن. اما یه کاری که میتونیم بکنیم اینه که برای هر مدرسه غیرانتفاعی، مدرسه دولتی کنارشو در نظر بگیریم که از جهت امکانات و شرایط و آب و هوا و... وضعیتش خیلی نزدیکه به مدرسه غیرانتفاعی. یعنی بقیه چیزهایی که رو سلامتی اثر میذارن شبیه این مدرسست تقریبا و تنها فرقشون تو همین خوردن یا نخوردن شیره. اون وقت میتونیم با بررسی وضعیت سلامت بچه های این دو مدرسه، حتی توی سال های بعد، بفهمیم که اجرای این طرح چقدر تونسته موثر باشه. به این میگن روش تطابق. یعنی دو گروه که همه ویژگی هاشون شبیه همه با هم مقایسه میشن.
مثلا یکی از راه های سنجش اثر تشعشات اورانیومی همینه. که افرادی که تو مناطقی که منابع اورانیوم زیاده، طول عمر و کیفیت زندگیشون با افراد در منطقه مشابه چقدر تفاوت داره.
یا مثلا وقتی میخوایم ببینیم اثر اعطای وام کالا توی تغییر وضعیت معیشت افراد چیه، میتونیم افرادی که وضع زندگی و شرایط مشابهی داشتن و تنها تفاوتشون تو دریافت وام کالا بوده رو با هم مقایسه کنیم تا اثر دریافت این وام رو بفهمیم.
روش دیگه برای سنجش اثر اینکه چقدر کارمون اثرگذار بوده، بهش میگن آزمایش تصادفی کنترل شده یا RCT. این روش خیلی اوقات واسه کارهایی در نظر گرفته میشه که تکرار پذیر نیستن. یا خیلی امکان در نظر گرفتن گروه شاهد و گروه اثر وجود نداشته. مثلا سیاست یارانه های نقدی. یا مثلا انعقاد برجام رو در نظر بگیرین. فرض کنید میخوایم بسنجیم که اثر هر کدوم اینا روی وضعیت اقتصادی کشور چی بوده.
برای سنجش این کار میان با یه سری محاسبات ریاضی در نظر میگیرن که اگه این سیاست اجرا نمیشد چی میشد؟ یعنی فرض کنید وضعیت اقتصادی کشور تو یه خطی داشت ادامه پیدا میکرد و مثلا با استفاده از روش های آماری پیش بینی میشد که تو 5 سال بعدش هم تقریبا با همون روند ادامه پیدا کنه.
بعد یه اتفاقی افتاد مثل ارائه یارانه. خب چه اتفاقی افتاد؟ تو شاخص های مختلف، مثل GDP ، مثل ضریب جینی، مثل قدرت خرید مردم و... چه تغییری نسبت به اون پیش بینی ای که از روند عادی تغییرات اقتصادی وجود داشت به وجود اومد؟ البته با این فرض که همزمان با اون اتفاق خیلی اثرگذار دیگه ای نیفتاده. در این صورت میفهمن که اجرای اون سیاست چقدر اثر داشته.
البته بعضی از دانشمندای اقتصادی تو کشور ما به هیچ کدوم از این روش ها واقف نیستن و برای ادعاهایی مثل اینکه: اگه آمریکا از برجام خارج نمیشد و تحریم ها نبود، قیمت ارز روی 5000 تومن می موند، از هیچ کدوم از این روش های علمی استفاده نمیکنن. بیشتر سلیقه ای و بدون علم صحبت میکنن. ولی اینا رو جهت اطلاع شما میگیم که فریب این ادعاها رو نخورین.
خب اگه بخوایم از این بخش یه جمع بندی ای انجام بدیم، بعد از مرور اجمالی روش هایی که به ما کمک میکنن برای اینکه آینده رو پیش بینی کنیم، سراغ روش های رفتیم که به ما توی ارزیابی برنامه های گذشته کمک میکنن. از جمله اون ها روش تفاضل در تفاضل بود که از طریق کم کردن اثر اجرای سیاست بر گروه اثر و گروه شاهد، ما رو در مورد اثر کاری که انجام دادیم به نتیجه میرسوند. مثال استفاده ازش توی ارزیابی تاثیر واکسنه. روش بعدی اسمش رگرسیون گسسته بود که آخرین افراد گروه اثر رو با اولین افراد گروه شاهد مقایسه میکرد. به درد برنامه هایی میخوره که افراد رو به یه ترتیبی رتبه بندی میکنن و مثال استفاده ازش سنجش اثر ورود به مدرسه تیزهوشان بود. روش دیگه مچینگ یا تطابق بود که افرادی که در معرض سیاست بودن رو با کسایی که نبودن ولی شرایطشون خیلی شبیه همه مقایسه میکرد تا ببینه در درازمدت چه فرقی با هم دارن. مثالش هم توزیع شیر در مدارس بود. روش دیگه آزمایش تصادفی کنترل شده بود که میومد وضعیت اجرای سیاست رو با وضعیتی در صورت عدم اجرای سیاست پیش بینی میشد با هم مقایسه میکنه. نمونش سنجش اثر برجام یا ارائه یارانه نقدی در وضعیت اقتصادی کشور بود.
با وجود اینکه بحث های مربوط به آمار استنباطی خیلی گستردست و البته خیلی کاربردیه، و خیلی از مباحث توی درس هایی مثل اقتصاد سنجی یا آمار و احتمال پیشرفته به دانشجوها درس داده میشه، ولی ما سعی کردیم اون بخش هاییش که برای مخاطب های این برنامه کاربردی تره رو به زبون خیلی ساده و بدون پیچیدگی های ریاضی و محاسباتی بیان کنیم تا به کارتون بیاد.