یکی از سوالاتی که دانشجویان محترم همواره مطرح کردهاند در مورد انجام پایان نامه با موضوعات دادهکاوی، علم داده یا کلان داده بوده است. در این پست راجع به انتخاب موضوع صحبت میکنم. در مورد اهمیت انتخاب موضوع برای پژوهشگر میتوانید به کتابهای روش تحقیق مراجعه کنید. در اینجا قصد تکرار آن مطالب را ندارم و به بیان نکات مربوط به پژوهشهای کمی بسنده میکنم.
زمان انتخاب موضوع به نکات زیر توجه فرمایید:
1- مطمئن شوید که دادههای مورد نظر را در اختیار دارید. برای مثال اگر قرار است در صنعت بانک یا بیمه یا در درمان سرطان فعالیت کنید ابتدا با سازمانهای مرتبط صحبت کنید و مطمئن شوید که این دادهها را در اختیار شما قرارخواهند داد. در غیر این صورت نمیتوانید پژوهشی کمی انجام دهید. پیش نیاز انجام این مرحله این است که بدانید چه میخواهید. بنابراین پیش از آن باید مطالعه کافی داشته باشید و موضوع پژوهش و ورودیهای مورد نیاز آن را بدانید.
2- مطمئن شوید که به متخصصی که دادهها را بشناسد دسترسی دارید. اگر دادهها را در اخیار شما قرار دهند ولی با دادهها آشنایی نداشته باشید مثلا تعریف متغیرها را ندانید یا چگونگی ارتباط جداول مختلف برای شما روشن نباشد قادر به تحلیل داده نخواهید بود. بنابراین از همان ابتدا از آن سازمان بخواهید که فرد متخصصی را برای همکاری معرفی کند.
3- مطمئن شوید که دادههای مورد نظر برای تحلیل شما مناسب هستند. پیشنهاد میشود قبل از ارائه پروپوزال یک مدل آزمایشی با دادههای تستی بسازید و الگوریتم مورد نظر را روی آن اعمال کنید. به دلایل بسیار زیادی ممکن است انجام پژوهش مورد نظر شما امکانپذیر نباشد. ممکن است دادهها کیفیت لازم یا ساختار مورد نظر شما را نداشته باشند و پژوهش شما عملی نباشد. در این صورت ممکن است ناگزیر شوید که موضوع خود را تغییر دهید که این کار دردسرهای خاص خود را خواهد داشت. بنابراین حتما قبل از ارسال پروپوزال این موارد را چک کنید. اگر دادهها از طریق پرسشنامه جمعآوری میشوند به همین ترتیب پرسشنامه را طراحی کنید، دادههای تستی را وارد کنید الگوریتم موردنظر را روی آن اعمال کنید تا مطمئن شوید پرسشنامه طراحی شده دادهها را با ساختار مناسب جمعآوری میکند در غیر این صورت ممکن است کل فرایند طراحی پرسشنامه و جمع آوری دادهها بیهوده باشد. زمانی که پروپوزال به دانشگاه ارائه میکنید در واقع سندی ارائه میکنید که بررسی کردهاید موضوع پژوهش انجامشدنی است. بنابراین در این مورد دقت کافی را داشته باشید.
4- یکی از رویههای اشتباهی که دانشجویان و گاهی اساتید طی میکنند انجام تحقیق به روش معکوس است یعنی به جای انتخاب یک مساله و تلاش برای حل آن قصد دارند یک روش یا الگوریتم را بهبود دهند. این افراد بعد از انجام کار تئوری به دنبال داده میگردند تا درستی ادعایشان را ثابت کند. این روش بیمعناست. چون بهبود زمانی که مسالهای وجود ندارد معنی ندارد. بنابراین در انجام پژوهش باید بر حل مساله تمرکز کنید نه اثبات بهتر بودن الگوریتمی که نوشتهاید یا روشی که ارائه کردهاید.
5- دانشجویان همیشه سوال میکنند که موضوعات روز چیست و کار کردن روی چه موضوعاتی سودمند است. در پاسخ به این سوال باید گفت در هر زمینهای که شما علاقهمند باشید. در بسیاری از علوم و صنایع زمان زیادی نیست که داده در اختیار داریم. بنابراین در تمامی زمینهها جای کار بسیار وجود دارد. در پژوهشهای کمی موضوع پیشپاافتاده یا بیارزش نداریم. بنابراین برای انتخاب موضوع کافیست صنعت یا علم یا موضوع مورد نظر خود را بررسی کنید و ببینید چه کارهایی در این زمینه انجام شده است. انتخاب موضوع خیلی جدید یا خیلی شیک به خودی خود باعث ارزشمند بودن کار شما نمیشود و شانس انتشار مقاله حاصل از پژوهش را بالاتر نمیبرد.
6- یکی از سوالهای دیگری که همیشه مطرح میشود این است که میخواهیم روشی که کار میکنیم جدید باشد تا بتوانیم آن را به عنوان یک مقاله ارائه کنیم. چه باید بکنیم؟ پاسخ این سوال این است که قبل از تحلیل دادهها پاسخ به این سوال غیرممکن است. میتوانید در کارهای قبلی روشهای پژوهشگران را بررسی کنید ولی این که دادههای مورد نظر الگوریتم جدیدی لازم داشته باشند، تا قبل از بررسی دادهها غیرممکن است. توجه داشته باشید که هدف یک پژوهش پاسخگویی به سوال یک تحقیق است نه زمینهسازی برای ارائه یک روش جدید. برای مثال اگر دادههای شما با روش رگرسیون خطی معمولی مدلسازی شوند، دادهها پیشفرضهای لازم را داشته باشند و مطمئن باشید که رابطه بین متغیرهای مستقل و متغیر وابسته خطی است، منطقی نیست که روش جدیدی برای این کار ارائه دهید مگر این که روش جدید رابطه بین متغیرهای مدل شما را بهتر توصیف کند. باز توجه شما را به این نکته جلب می کنم که هدف پژوهش پاسخگویی به سوال پژوهش است چه خروجی آن (مقاله) قابلیت انتشار داشته باشد چه خیر. توجه بیش از حد به نگارش مقاله باعث شده است که بسیاری از افراد انجام پژوهش (فرایند) را با گزارش خروجی آن (مقاله) اشتباه بگیرند.
7- مورد دیگری که باید در زمان انتخاب موضوع مدنظر داشته باشید پیشنیازهای انجام آن پژوهش است. این موضوعی است که بسیاری از دانشجویان محترم به آن توجه نمیکنند. این موضوع را میتوانید با اساتید در میان بگذارید و از آنها راهنمایی بگیرید. اگر پژوهش شما نیاز به یادگیری برنامهنویسی یا آمار یا یادگیری ماشینی دارد لازم است که قبل از انجام پژوهش آن را فرابگیرید. کار کردن با داده را نمیتوانید با سوال کردن از افراد مختلف پیشببرید. افراد متخصص میتوانند پیشنهادهای خوبی ارائه دهند ولی تا شخص با دادهها کار نکرده باشد نمیتواند راهنمای گام به گام به شما ارائه دهد. بنابراین در طول دوران تحصیل خود این موضوع را مدنظر داشته باشید. میتوانید با راهنمایی اساتید کلاسهای درسی را که برای انجام پژوهش لازم دارید، بگذرانید تا زمینه لازم برای ایجاد پژوهش مورد نظرتان را داشته باشید. درنظر نگرفتن این موضوع باعث میشود فرایند پژوهش و تدوین پایاننامه به فرایندی بیهدف، سردرگم و ناخوشایند تبدیل شود.
8- یکی از مسائل دیگری که در این زمان مطرح میشود این است که دانشجویان زمان کافی برای یادگیری موضوع پژوهش اختصاص ندادهاند. توجه داشته باشید که یادگیری با خواندن مقالات 2015 و 2016 حاصل نمیشود. یادگیری نیازمند زمانی است که با آرامش یک موضوع را یاد بگیرید، تمرین کنید و بکار بگیرید. اگر یک موضوع را نشناسید خواندن مقالات مختلف و جستجو در اینترنت نه تنها چیزی به شما یاد نخواهد داد، بلکه بیشتر باعث سردرگمی و اغتشاش فکری خواهد شد. بنابراین باید زمان کافی را به یادگیری موضوع مورد نظر (مساله پژوهش یا روشهای کمی) اختصاص دهید که در آن بدون عجله و آشفتگی موضوع را فرابگیرید.