دانلود پایان نامه ارشد: تدوین شاخصها و داشبورد ارزیابی و پیشبینی پیشرفت تحصیلی دانشجویان با شبکهعصبی و درختتصمیمC5 | ... | |
چکیده درک عواملی که منجر به موفقیت یا شکست در امتحانات مسئله ای جالب و چالش برانگیز است.مفاهیم مرتبط، تجزیه و تحلیل عوامل موفقیت در امتحانات، ممکن است به درک و به طور بالقوه به بهبود پیشرفت تحصیلی کمک کند.بنابراین در این پژوهش ضمن مروری کلی بر داده کاوی و ویژگی های اصلی یک داشبورد مدیریتی کارا، سعی بر این است تا یک مطالعه موردی بر روی پایگاه داده های دانشگاه های سراسری و آزاد استان قم صورت گیرد تا پیشرفت تحصیلی دانشجویان پیش بینی گردد. در این پژوهش ابتدا توسط الگوریتم k-means خوشه بندی صورت گرفته است و با بهره گرفتن از شاخص ارزیابی SSE ، تعداد خوشه بهینه تعیین گردیده است. بنابراین تعداد خوشه بهینه برای دانشجویان چهار خوشه می باشد و سپس خوشه ها با روش های پیش بینی داده کاوی از جمله شبکه عصبی و درخت تصمیم C5 که از پرکاربردترین و دقیق ترین روش های پیش بینی می باشند، پیش بینی شده اند و درنهایت با بهره گرفتن از نتایج این روش ها، شاخص های مناسب یافت شدند و به صورتی روشن در یک داشبورد نمایش داده شدند.
واژههای کلیدی:داده کاوی آموزشی، شبکه عصبی، خوشه بندی، درخت تصمیمC5، داشبورد.
فهرست مطالب فصل اول: 1 1-1-مقدمه. 2 1-2-تعریف مساله و بیان سوال های اصلی تحقیق. 3 1-3-ضرورت انجام تحقیق. 6 1-4-هدفها و کاربردهای مورد انتظار از انجام تحقیق. 7 1-5-جنبه جدید بودن و نوآوری طرح. 7 1-6-قلمرو مکانی و زمانی تحقیق. 8 1-7-روش تجزیه و تحلیل دادهها 8 1-8-ساختار تحقیق. 8 1-9-تعاریف و اصطلاحات.. 9 1-10-نتیجه گیری.. 12 فصل دوم: 122 2-1- مقدمه. 133 2-2-انگیزههای کاوش داده 13 2-3-نیاز به دادهکاوی.. 15 2-4- چالشهای دادهکاوی.. 16 2-4-1- چالشهای اولیه. 17 2-4-2- چالشهای ثانویه. 18 2-5-معرفی دادهکاوی.. 19 2-5-1-منشاُ علمی.. 21 2-5-2- معماری سیستم دادهکاوی.. 21 2-5-3- مراحل عملیات دادهکاوی.. 23 2-5-3-1-آمادهسازی داده 23 2-5-3-2-یادگیری مدل. 24 2-5-3-3-ارزیابی و تفسیر مدل. 25 2-6- محدودیتهای دادهکاوی.. 25 2-7- قابلیتهای دادهکاوی.. 26 2-8- روشهای یادگیری مدل در دادهکاوی.. 26 2-8-1- روشهای پیشبینی.. 26 2-8-1-1- دستهبندی.. 27 2-8-1-2- رگرسیون. 27 2-8-1-3-تشخیص انحراف.. 28 2-8-2- روشهای توصیفی.. 29 2-8-2-1- خوشهبندی.. 30 2-8-2-2- کشف قوانین انجمنی.. 32 2-8-2-3- کشف الگوهای ترتیبی.. 32 2-9- فنون دادهکاوی.. 32 2-9-1- یافتن خودکارخوشهها 34 2-9-1-1-نقاط قدرت این روش… 34 2-9-1-2-نقاط ضعف… 34 2-9-1-3- کاربرد. 34 2-9-2- درختهای تصمیمگیری و استقرا قاعدهای.. 35 2-9-2-1-نقاط قوت.. 35 2-9-2-2-نقاط ضعف روش درختتصمیمگیری.. 35 2-9-2-3-کاربرد. 36 2-9-3- شبکههای عصبی.. 36 2-9-3-1- نقاط قوت شبکههای عصبی مصنوعی.. 36 2-9-3-2- نقاط ضعف شبکهعصبی.. 37 2-9-3-3-کاربرد. 37 2-10- درجهبندی فنون مختلف دادهکاوی از جهت سختی و آسانی.. 37 2-11-تعریف داشبورد. 38 2-12- سابقه تحقیق. 43 2-12-1- سابقه دادهکاوی.. 43 2-12-2- سابقه داشبورد. 47 2-13 بررسی مراحل داشبورد در چند نمونه. 49 2-14-نتیجه گیری.. 50 فصل سوم: 51 3-1- مقدمه. 52 3-2- چارچوب تحقیق. 53 3-3- روش تحقیق. 54 3-3-1- طبقهبندی تحقیق برمبنای هدف.. 54 3-3-2- طبقه بندی تحقیق بر مبنای روش… 54 3-3-3- طبقهبندی تحقیق بر مبنای نوع دادهها 55 3-4- جامعه آماری.. 55 3-5- نمونهگیری.. 56 3-5-1- روش نمونهگیری.. 56 3-6- روش ها و ابزار گردآوری و تحلیل دادهها 56 3-7- ساختار اجرایی تحقیق. 57 3-7-1- ساختار اجرایی بخش اول تحقیق. 58 3-7-1-1- درک مساله. 59 3-7-1-2- شناخت دادهها 60 3-7-1-3- آماده سازی دادهها 61 3-7-1-4- مدلسازی.. 61 3-7-1-5- ارزیابی نتایج. 62 3-7-1-6- بکارگیری مدل. 62 3-8- تحلیل خوشهای.. 63 3-9- الگوریتم k-means. 64 3-10-شبکهعصبی.. 65 3-10-1- معماری شبکه. 66 3-11-درختتصمیم. 67 3-12- شاخص مقایسه نتایج خوشهبندی با رویکردهای مختلف… 69 3-12-1- شاخص مجموع خطای مربعی.. 69 3-13- ابزارهای دادهکاوی.. 69 3-14- بخش دوم ساختار اجرایی تحقیق. 70 3-14-1- شناسایی شاخص… 70 3-14-2- پیادهسازی داشبورد. 70 3-15- ابزار پیادهسازی داشبورد. 71 3-16- نتیجهگیری.. 71 فصل چهارم: 73 4-1-مقدمه. 74 4-2-فرآیند دادهکاوی.. 74 4-2-1-درک مساله. 74 4-2-2-شناخت دادهها 75 4-2-2-1- دادهها 75 4-2-2-2- انتخاب دادهها 75 4-2-3- آماده سازی و پیش پردازش دادهها 76 4-2-3-1- آماده سازی دادهها 76 4-2-3-2-پیش پردازش دادهها 77 4-2-4-مدلسازی.. 82 4-2-4-1-خوشهبندی.. 83 4-2-4-2- خوشهبندی k-means. 83 4-2-4-3- پیشبینی خوشهها 84 4-2-4-4- پیشبینی با شبکهعصبی.. 85 4-2-4-5- پیشبینی با درختتصمیم C5. 85 4-2-5- ارزیابی.. 88 4-2-6- بهکارگیری مدل. 89 4-3- فرآیند طراحی و پیادهسازی داشبورد. 89 4-3-1- شناسایی شاخص… 89 4-4- نتیجهگیری.. 93 فصل پنجم: 94 5-1- مقدمه. 95 5-2- مروری برفصلهای گذشته. 95 5-3- دستاوردها و نوآوریهای تحقیق. 96 5-4- پیشنهادات برای تحقیقهای آتی.. 97 5-5- محدودیتهای تحقیق. 98 فهرست منابع. 99
فهرست جداول جدول2-1 درجهبندی فنون مختلف دادهکاوی.. 38 جدول 2-2 تعاریف داشبورد در مرور ادبیات.. 38 جدول 2-3 مراحل طراحی داشبورد. 49 جدول3-1 الگوریتم خوشهبندی.. 65 جدول 4-1 اقلام اطلاعات فردی دانشجویان. 78 جدول 4-2 اقلام اطلاعاتی معدل دانشجویان. 79 جدول 4-3 اقلام اطلاعاتی دانشگاهی دانشجویان. 79 جدول 4-4 نرخ پارامتر SSE به ازای تعداد خوشهها در k-means. 84 جدول 4-5 پیش بینی با بهره گرفتن از روش شبکهعصبی.. 85 جدول 4-6 دستهبندی معدلها 86 جدول 4-7 پیش بینی با بهره گرفتن از روش درخت تصمیمC5. 87 جدول 5-1 دقت پیشبینیهای انجام شده 97
فهرست شکلها و نمودارها شکل 1-1-ساختار تحقیق.. 9 شکل2-1: قیاس رشد حجم داده با رشد تعداد تحلیلگران داده 15 شکل 2-2 سلسله مراتب داده تا خرد. 20 شکل 2-3 معماری یک سیستم دادهکاوی.. 22 شکل 2-4 ساختار دادهکاوی آموزشی.. 44 شکل 3-1 مراحل اصلی پیشنهادی برای اجرای تحقیق. 53 شکل 3-2 استاندارد جهانی CRISP. 59 شکل 4-1 بخشی از ارتباط دادهای جداول. 77 نمودار 4-1 میزان استفاده تکنیکهای پیشپردازش داده 81 شکل 4-2بخشی از دادهها در نرمافزار Excel 82 شکل 4-3 تعداد رکوردها در هر خوشه. 84 شکل 4-5 اهمیت فیلدها در پیشبینی معدل ترم شش دانشجویان. 88 شکل4-6 پیشرفت تحصیلی دانشجویان ورودی سال 1371. 91 شکل4-7 پیشرفت تحصیلی دانشجویان ورودی سال 1381. 91 شکل 4-8 پیش بینی پیشرفت تحصیلی دانشجویان فاقد شغل ورودی سال 1381. 92 شکل 4-9 پیشبینی پیشرفت تحصیلی دانشجویان شاغل در سازمانهای دولتی ورودی سال 1381 93
فصل اول:
1-1-مقدمه
[جمعه 1398-07-12] [ 03:39:00 ب.ظ ]
لینک ثابت
|