فرمت فایل:doc
تعداد صفحات: 130
فهرست مطالب
بخش اول آشنایی با مفهوم داده کاوی.. 1
فصل اول معرفی و آشنایی با مفاهیم اولیه. 2
مقدمه. 2
1-1 عناصر داده کاوی.. 8
1-2 فنون داده کاوی.. 9
پردازش تحلیلی پیوسته: 9
درختان تصمیم گیری: 9
قوانین وابستگی: 10
شبکه های عصبی : 10
الگوریتم ژنتیکی: 10
نرم افزار. 10
1-3 کاربردهای داده کاوی.. 11
1-3-1 داده کاوی و کاربرد آن در کسب و کار هوشمند بانک.... 12
1-3-2 داده کاوی درمدیریت ارتباط بامشتری.. 13
1-3-3 کاربردهای داده کاوی در کتابخانه ها و محیط های دانشگاهی.. 14
مدیریت موسسات دانشگاهی.. 15
محدودیت ها 16
1-3-4 داده کاوی آماری و مدیریت بهینه وب سایت ها 16
1-4 داده کاوی در مقابل پایگاه داده. 17
1-5 ابزارهای تجاری داده کاوی.. 18
1-6 منابع اطلاعاتی مورد استفاده. 19
1-6-1 انبار داده. 19
فصل دوم مسائل کسب و کار برای دادهکاوی.. 20
2-1 مسائل کسب و کار برای دادهکاوی.. 20
2-2 چرخه تعالی داده کاوی چیست؟. 22
2-2-1 تعیین فرصتهای کسبوکار و تجارت... 23
2-2-2 مشکلات در راه کسب توانایی استفاده از نتایج داده کاوی.. 23
2-2-3 انجام عمل.. 24
2-2-4 اندازه گیری نتایج.. 24
2-3 متدلوژی دادهکاوی و بهترین تمرینهای آن.. 25
2-3-1 چرا یک متدلوژی داشته باشیم؟. 25
یادگیری چیزهایی که درست نیستند.. 26
الگوهایی که ممکن است هیچ قانون اصولی را ارائه نکنند.. 26
چیدمان مدل ممکن است بازتاب دهنده جمعیت وابسته نباشد.. 27
2-3-2- یادگیری چیزهایی که درست ولی بلااستفادهاند.. 29
2-4 مدلها، پروفایلسازی، و پیشبینی.. 30
2-4-1 پروفایلسازی.. 32
2-4-2 پیش بینی.. 33
2-5 متدلوژی.. 33
مرحله 1: تبدیل مسئله کسب و کار به مسئله دادهکاوی.. 34
مرحله 2: انتخاب داده مناسب... 35
مرحله سوم: پیش به سوی شناخت داده. 38
مرحله چهارم: ساختن یک مجموعه مدل.. 39
مرحله پنجم: تثبیت مسئله با دادهها 41
مرحله ششم: تبدیل داده برای آوردن اطلاعات به سطح.. 42
مرحله هفتم: ساختن مدلها 45
مرحله هشتم: ارزیابی مدل ها 45
مرحله نهم: استقرار مدل ها 48
مرحله 10: ارزیابی نتایج.. 48
مرحله یازدهم: شروع دوباره. 48
فصل سوم وظایف دادهکاوی.. 49
1- دستهبندی.. 50
2- خوشهبندی.. 50
3- تخمین.. 51
4- وابستگی.. 52
5- رگرسیون.. 53
6- پیشگویی.. 54
7- تحلیل توالی.. 54
8- تحلیل انحراف... 55
9- نمایهسازی.. 55
بخش دوم داده کاوی در تجارت الکترونیک... 57
فصل اول مقدمه ای بر تجارت الکترونیکی.. 58
1-1- طبقههای مختلف تجارت الکترونیکی.. 60
1-1-1- سازمانهای تجاری یا مصرفکنندگان (B2C). 60
1-1-2- تجارت الکترونیکی مصرفکننده با مصرفکننده (C2C). 61
1-1-3- تجارت الکترونیک مصرفکننده با سازمان تجاری.. 61
1-2- تفاوت تجارت الکترونیکی با تجارت سنتی.. 61
1-3- ارتباط با مشتری از طریق ابزارهای الکترونیکی.. 62
1-4- نقش دولت در تجارت الکترونیک.... 63
فصل دوم شکل دهی موقعیت بازار. 64
2-1- چار چوبی برای تحلیل موقعیت بازار. 65
2-1-1- پرورش موقعیت : 65
2-1-2 -کشف هسته اصلی موقعیت : 66
2-1-3- شناسایی مشتریان هدف : 66
2-1-4- مطالعه توانمندیها و منابع شرکت : 66
2-1-5- اندازه گیری جذابیت موقیت : 66
2-2- ویژگی های تحلیل موقعیت بازار در اقتصاد جدید: 67
2-2-1- رقابت بین مرزهای اتفاق می افتد نه درون مرزهای صنعت: 67
2-2-2- اقدامات رقابتی و واکنش ها با سرعت بی سابقه ایی رخ مید هند: 67
2-2-3- رقابت بین ائتلاف شرکت ها رخ میدهد نه به تنهایی: 68
2-2-4- تاثیر گزاری و تغییر رفتار مشتریان ازحالت سنتی ساده تر است: 68
2-2-5- زنجیره ی ارزش ( value chain). 68
2-3- دو نوع ارزش ( value type ) عمده. 69
2-3-1 - ارزش های در بند.. 70
2-3-2- ارزش های جدید ( New-To-The-World value ) : 70
2-4- شناسایی نیاز های برآورده شده و برآورده نشده. 72
2-4-1 فرآیند تصمیم گیری مشتری.. 72
2-4-2- آشکارسازی نیازهای برآورده شده و برآورده نشده. 73
2-5- تعیین مشتریان ویژهای که شرکت قصد متقاعد کردن آنهارا دارد. 74
2-5-1- روشهایی برای تقسم بندی بازار: 75
2-5-2- تقسیم بندی قابل اجرا و معنی دار. 76
تقسیم بندی قابل اجرا(Actionable Segmentation). 76
تقسیم بندی معنی دار. 76
2-5-3- ترکیب مناسبی از متغیر ها 77
2-5-4-تناظر بازار و مشتریان هدف... 78
2-6- تأمین منابع.. 79
2-6-1- منابع شرکت : 79
2-6-2- شرکاﺀ : 80
2-7- جذابیت یک موقعیت : 81
2-7-1- شدت رقابت... 81
2-7-2- پویایی های مربوط با مشتریان : 82
2-7-3- فناوری : 83
2-7-4- سود دهی مالی : 84
2-8- ارزیابی نهایی(go/No-go). 85
مدلهای کسب و کار. 85
2-9- مدلهای سوددهی برای شرکتهای آنلاین چه هستند؟. 92
2-9-1- مدلهای سوددهی مورد توجه سهام داران. 92
2-9-2- مدلهای مبتنی بر کاربر و شرکت: 93
2-9-3- مدلهای مبتنی بر خلق ارزش توسط شرکت: 94
2-10- واسط مشتری.. 97
2-10-1- هفت عنصر طراحی برای واسط مشتری.. 97
2-10-2- چه چیز تعیین کننده جلوه یک وب سایت است؟. 100
2-10-3- محتویات وب سایت... 103
2-10-4- تشکل ها در سایت... 105
2-10-5- اهرمهای مورد استفاده برای سفارشی کردن یک سایت... 109
2-10-6- یک سایت چگونه با مشتریان خود ارتباط بر قرار می کند؟. 111
2-10-7- اتصال یک وب سایت با وب سایتهای دیگر. 113
2-10-8- اشکال مختلف تجارت در وب سایت... 115
2-11- تبادل الکترونیکی داده ها (EDI). 117
1- انواع خرید یک شرکت... 117
2- خرید مواد مستقیم.. 117
3- تبادل الکترونیکی داده ها (EDI) 118
4- EDI های نسل آینده. 119
منابع..
121
مقدمه
از هنگامی که رایانه در تحلیل و ذخیره سازی داده ها بکار رفت (1950) پس از حدود 20 سال، حجم داده ها در پایگاه داده ها دو برابر شد. ولی پس از گذشت دو دهه و همزمان با پیشرفت فن آوری اطلاعات(IT) هر دو سال یکبار حجم داده ها، دو برابر شده و همچنین تعداد پایگاه داده ها با سرعت بیشتری رشد نمود. این در حالی است که تعداد متخصصین تحلیل داده ها با این سرعت رشد نکرد. حتی اگر چنین امری اتفاق می افتاد، بسیاری از پایگاه داده ها چنان گسترش یافتهاند که شامل چندصد میلیون یا چندصد میلیارد رکورد ثبت شده هستند.امکان تحلیل و استخراج اطلاعات با روش های معمول آماری از دل انبوه داده ها مستلزم چند روز کار با رایانه های موجود است.[3]
حال با وجود سیستم های یکپارچه اطلاعاتی، سیستم های یکپارچه بانکی و تجارت الکترونیک، لحظه به لحظه به حجم داده ها در پایگاه داده های مربوط اضافه شده و باعث به وجود آمدن حانبارهای عظیمی از داده ها شده است.
این واقعیت، ضرورت کشف و استخراج سریع و دقیق دانش از این پایگاه داده ها را بیش از پیش نمایان کرده است، چنان که در عصر حاضر گفته می شود اطلاعات طلاست.
هم اکنون در هر کشور، سازمان، شرکت و غیره برای امور بازرگانی، پرسنلی، آموزشی، آماری و غیره پایگاه داده ها ایجاد یا خریداری شده است. به طوری که این پایگاه داده ها برای مدیران، برنامه ریزان، پژوهشگران جهت، تصمیم گیری های راهبردی، تهیه گزارش های مختلف، توصیف وضعیت جاری خود و سایر اهداف می تواند مفید باشد. بسیاری از این داده ها از نرم افزارهای تجاری، مثل کاربردهای مالی، ERPها، CRMها و web log ها، می آیند.
نتیجه این جمع آوری داده ها این میشود که در سازمانها، داده ها غنی ولی دانش ضعیف، است. جمع آوری داده ها، بسیار انبوه میشود و بسرعت اندازه آن افزایش می یابد و استفاده عملی از داده ها را محدود می سازد.[2] دادهکاوی استخراج و تحلیل مقدار زیادی داده بمنظور کشف قوانین و الگوهای معنی دار در آنهاست.
هدف اصلی داده کاوی، استخراج الگوهایی از داده ها، افزایش ارزش اصلی آنها و انتقال داده ها بصورت دانش است.
دادهکاوی، بهمراه OLAP، گزارشگری تشکیلات اقتصادی(Enterprise reporting) و ETL، یک عضو کلیدی در خانواده محصول Business Intelligence(BI)، است.[2]
حوزههای مختلفی وجود دارد که در آنها حجم بسیاری از داده در پایگاهدادههای متمرکز یا توزیع شده ذخیره میشود. برخی از آنها به قرار زیر هستند: [6]
کتابخانه دیجیتال: یک مجموعه سازماندهی شده از اطلاعات دیجیتال که بصورت متن در پایگاهدادههای بزرگی ذخیره می شوند.آرشیو تصویر: شامل پایگاهداده بزرگی از تصاویر به شکل خام یا فشرده.اطلاعات زیستی: بدن هر انسانی از 50 تا 100 هزار نوع ژن یا پروتئین مختلف ساخته شده است. اطلاعات زیستی شامل تحلیل و تفسیر این حجم عظیم داده ذخیره شده در پایگاهداده بزرگی از ژنهاست.تصاویر پزشکی: روزانه حجم وسیعی از دادههای پزشکی به شکل تصاویر دیجیتال تولید میشوند، مانند EKG، MRI، ACT، SCAN و غیره. اینها در پایگاهدادههای بزرگی در سیستمهای مدیریت پزشکی ذخیره می شوند. مراقبتهای پزشکی: بجز اطلاعات بالا، یکسری اطلاعات پزشکی دیگری نیز روزانه ذخیره میشود مانند سوابق پزشکی بیماران، اطلاعات بیمه درمانی، اطلاعات بیماران خاص و غیره. اطلاعات مالی و سرمایهگذاری: این اطلاعات دامنه بزرگی از دادهها هستند که برای دادهکاوی بسیار مطلوب میباشند. از این قبیل دادهها میتوان از دادههای مربوط به سهام، امور بانکی، اطلاعات وامها، کارتهای اعتباری، اطلاعات کارتهای ATM، و کشف کلاهبرداریها می باشد.ساخت و تولید: حجم زیادی از این دادهها روزانه به اشکال مختلفی در کارخانهها تولید میشود. ذخیره و دسترسی کارا به این دادهها و تحلیل آنها برای صنعت تولید بسیار بااهمیت است.کسب و کار و بازاریابی: داده لازم است برای پیشبینی فروش، طراحی کسب و کار، رفتار بازرایابی، و غیره.شبکه راهدور: انواع مختلفی از دادهها در این صنعت تولید و ذخیره می شوند. آنها برای تحلیل الگوهای مکالمات، دنبال کردن تماسها، مدیریت شبکه، کنترل تراکم، کنترل خطا و غیره، استفاده میشوند.حوزه علوم: این حوزه شامل مشاهدات نجومی، داده زیستی، داده ژنومیک، و غیره است.WWW: یک حجم وسیع از انواع مختلف داده که در هر جایی از اینترنت پخش شدهاند.در بیشتر این حوزهها، تحلیل دادهها یک روال دستی بود. یک تحلیلگر کسی بود که با دادهها بسیار آشنا بود و با کمک روشهای آماری، خلاصههایی تهیه و گزارشاتی را تولید میکرد. در یک حالت پیشرفتهتر، از یک پردازنده پیچیده پرسش استفاده میشد. اما این روشها با افزایش حجم دادهها کاملا بلااستفاده شدند.
واژه های «دادهکاوی» و «کشف دانش در پایگاه داده»[1] اغلب به صورت مترادف یکدیگر مورد استفاده قرار می گیرند. کشف دانش به عنوان یک فرآیند در شکل1 نشان داده شده است.
کشف دانش در پایگاه داده فرایند شناسایی درست، ساده، مفید، و نهایتا الگوها و مدلهای قابل فهم در داده ها میباشد. دادهکاوی، مرحلهای از فرایند کشف دانش میباشد و شامل الگوریتمهای مخصوص دادهکاوی است، بطوریکه، تحت محدودیتهای مؤثر محاسباتی قابل قبول، الگوها و یا مدلها را در داده کشف می کند[3Error! Reference source not found.]. به بیان سادهتر، دادهکاوی به فرایند استخراج دانش ناشناخته، درست، و بالقوه مفید از داده اطلاق میشود.
تعریف دیگر اینست که، دادهکاوی گونهای از تکنیکها برای شناسایی اطلاعات و یا دانش تصمیمگیری از قطعات داده میباشد، به نحوی که با استخراج آنها، در حوزههای تصمیمگیری، پیش بینی، پیشگویی، و تخمین مورد استفاده قرار گیرند.
دادهها اغلب حجیم، اما بدون ارزش میباشند، داده به تنهایی قابل استفاده نیست، بلکه دانش نهفته در داده ها قابل استفاده می باشد. به این دلیل اغلب به داده کاوی، تحلیل داده ای ثانویه[2] گفته میشود.
[1] Knowledge Discovery in Database
[2] Secondary Data Analysis