به عنوان یک ابزار اولیه در داده کاوی[1] ،تجزیه و تحلیل خوشه ، که تجزیه و تحلیل سگمنت نیز نامیده می شود،روشی است که داده ها را به گروه هایی همگن تحت عنوان خوشه تقسیم می کند.در چنین روشی داده های موجود در یک کلاستر یا خوشه خیلی شبیه به هم و داده ها ی کلاستر های مختلف خیلی متفاوت نسبت به هم هستند.اغلب، شباهت بر مبنای معیار فاصله می باشد.
آنالیز خوشه،خوشه بندی، تکنیک عمومی برای آنالیز داده های آماری می باشد که در بسیاری زمینه ها مانند یادگیری ماشین ، داده کاوی ، شناسایی الگو و آنالیز تصویر کاربرد دارد.در کنار اصطلاح خوشه بندی داده (یا فقط خوشه بندی)،بعضی اصطلاحات دیگرنیزهمانند کلاس بندی اتوماتیک[2] ،طبقه بندی عددی[3]، آنالیز نوع شناسی[4] ، با معنای مشابه استفاده می شود[1].
به طور کلی ،یک الگوریتم خوشه بندی خوب معمولا برای طراحی شامل چهار فاز ذیل را شامل می شود:1- نمایش داده[5]2- مدل کردن[6].3- بهینه سازی[7].4- اعتبار سنجی[2][8] ..
فاز نمایش داده، تعیین می کند که چه نوعی از ساختارهای خوشه می تواند داده ها را شناسایی کند.سپس فاز مدلینگ ضوابط و معیار ها را برروی ساختار تعریف می کند بطوریکه که ساختارها ی گروه های مطلوب را از موارد نامطلوب مجزا می کند.در فاز مدلینگ ، در طول جستجو برای ساختار های مخفی در داده ،یک معیار کیفیت مانند معیار بهینه سازی یا معیار تقریب تولید می شود. بعبارتی دیگرفاز بهینه سازش،ساختار های موثرتر و بهینه تر را انتخاب میکند. از آنجا که فرآیند خوشه بندی ،یک فرایند بدون سرپرستی است فاز اعتبار سنجی خیلی ضروری است تا نتایج تولید شده به وسیله الگوریتم خوشه بندی ارزیابی شوند.
این فایل دارای 41 صفحه می باشد.
عنوان و چکیده مقاله
Classification by Cluster Analysis: A New Meta
Learning Based Approach
Anna Jurek, Yaxin Bi, Shengli Wu, Chris Nugent
School of Computing and Mathematics University of Ulster,
Jordanstown, Shore Road, Newtownabbey, Co. Antrim, UK, BT37 0QB
jurek-a@email.ulster.ac.uk, {y.bi, s.wu1, cd.nugent}@ulster.ac.uk
Abstract. Combination of multiple classifiers, commonly referred to as an
classifier ensemble, has previously demonstrated the ability to improve
classification accuracy in many application domains. One popular approach to
building such a combination of classifiers is known as stacking and is based on
a meta-learning approach. In this work we investigate a modified version of
stacking based on cluster analysis. Instances from a validation set are firstly
classified by all base classifiers. The classified results are then grouped into a
number of clusters. Two instances are considered as being similar if they are
correctly/incorrectly classified to the same class by the same group of
classifiers. When classifying a new instance, the approach attempts to find the
cluster to which it is closest. The method outperformed individual classifiers,
classification by a clustering method and the majority voting method.
Keywords: Combining Classifiers, Stacking, Ensembles, Clustering, Meta-
Learning.
دسته بندی بر اساس تجزیه و تحلیل خوشه ای: یک روش فراآموزشی جدید
چکیده:
ترکیبی از طبقه بندهای مختلف معمولاً به عنوان یک گروه طبقه بندی شده مورد اشاره قرار می گیرد که پیش از این قابلیت آن برای بهبود دقت طبقه بندی در بسیاری از حوزه های نرم افزاری ذکر شده است. یک روش محبوب برای ساخت چنین ترکیبی از طبقه بندها به نام پشته سازی سازی(پشته کردن) شناخته شده است که مبتنی بر یک روش فرا یادگیری است. در این بخش ما یدر ک نسخه ی اصلاح شده از روش پشته سازی سازی را بررسی می کنیم که مبتنی بر تجزیه و تحلیل خوشه ای است. نمونه های مجموعه های امکان سنجی ابتدا از طریق طبقات پایه ی خود تقسیم بندی می شوند. نتایج طبقه بندی شده سپس به تعدادی خوشه ها گروهبندی می شوند. دو نمونه مشابه نظر گرفته می شود اگر آنها درست/نادرست در یک کلاس با یک گروه طبقه بندی قرار گرفته باشند. در زمان طبقه بندی نمونه ی جدید، این روش در تلاش است که خوشه ای که نزدیکترین است را بیابد. این روش نسبت به طبقه بندی تکی، طبقه بندی با یک روش خوشه بندی و روش رای اکثریت، عملکرد و کارایی بهتری دارد.
کلمات کلیدی: طبقه بندهای ترکیب کننده، پشته سازی سازی(پشته کردن)، مونتاژ کردن، خوشه بندی، فراآموزشی (Meta Learning).
تعداد صفحات انگلیسی=10
تعداد صفحات فارسی=15
فایل ترجمه شده دارای کیفیت عالی و در فرمت وورد می باشد
دانلود پایان نامه فارسی کارشناسی ارشد کامپیوتر شبکه های حسگر بیسیم در قالب فایل ورد (Word)– کاهش مصرف انرژی در شبکه های سنسور به کمک شبکه های عصبی SOM – الگوریتم های مسیریابی بر اساس مسیریابی مبتنی بر خوشه بندی (کلاسترینگ) و سطح انرژی
نوع مطلب: پایان نامه کارشناسی ارشد کامپیوتر
زبان پایان نامه: فارسی
قالب پایان نامه: ورد (Word)
تعداد صفحات: 149 صفحه
سال انتشار: 1389
محل انتشار: دانشگاه پیام نور
این پایان نامه در قالب ورد (Word) تهیه شده است و به آسانی میتوان آنرا ویرایش و کپی برداری کرد.
در سالهای اخیر استفاده از شبکه های حسگر بیسیم به میزان زیادی گسترش یافته است. در این شبکه ها تعداد زیادی گره سیار ریز به نام سنسور یا حسگر در محیطی قرار داده میشوند و اطلاعات آن محیط را پایش و بررسی میکنند و برای یک سرور به نام Sink یا چاهک ارسال میکنند. این شبکه ها کاربردهای زیادی پیدا کرده اند که از میان آنها میتوان به کاربردهای نظامی، جاسوسی، امنیتی، حفاظت از منازل و دارایی ها، هواشناسی، کنترل زیست محیطی، پایش و نظارت بر حیوانات و گونه های در حال انقراض، کشاورزی، رصد کردن زیر دریا، کاربردهای تجاری و هزاران کاربرد دیگر اشاره کرد.
در زمینه این شبکه ها مسائل باز زیادی وجود دارد و کارهای زیادی میتوان انجام داد. مثلا در زمینه میزان مصرف انرژی به خاطر محدود بودن میزان باتری حسگرها، الگوریتم های مسیریابی برای انتقال اطلاعات به چاهک، امنیت این شبکه ها برای جلوگیری از دستبرد به داده ها، تحمل خطا در زمان بروز مشکلات و ده ها زمینه دیگر. در این پایان نامه الگوریتم های یادگیری ماشین مبتنی بر شبکه های عصبی بر روی بحث خوشه بندی گره ها (Clustering) در شبکه های حسگر بیسیم بحث شده اند و مورد مقایسه و ارزیابی قرار گرفته اند.
چکیده
امروزه، در شبکههای حسگر بیسیم، پروتکلهای مسیریابی مبتنی بر خوشهبندی از طریق تقسیم گرههای همسایه به خوشههای مجزا و انتخاب سرخوشههای محلی برای ترکیب و ارسال اطلاعات هر خوشه به ایستگاه مبنا و سعی در مصرف متوازن انرژی توسط گرههای شبکه، بهترین کارایی را از لحاظ افزایش طول عمر و حفظ پوشش شبکهای در مقایسه با سایر روشهای مسیریابی به دست میآورند. با این وجود، همه پروتکلهای خوشهبندی ارایه شده تاکنون، تنها نزدیکی جغرافیایی(همسایگی) را به عنوان پارامتر تشکیل خوشهها در نظر گرفتهاند. در این تحقیق، یک پروتکل جدید خوشهبندی متمرکز مبتنی بر انرژی با استفاده از شبکة عصبی نقشة خودسازماندهی برای شبکههای حسگر بیسیم ارایه میشود که قادر به خوشهبندی گرههای شبکه بر اساس سطح انرژی و مختصات گرهها میباشد. این پروتکل با استفاده از تعداد مشخصی از گرههای پرانرژی در شبکه و اعمال آنها به عنوان وزن نورونهای نقشة خودسازماندهی، نزدیکترین گرههای کمانرژی را جذب گرههای پرانرژی میکند؛ به طوری که خوشهها لزوماً از گرههای مجاور تشکیل نشده و در واقع براساس دو پارامتر سطح انرژی و همسایگی، خوشههایی با انرژی متوازن تشکیل خواهند شد. به علاوه یک تابع هزینه جدید به منظور تصمیمگیری در انتخاب گرههای سرخوشه، پیشنهاد شده است که سعی در ترکیب معیارهای مختلف موثر در انتخاب بر اساس میزان اهمیت آنها دارد. کارایی برتر این پروتکل از لحاظ افزایش طول عمر مفید شبکه و حفظ بهتر پوشش شبکهای در مقایسه با پروتکلهای پیشین نظیر LEACH و LEA2C و نیز تاثیر تابع هزینه پیشنهادی بر کارایی آن (با شبیهسازی) به اثبات رسیده است.
واژههای کلیدی: شبکههای حسگر بیسیم، شبکه عصبی، نقشه خودسازماندهی، کاهش مصرف انرژی، خوشهبندی.
فهرست مطالب
فصل1 مقدمه 1
1-1. مقدمه 2
1-2. تعریف مساله و سئوالات اصلی تحقیق 3
1-3. فرضیهها 4
1-4. اهداف تحقیق 4
1-5. روش تحقیق 5
1-6. مراحل انجام تحقیق 5
1-7. ساختار پایاننامه 6
فصل2 مروری بر منابع مطالعاتی 8
2-1. مقدمه 9
2-2. طبقهبندی روشهای کاهش مصرف انرژی در شبکههای حسگر 13
2-2-1. چرخة وظایف 16
2-2-2. روشهای دادهگرا 18
2-2-3. روشهای مبتنی بر قابلیت تحرک 21
2-3. نقش شبکههای عصبی در کاهش مصرف انرژی شبکههای حسگر 22
2-3-2. شبکههای عصبی در طرحهای چرخه وظایف 27
2-3-3. شبکههای عصبی در کاهش داده 28
2-3-4. شبکههای عصبی در شبکههای حسگر متحرک 38
2-4. نتیجهگیری 40
فصل3 نقش شبکههای عصبی در مسیریابی انرژی آگاه 41
3-1. مقدمه 42
3-2. ویژگیهای مسیریابی در شبکه حسگر بیسیم 43
3-3. روشهای مسیریابی در شبکههای حسگر بیسیم 45
3-3-1. مسیریابی مسطح 46
3-3-2. مسیریابی مبتنی بر مکان 47
3-3-3. مسیریابی سلسه مراتبی(مبتنی بر خوشهبندی) 48
3-3-4. پروتکل خوشهبندیLEACH 49
3-3-5. پروتکل خوشهبندیLEACH متمرکز 51
3-4. شبکههای عصبی در الگوریتمهای مسیریابی آگاه از انرژی 52
3-4-1. شبکة عصبی انتشار معکوس در کشف مسیر 52
3-4-2. شبکة عصبی نقشة خودسازماندهی در مسیریابی 54
3-4-3. پروتکلهای مسیریابی مبتنی بر نقشة خودسازماندهی 56
3-5. پروتکل خوشهبندی پیوندگرا وفقی با انرژی پایین 60
3-6. جمعبندی 63
فصل4 پروتکل جدید پیشنهادی 64
4-1. مقدمه 65
4-2. پروتکل مسیریابی خوشهبندی مبتنی بر انرژی خودسازمانده 66
4-3. فرضیات الگوریتم 66
4-4. مرحلة خوشهبندی 68
4-4-2. مرحلة اول : خوشهبندی با شبکة عصبی نقشة خودسازماندهی 69
4-4-3. مرحلة دوم : خوشهبندی با الگوریتم K-means 76
4-4-4. مرحلة انتخاب سرخوشه 78
4-5. مرحلة انتقال داده 81
4-6. مرحلة خوشهبندی مجدد 82
4-7. جمعبندی 87
فصل5 نتایج شبیهسازی و تحلیل آنها 88
5-1. مقدمه 89
5-2. پارامترهای شبیهسازی 89
5-2. نتایج شبیهسازی 91
5-2-1. مقایسة نحوة تشکیل خوشهها در EBCS با پروتکل LEACH 91
5-2-2. مقایسة کارایی EBCS با پروتکلهای پیشین از لحاظ طول عمر شبکه 93
5-2-3. ارزیابی تابع هزینه انتخاب سرخوشه برکارایی EBCS 96
5-2-4. ارزیابی کارایی پروتکلEBCS در افزایش پوشش شبکهای 99
5-3. جمع بندی 102
فصل6 جمعبندی و پیشنهادها 104
6-1. مقدمه 105
6-2. یافتههای تحقیق 107
6-3. نوآوری تحقیق 108
6-4. پیشنهادها 109
مراجع 111
واژهنامه 116
کلمات کلیدی:
پایان نامه فارسی کامپیوتر، پایان نامه انگلیسی کامپیوتر، پایان نامه فارسی رشته کامپیوتر، پایان نامه انگلیسی رشته کامپیوتر، پایان نامه شبکه های حسگر بیسیم، پایان نامه شبکه های حسگر بی سیم، پایان نامه شبکه های کامپیوتری، پایان نامه کارشناسی ارشد کامپیوتر، پایان نامه کامپیوتر، پایان نامه کارشناسی کامپیوتر، تز کامپیوتر، تز ارشد کامیپوتر، پایان نامه در زمینه شبکه های سنسور، پایان نامه سنسور، پایان نامه شبکه های سنسور، مقاله کامپیوتر، مقاله ISI کامپیوتر، مقاله آی اس آی کامپیوتر، مقاله 2015 کامپیوتر، مقاله ISI 2015 کامپیوتر، شبکه های کامپیوتری، دانلود مقاله آی اس آی، ISI ، شبکه حسگر بیسیم، سنسور، تقسیم بندی شبکه، تعمیر توپولوژی، تحمل پذیری خطا، شبکه سنسور بی سیم، یادگیری ماشین، الگوریتم های مسیریابی در شبکه های حسگر بیسیم، الگوریتم های مکانیابی در شبکه های حسگر بیسیم، الگوریتم های هوش مصنوعی در شبکه های حسگر بیسیم، خود سازماندهی در شبکه های سنسور، خوشه بندی شبکه های حسگر بی سیم، گره های انکر، گره های لنگرگاه، گره های تکیه گاه، مشخص کردن موقعیت، دانلود رایگان پایان نامه کامپیوتر، دانلود رایگان مقاله 2015، مقالات جدید کامپیوتر، شبکه های حسگر بیسیم، سیستم های توزیع شده، دانلود مقاله 2015 کامپیوتر، مقاله 2015 رایگان، دانلود رایگان مقاله 2015 کامپیوتر، کاربرد یادگیری ماشین در شبکه های کامپیوتری، کاربرد یادگیری ماشین در شبکه های حسگر بیسیم، الگوریتم های یادگیری ماشین، شبکه های عصبی مصنوعی، شبکه های پیش خور، شبکه های عصبی پیش تغذیه شده، مقاله مکانیابی در شبکه حسگر بیسیم، الگوریتم های پس انتشار، نرون های چند لایه، نورون های چند لایه، تنظیم بیزی، شبکه های بیزین، مقاله مکانیابی در شبکه سنسور، مشخص کردن موقعیت، شبکه های عصبی som، wireless sensor networks, wsn, localization in wireless sensor network, localisation in wireless sensor networks, artificial neural networks, ann, feed forward neural networks, tansigmoid transfer function, tan sigmoid transfer function, training algorithms, Bayesian regularization, back propagation algorithms, multi-layer perceptron , ، Network partitioning ، Topology repair ، 2-Vertex connectivity، Fault tolerance ، Relay node placement
پس از خرید از درگاه امن بانکی لینک دانلود در اختیار شما قرار میگیرد و همچنین به آدرس ایمیل شما فرستاده میشود.
تماس با ما برای راهنمایی، درخواست مقالات و پایان نامه ها و یا ترجمه با آدرس ایمیل:
ArticleEbookFinder@gmail.com
شماره تماس ما در نرم افزار واتس آپ:
+98 921 764 6825
شماره تماس ما در نرم افزار تلگرام:
+98 921 764 6825
توجه: اگر کارت بانکی شما رمز دوم ندارد، در خرید الکترونیکی به مشکل برخورد کردید و یا به هر دلیلی تمایل به پرداخت الکترونیکی ندارید با ما تماس بگیرید تا راههای دیگری برای پرداخت به شما پیشنهاد کنیم.
در این کد ما روش خوشه بندی kmeans را به صورت موازی ( Parallel ) پیاده سازی کرده ایم
برای پیاده سازی از مقاله
Parallel Implementation of K-Means on Multi-Core Processors
استفاده کرده ایم این مقاله رو با ترجمه می توانید از اینجا دریافت کنید
به همراه کد متلب یک فایل توضیحات کد نیز وجود دارد که کاملا کد و نحوه پیاده سازی در ان شرح داده شده است
چکیده
در تاریخ در حال توسعه اینترنت، اطلاعات متنی نقش فوق العاده مهمی را بازی می کند. امروزه هنوز هم اطلاعات متنی اساسی ترین و فرم اصلی اطلاعات در اینترنت هستند. بنابراین تقاضای نظارت، مدیریت اطلاعات متنی و استفاده از آن به عنوان منابع با ارزش زیاد، به سرعت در حال افزایش یافتن است. امروزه تجزیه و تحلیل جریان متن دارای اهمیت فراوان است و کاربردهای مختلف از جمله فیلترینگ گروههای خبری، تشخیص و ردیابی موضوع، جریان آهسته متن، شبکه- های حسگر، سازماندهی اسناد و شناسایی کاربر دارد. خوشه بندی یکی از مهم ترین روش های تجزیه و تحلیل جریان متن است. مسئله خوشه بندی جریان متن نسبت به خوشه بندی جریانهای عددی در آغاز راه است و به تازگی مورد توجه محققان بیشتری قرار گرفته است. در این پایان نامه به بررسی الگوریتم های ارائه شده برای خوشه بندی جریانهای داده متنی پرداخته و سیر پیشرفت این الگوریتم ها در راستای افزایش کارایی و بهبود کیفیت خوشه بندی متون بررسی شده است.
تعریف داده کاوی
در متون اکادمیک تعاریف گوناگونی برای داده کاوی ارائه شده اند . در برخی از این تعاریف داده کاوی در حد ابزاری که کاربران را قادر به ارتباط مستقیم با حجم عظیم داده ها می سازد معرفی گردیده است و در برخی دیگر ، تعاریف دقیقتر که درانها به کاوش در داده ها توجه می شود موجود است . برخی از این تعاریف عبارتند از
داده کاوی استخراج اطلاعات مفهومی، ناشناخته و به صورت بالقوه مفید ازپایگاه داده می-باشد.
اصطلاح داده کاوی به فرایند نیم خودکار تجزیه و تحلیل پایگاه داده های بزرگ به منظور یافتن الگوهای مفید اطلاق می شود.داده کاوی یعنی جستجو در پایگاه داده ها برای یافتن الگوهایی میان داده هاداده کاوی یعنی استخراج دانش کلان ، قابل استناد و جدید از پایگاه داده ها ی بزرگداده کاوی یعنی تجزیه و تحلیل مجموعه داده های قابل مشاهده برای یافتن روابط مطمئن بین داده هاداده کاوی علم استخراج اطلاعات مفید از پایگاه های داده یا مجموعه دادهای می باشد
تعداد صفحات 93 word
فصل اول. 1
1- 1 مقدمه. 2
1-2 تعریف داده کاوی.. 3
1-3 کاربردهای داده کاوی.. 4
1-4 مراحل داده کاوی.. 5
1- 5 تکنیکها و روشهای داده کاوی.. 6
1-6 مقدمهای بر خوشهبندی.. 7
1-7 کلاستر چیست؟. 10
1-8 انواع کلاسترها 10
1-9 خوشهبندی در مقابل طبقهبندی.. 10
1-10 یادگیری با نظارت در مقابل یادگیری بدوننظارت.. 11
1-11 کاربردها 12
1-12 مسائل درگیر با روشهای خوشهبندی موجود 13
1-13 خوشهبندی در مقابل چندیسازی برداری.. 13
1-14 ویژگی های الگوریتم های خوشه بندی.. 14
1-15 روشهای خوشهبندی.. 14
1-15-1 خوشهبندی انحصاری و خوشهبندی با همپوشی. 15
1-15-1-1 خوشه بندی فازی.. 15
1-15-2 خوشهبندی سلسله مراتبی و خوشهبندی مسطح. 16
1-15-3 روشهای خوشهبندی سلسله مراتبی. 17
1-15-3-1 خوشهبندی با روش Single-Link. 18
1-15-3-2 خوشهبندی با روش Complete-Link. 19
1-15-3-3 خوشهبندی با روش Average-Link. 20
1-15-3-4 خوشهبندی با روش Group Average Link. 21
1-15-3-5 خوشهبندی با روش Median Distance. 22
1-15-3-6 خوشهبندی با روش Ward. 23
1-15-3-7 الگوریتم خوشهبندی پایین به بالای عمومی. 23
1-15-4 روش خوشهبندی K-Means (C-Means یا C-Centeriod) 24
1-15-4-1 مشکلات روش خوشهبندی K-Means. 26
1-15-5 الگوریتم خوشهبندی LBG.. 26
1-15-6 خوشهبندی بر اساس چگالی. 28
1-16 خوشه بندی متن. 34
1-16-1 الگوریتم خوشه بندی Bi-Section-K Means. 35
1-16-2 خوشه بندی مستندات متنی به کمک انتولوژی.. 36
1-16-3 کامپایل کردن دانش پس زمینه درون متن. 37
1-16-4 استراتژی های استفاده از کلمه در مقابل مفهوم 38
1-17 خوشه بندی جریانهای داده 38
1-17-1 الگوریتم های خوشه بندی جریان داده 39
1-17-2 مقایسه الگوریتم های خوشه بندی جریان داده 42
1-18 جریان داده متنی. 43
فصل دوم 45
( بررسی الگوریتم های خوشه بندی جریان های داده متنی) 45
2-1 مقدمه. 46
2-1-1TF-ICF. 47
2-2-2 الگوریتم STREAMING OSKM.. 49
2-2-2-1 K-means کروی انلاین. 49
2-2-2-2 پیاده سازی کارامد oskm.. 50
2-2-2-3 خوشه بندی مقیاس پذیر. 51
2-2-2-4STREAMING OSKM.. 53
2-2-2-5 ارزیابی و مقایسه. 53
2-2-3 الگوریتم OCTS. 53
2-2-3-1 تعاریف اولیه. 54
2-2-3-3 الگوریتم خوشه بندی انلاین OCTS. 59
2-2-3-4 الگوریتم OCTS. 62
2-2-4 ویژگی های Bursty. 66
2-2-4-1 ارائه ویژگی bursty. 69
تعریف6 ویژگی bursty. 69
2-2-5 الگوریتم خوشه بندی جریان متن بر اساس انتخاب ویژگی انطباقی. 71
2- طراحی پردازش جریان. 73
1 معایب الگوریتم TSC-AFS. 76
2-3 معیارهای ارزیابی کیفیت خوشه بندی.. 76
فصل سوم : جمع بندی و پیشنهادات.. 78
فهرست منابع. 85
شکل1-2:a) در طبقهبندی با استفاده یک سری اطلاعات اولیه دادهها به دستههای معلومی نسبت داده میشوند.b) در خوشهبندی دادهها با توجه به الگوریتم انتخاب شده به خوشههایی نسبت داده میشوند 15
شکل 1-3 مجموعه داده پروانه ای.. 20
شکل 1-4 : شمایی از روشهای خوشهبندی بالا به پایین و روشهای پایین به بالا. 22
شکل1-5 : شباهت بین دو خوشه در روش.. 23
شکل 1-6: شباهت بین دو خوشه در روش Complete-Linkبرابر است با بیشترین فاصلة بین دادههای دو خوشه. 24
شکل 1-7 : شباهت بین دو خوشه در روش Average-Linkبرابر است با میانگین فاصلة بین دادههای دو خوشه 25
شکل1-8 : شباهت بین دو خوشه در روش Group Average Linkبرابر است با فاصله بین میانگین نقاط دو خوشه 26
شکل (2-1) تفاوت بین خوشه بندی جریان های متنی و سنتی. 51
شکل 2-2 ایجاد مدلVSMایستا از داده خام 72
شکل 2-3 شمایی از ارائه ویژگی bursty. 73
شکل 2-4 الگوریتم TSC-AFS. 79