تعیین محدوده قطعات همخوان و سکوت به روش ترکیبی شبکه عصبی و Wavelet
لینک پرداخت و دانلود *پایین مطلب*
فرمت فایل:PDF
تعداد صفحه:101
فهرست مطالب :
چکیده................................................................ 1
مقدمه...................................................... 2
فصل اول: مفاهیم اولیه..................................... 4
1-1 مقدمه......................................................... 5
2-1 سامانه گویش انسان و مدل تولید گفتار.......................... 5
3-1 آواهای زبان فارسی.................................................. 8
1-3- آواهای واکدار و آواهای بیواک.............................................. 9 1
2-3- همخوان و واکه............................................................ 9 1
3-3- واج و واجگونه.............................................................. 9 1
4-3- هجا در زبان فارسی........................................................... 9 1
4- مشخصههای نوای گفتاری................................................... 10 1
1- زیر و بمی........................................................... 12 4-1
الف) آهنگ....................................................................... 12
ب) نواخت................................................................... 12
ج) تکیه............................................................................ 12
2- کشش.............................................................. 12 4-1
3- شدت.............................................................. 13 4-1
فصل دوم: تقطیع سیگنال صحبت............................ 14
1- مقدمه.......................................................................... 15 2
2- آشکارسازی قطعات واکدار، بیواک و سکوت................................... 15 2
3-2 تعیین فرکانس فرمنت و گام......................................... 19
4-2 قطعهبندی رویدادها................................................................. 21
1- قطعهبندی بر اساس تغییرات وابستگی طیفی..................................... 21 4-2
2- قطعهبندی بر اساس تغییرات آکوستیکی............................................... 23 4-2
3- قطعهبندی بر اساس تغییرات دامنه و فرکانس فرمنتها.................... 32 4-2
5- تعیین مرز اصوات انفجاری غیر واکدار..................................................... 33 2
فصل سوم: تبدیل ویولت.......................................... 35
1-3 مقدمه................................................................ 36
37......................................... STFT و FT 2- مقایسه تبدیل ویولت با 3
3- تنوع روشهای پیادهسازی تحلیل ویولت.......................... 39 3
الف) تبدیل ویولت پیوسته.................................................... 39
ب) تبدیل ویولت گسسته................................................................... 41
42.............(Mallat 4- پیادهسازی تبدیل ویولت گسسته توسط فیلتر کردن مرحلهای (الگوریتم 3
5- تنوع توابع ویولت.................................................................. 45 3
فصل چهارم: شبکه عصبی........................................................... 50
1-4 مقدمه...................................................................... 51
2-4 ساختار مغز انسان.............................................. 51
3-4 شبکه عصبی چیست؟........................................................ 53
4-4 طبقهبندی الگوها................................................................ 54
5-4 یادگیری و تعمیم.......................................................... 56
6-4 مدلسازی نرون تنها و اجزای آن.................................. 56
7-4 انواع شبکههای عصبی مصنوعی از نظر برگشتپذیری................................ 62
1-7-4 شبکههای پیشخور....................................................... 62
2-7-4 شبکههای پسخور برگشتی.................................... 62
63.....................................................ART 8-4 معرفی شبکههای
65...............................................................Fuzzy ART 9-4 شبکه
1-9-4 دریافت اطلاعات ورودی..................................................... 66
67..........................................Fuzzy ARTMAP 10-4 شبکه
فصل پنجم: پیادهسازی روش...................................................... 71
1-5 مقدمه.......................................................... 72
2-5 تقطیع سیگنال...................................................................... 72
3-5 استخراج مشخصهها جهت اعمال به شبکه عصبی.................................. 73
74...........................................................(ZCR) الف) نرخ عبور از صفر
ب) انرژی سیگنال............................................................................. 74
ج) مشخصههای استخراج شده از ضرایب ویولت................................. 74
د) انرژی طیف فرکانسی سیگنال................................... 76
77.........Fuzzy ARTMAP 4-5 برچسب زدن قطعات همخوان با استفاده از شبکه عصبی
فصل ششم: نتیجهگیری و پیشنهادات.......................................... 79
1-6 نتیجهگیری......................................................... 80
2-6 پیشنهادات................................................. 83
منابع و ماخذ............................................................. 84
فهرست منابع فارسی..................................................... 84
فهرست منابع لاتین.............................................................. 85
87.................................................................ABSTRACT
چکیده :
یکی از کاربردهای نیازمند پردازش صحبت، تشخیص یا بازشناسی صحبت است. سامانه های تشخیص صحبت، دربرگیرنده محدوده وسیعی از کاربردها در سامانه های آموزشی، سامانه های پردازش واژه، کنترل کامپیوترها بوسیله صحبت و به طور خاص، سامانه های کنترلی برای افراد نابینا و معلول حرکتی هستند. در این میان، شناسایی واج های همخوان در یک سیگنال صحبت، به دلیل طبیعت ناپایدار، نامتناوب و نامنظم شان، همواره امری پیچیده بوده است. هدف ما در این پروژه، تعیین محدوده قطعات همخوان و سکوت و طبقه بندی آنها در سیگنال صحبت با استفاده از روش ترکیبی تبدیل ویولت گسسته (DWT) و شبکه عصبی Fuzzy ARTMAP، میباشد. استفاده از تبدیل ویولت (موجک)، محاسبات را کاراتر، آسانتر و امکان انجام کاربردهای بیدرنگ را فراهم می آورد. تبدیل ویولت به دلیل فراهم آوردن امکان تحلیل زمان – فرکانس و تحلیل چندتفکیکی برای پردازش سیگنال های ناپایدار، نظیر سیگنال صحبت، بسیار مناسب است. همچنین در این پروژه از شبکه عصبی Fuzzy ARTMAP به دلیل داشتن ساز و کار یادگیری سریع، پایدار و بازدهی بالا در کاربردهای طبقه بندی (به دلیل استفاده از تئوری فازی) استفاده کرده ایم.
برای قطعه بندی سیگنال صحبت در مرتبه رویداد، از روش قطعه بندی اتوماتیک ارائه شده در مرجع استفاده شده است. در این روش، سه راهکار بر مبنای تغییرات آکوستیکی و طیفی سیگنال صحبت و نیز تغییرات بارز در داده های فرمنت، بکار گرفته شده اند. به این ترتیب، ابتدا سیگنال صحبت به سه دسته واکدار، بیواک و سکوت (V/U/S) طبقه بندی میشود. سپس با در نظر گرفتن همزمان تغییرات طیفی سیگنال در یک دوره کوتاه زمانی، تغییرات در دامنه و فرکانس فرمنتها و مشخصه های آکوستیکی، مرز میان رویدادها آشکارسازی میشود. در ادامه، با استفاده از تبدیل ویولت و یکسری تحلیل های زمانی و فرکانسی، مشخصه های مربوط به قطعات آشکارسازی شده سیگنال صحبت، استخراج میشود.
تبدیل فوریه معمولی، اطلاعات لحظه ای و گذرای سیگنال صحبت را از بین میبرد. همچنین تبدیل فوریه زمان کوتاه (STFT)، گرچه امکان تحلیل همزمان بهتری را در حوزه زمان – فرکانس فراهم می آورد، اما به علت عدم قابلیت تفکیک پذیری متغیر در حوزه زمان – فرکانس، اغلب برای تحلیل سیگنالهای صحبت، مناسب نمیباشد. تبدیل ویولت به دلیل دارا بودن قابلیت تفکیک پذیری متغیر، از پنجره های کوتاه در زمان (گسترده در فرکانس)، جهت بررسی رفتار گذرای سیگنال و از پنجره های بزرگ در زمان (متمرکز در فرکانس)، برای بررسی رفتار دراز مدت سیگنال، استفاده میکند. به همین خاطر، تبدیل ویولت، ابزاری نیرومند جهت تحلیل سیگنال های غیر ایستایی نظیر سیگنال صحبت محسوب میشود. در این پروژه، برای تعیین محدوده همخوان ها و سکوت و نیز استخراج مشخصه های آنها از ترکیب تحلیلهای زمانی و فرکانسی و نیز برای طبقه بندی آنها از شبکه عصبی Fuzzy ARTMAP استفاده شده است.
در فصل اول، به معرفی مفاهیم اولیه ای چون سامانه گویش انسان، مدل تولید گفتار، آواهای زبان فارسی و مشخصه های نوای گفتار پرداخته میشود. فصل دوم به موضوع تقطیع سیگنال صحبت پرداخته است. در این فصل، روش بکار گرفته شده جهت آشکارسازی رویدادها در یک سیگنال صحبت و تعیین مرز میان قطعات، شرح داده میشود. در فصل سوم، اطلاعاتی پیرامون تبدیل ویولت، مقایسۀ آن با FT و STFT و روشهای پیاده سازی تحلیل ویولت آورده شده است. فصل چهارم به موضوع شبکه عصبی اختصاص داده شده است. در این فصل، مفاهیم اولیه شبکه های عصبی، انواع شبکه های عصبی مصنوعی از نظر برگشت پذیری، شبکه ART، شبکه عصبی Fuzzy ART و شبکه عصبی Fuzzy ARTMAP مورد بحث قرار گرفته است. در فصل پنجم، تشریح روند انجام این پروژه و چگونگی بکارگیری امکانات و مفاهیم معرفی شده در فصل های پیشین برای رسیدن به اهداف مورد نظر، گنجانده شده است. فصل ششم نیز در برگیرنده نتایج و پیشنهادات حاصل از انجام این پروژه است.
و...
NikoFile