پردازش صوت2

در اين جلسه برنامه اي كه در پست قبلي گذاشتم و گفتم در قسمت lowpass filter و peek detection هنوز مشكلاتي داره رو بررسي كرديم. وقتي نمودار تبديل فوريه ي نهايي را براي نفرات اول و دوم كشيديم، با چشم(نه برنامه) سه پيك اول بر روي اعداد 26و51و102قرار گرفت.البته براي نفر دوم پيك سوم به جاي 102 روي 104 قرار داشت. علت آن هم اين بود كه نفر دوم صداي خانم بود كه همانطور كه مي دانيم فركانس صداي خانمها بيشتر است و اين مسئله در پيك هاي با شماره ي بالاتر واضح تر است.(معمولا در پيك هاي اول و دوم خود را نشان نمي دهد.)

اما نموداري كه از فيلتر پايين گذر عبور داده بوديم،خوب فيلتر نشده بود و محل پيك ها به هم خورده بود. بنابراين اكنون بايد بر روي قسمت تشخيص اتوماتيك پيك برنامه بيشتر كار كنيم.

اما در اين بخش سوالي مطرح شد كه آيا پيك هايي كه با چشم تشخيص داده شده بودند،(قبل از مرحله ي عبور از فيلتر) مي توانستند براي مصوت "آ" منحصر بفرد باشند؟به بيان ديگر آيا تضميني وجود دارد كه اگر مصوت هاي ديگري تلفظ شوند محل پيك ها اعداد ديگري باشند و براي هر صدا اين اعداد منحصر بفرد باشند؟ اگر پاسخ اين سوال مثبت باشد،ايده اي كه در اين پروژه به كار گرفته شده صحيح بوده و زمان كار كردن بر روي auto peek detection فرا مي رسد.

بنابراين اين بار به بررسي فايلي پرداختيم كه شامل تلفظ مصوت "اي" توسط چند نفر بود تا ببينيم اين بار محل پيك ها كجا قرار مي گيرد. اگر نتايج در اين قسمت رضايت بخش باشد به سراغ تصحيح قسمت peek detection برنامه مي رويم.

نتايج اين بررسي را در پست بعدي پيگيري كنيد.

براي ديدن تمام پست های مربوط به پردازش صوت كليك كنيد.

/ 0 نظر / 9 بازدید