چکیده
این مقاله یک مدل احتمالاتی برای ابهام زدایی از مفهوم ارائه می کند که بهترین مفهوم را براساس احتمال شرطیِ تعابیر و الفاظ معنایی موجود در بافت متن انتخاب می کند. ما از یک مدل عنوانی جهت تجزیه این احتمال شرطی به دو احتمال شرطی با متغیرهای پنهان استفاده می کنیم. سه نمونه مختلف از مدل را برای حل مسائل ابهام زدایی مفهوم با درجات مختلف منابع موجود مطرح می کنیم. مدل های ارائه شده، نسبت به انجام سه کار مختلف سنجیده شده اند: ابهام زدایی مفهوم کلمه با ساختار بزرگ (دانه درشت)، ابهام زدایی مفهوم کلمه ریز دانه (ریز ساختار)، و تشخیص استفاده ازعبارات تحت اللفظی و کنایه ای. در تمامی این سه مورد، بطور برجسته از جدید ترین سیستم ها چه از لحاظ آماری یا چه از لحاظ کمی بهره می گیریم.
1-مقدمه
ابهام زدایی مفهومِ کلمه (WSD) عبارتست از تعیین خودکارِ مفهوم برای یک کلمه مورد نظر در یک متن معین که در آن ظاهر می شود. WSD یک مسئله مهم در NLP و یک مرحله پیش پردازش برای بسیاری از موارد کاربردی، ازجمله ترجمه ماشینی، پرسش و پاسخ استخراج اطلاعات می باشد. هرچند، WSD کاری دشوار است و علیرغمِ این که در طی این سال ها مورد توجه بسیاری از پژوهش ها بوده، جدیدترین و پیشرفته ترین سیستم ها هنوز هم اغلب اوقات برای کابردهای جهان واقعی مناسب و مطلوب نیستند. یک عامل اصلی که انجام WSD را سخت می گرداند، فقدان نسبیِ مجموعه هایی است که بطور دستی شرح و تفسیر داده شده اند که این عملکرد سیستم های تحت نظارت را مختل می کند...