در این تحقیق رشته کامپیوترابتدا اجزای جمله تحلیل می شوند، سپس بر مبنای ساختار نحو، شباهت جمله به شباهت کلمات تبدیل می شود، سپس از طریق ابهام زدایی کلمات، شباهت کلمات به شباهت مفهوم تبدیل می شود و در نهایت مقایسه شباهت معنایی احصا می شود. می توانید این تحقیق رشته کامپیوتر را به صورت فایل word دانلود نمایید.
محاسبه شباهت کلمات
· استفاده از پایگاه دانش HowNet که در برگیرنده مفاهیم به زبان انگلیسی و چینی است.
· در HowNet هر یک از کلمات با چند مفهوم توصیف شده اند و هر مفهوم با مجموعه ای از واژچم ها (Sememes). مثال: G_C یعنی Part of Speech
· شباهت دو کلمه = ماکزیمم شباهت مفاهیم آن ها با هم
· HowNet یک مکانیزم محاسبه شباهت از طریق فاصله معنایی دارد که به وسیله درخت سلسله مراتبی واژچم ها کار می کند.
بهبود محاسبه شباهت کلمات در HowNet
الف) ابهام زدایی کلمه
استفاده از پلت فرم LTP برای برچسب گذاری نقش کلمات در جمله
در نظر گرفتن همنشین های قبل و بعد کلمه و POS آن ها و مقایسه آن با مفهوم متناظر کلمه در پایگاه دانش و همنشین های آن برای یافتن مفهوم درست کلمه
ب) اضافه کردن رابطه تضاد
استفاده از روابط متضاد موجود در HowNet و تشابه مفاهیم متضاد کلمات
مزایای استفاده از مقالات SemEval
· استفاده از مقالات متعدد و پالایش ویژگی های استفاده شده در مقالات
· بهره گیری از روش های ارائه شده در مقالات جهت دستیابی به بهترین نتیجه عملی
· در دسترس بودن مجموعه های آموزش و تست
· در دسترس بودن پیاده سازی برخی روش ها در دوره های اخیر در گیت هاب
· امکان یافتن مرتبط ترین Task و بررسی روش های ارائه شده برای آن
· مشخص بودن روش برنده از لحاظ کارایی برای هر Task در هر دوره
فهرست مطالب
مقاله 1
مقاله 2
مقاله 3
SemEval
مقاله 4 و 5
پیشنهادات
منابع