دانلود مقاله ترجمه شده ارزیابی برچسب زنی آماری ادات سخن (بخش گفتار) در متون فارسی


چطور این مقاله مهندسی کامپیوتر و IT را دانلود کنم؟

فایل انگلیسی این مقاله با شناسه 2003889 رایگان است. ترجمه چکیده این مقاله مهندسی کامپیوتر و IT در همین صفحه قابل مشاهده است. شما می توانید پس از بررسی این دو مورد نسبت به خرید و دانلود مقاله ترجمه شده اقدام نمایید

قیمت :
615,000 ریال
شناسه محصول :
2003889
سال انتشار:
2007
حجم فایل انگلیسی :
415 Kb
حجم فایل فارسی :
152 کیلو بایت
نوع فایل های ضمیمه :
Pdf+Word
کلمه عبور همه فایلها :
www.daneshgahi.com

عنوان فارسي

ارزیابی برچسب زنی آماری ادات سخن (بخش گفتار) در متون فارسی

عنوان انگليسي

Evaluation of statistical part of speech tagging of persian text

نویسنده/ناشر/نام مجله

Signal Processing and Its Applications

این مقاله چند صفحه است؟

این مقاله ترجمه شده مهندسی کامپیوتر و IT شامل 6 صفحه انگلیسی به صورت پی دی اف و 17 صفحه متن فارسی به صورت ورد تایپ شده است

چکیده فارسی


چکیده

برچسب زنی ادات سخن (POS) یک بخش ضروری نرم افزار های پردازش متن می باشد. یک برچسب زن POS به هر کلمه ی متن  ورودی آن یک برچسب اختصاص می دهد که مشخص کننده ی ویژگی های گرامری و نحوی آن می باشد. یکی از محبوبترین برچسب زن های POS برچسب زن TnT می باشد. نشان داده شده است که این برچسب زن دارای دقت بالای در انگلیسی و برخی زبان های دیگر است. دانستن نحوه ی عملکرد یک شیوه در زبان های دیگر همیشه جالب و مورد توجه بوده است چرا که این کار فهم ما را از شباهت ها و تفاوت های بین آن دو افزایش می دهد. در مورد شیوه های آماری، از جمله TnT ، یک مزیت  کاربردی نیز به موارد قبل اضافه می شود. در این مقاله ساختن یک مجموعه ی برچسب زده شده POS ارائه می شود و همچنین برچسب زن TnT بر متون فارسی ارزیابی می شود. نتایج آزمایشات بر متون فارسی نشان می دهد که TnT  صحت کلی 96.64 درصدی را داراست و برای کلمات مشخص وشناخته شده دارای دقت 97.01 درصد و برای کلمات ناشناخته دارای دقت 77.77 درصد می باشد.

1-مقدمه

برچسب زنی ادات سخن برای کلمات یک جمله دنباله ای از دسته های ترکیبی (صرفی نحوی) را که بیشترین احتمال درستی را دارند، انتخاب می کند. این برچسب زنی مشخصه های گرامری کلمات از جمله ادات سخن، اعداد صرف ونحوی، جنسیت، چندم شخصی و.. را مشخص می کند....

برچسب زنی ادات سخن پردازش متن :کلمات کلیدی

چکیده انگلیسی


Abstract

Part of Speech (POS) tagging is an essential part of text processing applications. A POS tagger assigns a tag to each word of its input text specifying its grammatical properties. One of the popular POS taggers is TnT tagger which was shown to have high accuracy in English and some other languages. It is always interesting to see how a method in one language performs on another language because it would give us insight into the difference and similarities of the languages. In case of statistical methods such as TnT, this will have an added practical advantages also. This paper presents creation of a POS tagged corpus and evaluation of TnT tagger on Persian text. The results of experiments on Persian text show that TnT provides overall tagging accuracy of 96.64%, specifically, 97.01% on known words and 77.77% on unknown words

Keywords: part of speech tagging
کتابخانه الکترونیک
دانلود مقالات ترجمه شده
جستجوی مقالات
با انتخاب رشته مورد نظر خود می توانید مقالات ترجمه شده آن رو به صورت موضوع بندی شده مشاهده نمایید