دانلود مقاله ترجمه شده Cd-hit: برنامه‌ای سریع برای دسته بندی و مقایسه‌ی گروههای بزرگ توالی‌های پروتئینی یا نوکلئوتیدی


چطور این مقاله زیست شناسی سلولی و مولکولی را دانلود کنم؟

فایل انگلیسی این مقاله با شناسه 2001929 رایگان است. ترجمه چکیده این مقاله زیست شناسی سلولی و مولکولی در همین صفحه قابل مشاهده است. شما می توانید پس از بررسی این دو مورد نسبت به خرید و دانلود مقاله ترجمه شده اقدام نمایید

قیمت :
520,000 ریال
شناسه محصول :
2001929
سال انتشار:
2006
حجم فایل انگلیسی :
57 Kb
حجم فایل فارسی :
35 کیلو بایت
نوع فایل های ضمیمه :
Pdf+Word
کلمه عبور همه فایلها :
www.daneshgahi.com

عنوان فارسي

Cd-hit: برنامه‌ای سریع برای دسته بندی و مقایسه‌ی گروههای بزرگ توالی‌های پروتئینی یا نوکلئوتیدی

عنوان انگليسي

Cd-hit: a fast program for clustering and comparing large sets of protein or nucleotide sequences

نویسنده/ناشر/نام مجله

BIOINFORMATICS APPLICATIONS NOTE

این مقاله چند صفحه است؟

این مقاله ترجمه شده زیست شناسی سلولی و مولکولی شامل 2 صفحه انگلیسی به صورت پی دی اف و 5 صفحه متن فارسی به صورت ورد تایپ شده است

چکیده فارسی

چکیده

در سالهای 2001 و 2002 ما دو مقاله در ارتباط با برنامه‌ای فوق سریع به نام cd-hit را ارائه دادیم. این برنامه می‌تواند به شکلی کارآمد، مجموعه داده‌های بزرگ حاوی میلیون‌ها  توالی پروتئینی را دسته بندی نماید. بهرحال، کاربردهای الگوریتم پایه تنها به گروه بندی توالی‌های پروتئینی محدود نمی‌شود، در اینجا ما برنامه‌های جدیدی را با استفاده از الگوریتم‌های جدید که شامل cd-hit-2d و cd-hit-est. cd-hit-2d می‌شوند، برای طبقه بندی دو مجموعه توالی پروتئینی و گزارش‌های مربوط به میزان تطابق در توالی‌های آنها، ارائه نموده‌ایم. cd-hit-es یک مجموعه داده‌ی  DNA/RNA را طبقه بندی می‌نماید و cd-hit-est-2d دو مجموعه توالی نوکلئوتیدی را طبقه بندی می‌نماید. تمام این برنامه‌ها می‌توانند، برای مجموعه داده‌های بزرگ با میلیون‌ها توالی مورد استعمال قرار بگیرند و قادر هستند صدها بار سریعتر از روش‌های برنامه‌های عمومی مقایسه‌ی توالی و ابزار جستجوی توالی‌ها مثل BLAST عمل کنند.

1-مقدمه

طی سالهای اخیر، میزان داده‌های توالی‌های زیستی به سرعت در حال رشد هستند، که پیچیدگی‌های رشد، در آنالیز آنها نیز تحمیل می‌گردد. پیچیدگی آنالیز بسیاری از داده‌ها از رده‌ی
n2 است، در اینجا n تعداد توالی‌های مورد توجه است. یکی از مثالهای این، گروه بندی توالی‌های پروتئین می‌باشد، که گروههای پروتئینی مشابه بر اساس میزان تشابه در شاخه‌های یکسان قرار می‌گیرند. برای نشانی دادن این مسئله‌ی بحث برانگیز محاسباتی، ما روشی جدید را ایجاد کرده و برنامه‌ی cd-hit را انتشار نمودیم که قابلیت انجام دادن این کار را به شکلی کارآمد برای مجموعه داده‌های بزرگ دارا می‌باشد. برای مثال، این کار فقط 2 ساعت را برای طبقه بندی NCBI-nr با حدود 3 میلیون پروتئین در یک پایگاه کامپیوتری گرانترین مدل  می گیرد.

براساس اطلاعات بدست آمده از آن، cd-hit با تعداد زیادی از گروهها، مثل Uniprot و PDB در زمینه‌های مختلف جستجو مورد استفاده قرار می‌گیرد. در گروه ما، این برنامه را برای مجموعه داده‌هایی از توالی‌های پروتئینی غیر تکراری و کاهش تلاشها برای جستجوی مجموعه داده‌ها و همچنین بهبود بخشیدن به حساسیت در تشخیص به کار بردیم. الگوریتم پشیبان cd-hit، غربالگری عبارات کوچک است، که می‌تواند مشخص نماید که شباهت‌های میان دو توالی بدون انجام دادن مقایسه توالی‌های دقیق پایینتر از یک مقدار اطمینان است....

 

توالی‌های زیستی Cd-hit :کلمات کلیدی

چکیده انگلیسی


Abstarct

In 2001 and 2002, we published two papers (Bioinformatics, 17, 282–283, Bioinformatics, 18, 77–82) describing an ultrafast protein sequence clustering program called cd-hit. This program can efficiently cluster a huge protein database with millions of sequences. However, the applications of the underlying algorithm are not limited to only protein sequences clustering, here we present several new programs using the same algorithm including cd-hit-2d, cd-hit-est and cd-hit-est-2d. Cd-hit-2d compares two protein datasets and reports similar matches between them; cd-hit-est clusters a DNA/ RNA sequence database and cd-hit-est-2d compares two nucleotide datasets. All these programs can handle huge datasets with millions of sequences and can be hundreds of times faster than methods based on the popular sequence comparison and database search tools, such as BLAST

Keywords: Cd-hit
این برای گرایش های: کلیه گرایش ها، کاربرد دارد. همچنین این در گرایش های: نرم افزار، می تواند کاربرد داشته باشد. سایر ، را ببینید. [ برچسب: ]
 مقاله زیست شناسی سلولی و مولکولی با ترجمه
Skip Navigation Linksصفحه اصلی > دپارتمان ها > دپارتمان فنی و مهندسی > مهندسی کامپیوتر و IT > مقاله های مهندسی کامپیوتر و IT و ترجمه فارسی آنها > Cd-hit: برنامه‌ای سریع برای دسته بندی و مقایسه‌ی گروههای بزرگ توالی‌های پروتئینی یا نوکلئوتیدی
کتابخانه الکترونیک
دانلود مقالات ترجمه شده
جستجوی مقالات
با انتخاب رشته مورد نظر خود می توانید مقالات ترجمه شده آن رو به صورت موضوع بندی شده مشاهده نمایید