تولید متن یکی از مسايل مهم در حوزه پردازش زبان طبیعی به حساب میآید. روشهای پایه ارائهشده در این حوزه، دارای مشکلاتی نظیر ناهمخوانی داده در زمان آموزش و آزمون و همچنین تابع هدف نامناسب هستند. در چند سال اخیر پیشرفتهای زیادی در حوزه تولید تصویر به وسیله شبکههای مولد أکثر
تولید متن یکی از مسايل مهم در حوزه پردازش زبان طبیعی به حساب میآید. روشهای پایه ارائهشده در این حوزه، دارای مشکلاتی نظیر ناهمخوانی داده در زمان آموزش و آزمون و همچنین تابع هدف نامناسب هستند. در چند سال اخیر پیشرفتهای زیادی در حوزه تولید تصویر به وسیله شبکههای مولد مقابلهای انجام شده است. همین موضوع باعث شده که استفاده از شبکههای مولد مقابلهای در تولید متن نیز به تازگی مورد توجه قرار گیرد. اما به دلیل گسستهبودن جنس دنبالهها، این امر به سادگی میسر نبوده و برای حل آن نیاز به استفاده از راهکارهایی مثل یادگیری تقویتی و استفاده از تقریب وجود دارد. به علاوه ناپایداری شبکههای مولد مقابلهای باعث ایجاد چالشهای جدید و بالارفتن پیچیدگی مسأله میشود.
در این پژوهش با رویکردی جدید که جمعی و مبتنی بر ایده شبکههای مولد مقابلهای است به ارائه روشی جمعی برای حل مسأله تولید متن میپردازیم. اساس روش پیشنهادی تخمین نسبت چگالی احتمال بوده و با این رویکرد روشی بدون مشکل در برابر گسستگی دنبالهها ارائه شده است. راهکار ارائهشده نسبت به روشهای شبکههای مولد مقابلهای در حوزه دنباله، آموزشی پایدارتر دارد و همچنین مشکل اُریبی مواجهه نیز در روش پیشنهادی وجود ندارد.
آزمایشهای انجامشده نشاندهنده برتری روش پیشنهادی در مقایسه با روشهای پیشین بر روی مجموعه دادههای معروف مربوط به تولید متن است.
تفاصيل المقالة
تولید متن، یکی از زمینههای تحقیقاتی در حوزه پردازش زبان طبیعی است که بهوسیله آن، سیستم میتواند متون جامع، کامل و از نظر گرامری درست را مانند انسان تولید کند. از جمله کاربردهای تولید متن میتوان به برچسبزدن به تصویر، تولید شعر و تولید گزارشهای هواشناسی و زیستمحیطی أکثر
تولید متن، یکی از زمینههای تحقیقاتی در حوزه پردازش زبان طبیعی است که بهوسیله آن، سیستم میتواند متون جامع، کامل و از نظر گرامری درست را مانند انسان تولید کند. از جمله کاربردهای تولید متن میتوان به برچسبزدن به تصویر، تولید شعر و تولید گزارشهای هواشناسی و زیستمحیطی اشاره کرد. با ظهور شبکههای عصبی عمیق، پژوهشها در زمینه تولید متن به سمت استفاده از این شبکهها روانه شد؛ اما مهمترین چالش در حوزه تولید متن با استفاده از شبکههای عصبی عمیق، بحث گسستگی دادههاست که باعث عدم توانایی انتقال گرادیان شده است. اخیراً استفاده از رویکرد جدیدی در حوزه یادگیری عمیق با عنوان شبکههای مولد تخاصمی جهت تولید تصویر، صوت و متن مورد توجه قرار گرفته است. هدف از این پژوهش، استفاده از این رویکرد جهت تولید جملات فارسی میباشد. در این مقاله از سه الگوریتم متفاوت شبکههای مولد تخاصمی برای تولید جملات فارسی، استفاده و این سه الگوریتم با هم مقایسه شدهاند و با در نظر گرفتن معیار ارزیابی BLEU و Self-BLEU، ارزیابی همهجانبهای هم از نظر کیفیت جملات و هم از نظر تنوع صورت گرفته است.
تفاصيل المقالة
رایمگ
يقوم نظام رایمگ بتنفيذ جميع عمليات الاستلام والتقييم والحكم والتحرير وتخطيط الصفحة والنشر الإلكتروني للمجلات العلمية.