• فهرست مقالات Parametric Clustering

      • دسترسی آزاد مقاله

        1 - Word Sense Induction in Persian and English: A Comparative Study
        Masood Ghayoomi
        Words in the natural language have forms and meanings, and there might not always be a one-to-one match between them. This property of the language causes words to have more than one meaning; as a result, a text processing system faces challenges to determine the precis چکیده کامل
        Words in the natural language have forms and meanings, and there might not always be a one-to-one match between them. This property of the language causes words to have more than one meaning; as a result, a text processing system faces challenges to determine the precise meaning of the target word in a sentence. Using lexical resources or lexical databases, such as WordNet, might be a help, but due to their manual development, they become outdated by passage of time and language change. Moreover, the lexical resources might be domain dependent which are unusable for open domain natural language processing tasks. These drawbacks are a strong motivation to use unsupervised machine learning approaches to induce word senses from the natural data. To reach the goal, the clustering approach can be utilized such that each cluster resembles a sense. In this paper, we study the performance of a word sense induction model by using three variables: a) the target language: in our experiments, we run the induction process on Persian and English; b) the type of the clustering algorithm: both parametric clustering algorithms, including hierarchical and partitioning, and non-parametric clustering algorithms, including probabilistic and density-based, are utilized to induce senses; c) the context of the target words to capture the information in vectors created for clustering: for the input of the clustering algorithms, the vectors are created either based on the whole sentence in which the target word is located; or based on the limited surrounding words of the target word. We evaluate the clustering performance externally. Moreover, we introduce a normalized, joint evaluation metric to compare the models. The experimental results for both Persian and English test data showed that the window-based partitioningK-means algorithm obtained the best performance. پرونده مقاله
      • دسترسی آزاد مقاله

        2 - شناسایی حمله تقلید از سیگنال کاربر اولیه‎ ‎‎در شبکه‌های رادیوشناختی‎ مبتنی بر طبقه‌بندی غیر پارامتریک بیزین
        خاطره اکبری جمشید ابویی
        رادیوشناختی به عنوان یک فناوری کلیدی برای مقابله با کمبود طیف فرکانسی در شبکه‌های بی‌سیم به طور گسترده‌ مورد توجه قرار گرفته است. یکی از چالش‌های مهم در تحقق شبکه‌های رادیوشناختی، امنیت این نوع شبکه‌ها است. از مهم‌ترین این تهدیدها، حمله تقلید از سیگنال کاربر اولیه است، چکیده کامل
        رادیوشناختی به عنوان یک فناوری کلیدی برای مقابله با کمبود طیف فرکانسی در شبکه‌های بی‌سیم به طور گسترده‌ مورد توجه قرار گرفته است. یکی از چالش‌های مهم در تحقق شبکه‌های رادیوشناختی، امنیت این نوع شبکه‌ها است. از مهم‌ترین این تهدیدها، حمله تقلید از سیگنال کاربر اولیه است، بدین معنی که کاربر مخرب سعی دارد سیگنالی مشابه با سیگنال کاربر اولیه ارسال کند تا کاربران ثانویه را فریب داده و از ارسال سیگنال‌های این کاربران در حفره‌های طیفی جلوگیری کند و ضمن ایجاد ترافیک در شبکه، با به دست آوردن باند فرکانسی خالی، اطلاعات خود را ارسال کند. در این مقاله، روشی برای شناسایی حمله تقلید از سیگنال کاربر اولیه پیشنهاد می‌گردد که با خوشه‌بندی سیگنال‌های ارسالی کاربران اولیه و کاربران مخرب، این سیگنال‌ها را متمایز می‌کند. در این روش، تعداد سیگنال‌های ارسالی در محدوده شبکه رادیوشناختی در طول خوشه‌بندی سیگنال‌ها به دست می‌آید. با به کارگیری روش طبقه‌بندی مدل مخلوطی فرایند دیریشله که بر اساس روش غیر پارامتریک بیزین می‌باشد، سیگنال‌های اولیه فعال در محیط طبقه‌بندی می‌شوند. همچنین برای دستیابی به سرعت همگرایی بالاتر در الگوریتم، روش فرایند رستوران چینی برای مقداردهی اولیه و نمونه‌برداری غیر یکنواخت جهت انتخاب پارامتر خوشه‌ها به الگوریتم اعمال می‌گردد. پرونده مقاله