به گزارش خبرگزاری بسیج از قم، مهدی بهنیافر، مدیر سامانه مشابه یاب متون (سمیم نور) امروز ۴ خردادماه در نشست خبری رونمایی از نسخه عربی این سامانه که با حضور اصحاب رسانه در سالن جلسات مرکز تحقیقات کامپیوتری علوم اسلامی برگزار شد، عنوان کرد: متن ورودی به سامانه سمیم برای ارزیابی مشابهت میتواند در قالب مقاله، کتاب و یا پایان نامه باشد، سامانه مشابه یاب متون سمیم نور نیز میزان مشابهت را از طریق سنجش با مقالات، کتابها، صفحات وب فارسی و عربی و پایان نامههای منتشر شده ارزیابی میکند.
وی ادامه داد: موتور مشابه یاب سمیم حاصل تجربیات فنی با بهرهگیری از تکنولوژیهای پردازش زبان طبیعی با تکیه بر تجربیات همکاران فنی ما در حوزه هوش مصنوعی است که به کاربران کمک میکند که در کوتاهترین زمان ممکن نتیجه مشابهت یابی مورد نظر خود را دریافت کنند.
بهنیافر در ادامه دادههای عربی و فارسی پشتیبان این سامانه را مورد توجه قرار داد و گفت: ۵۰ هزار کتاب که از این میزان ۲۹ هزار عنوان کتاب عربی است، ۸۰۰ هزار مقاله در فارسی و عربی که از این میزان ۷۲ هزار عنوان از مقالات عربی است، ۴۵۰۰ صفحه وب فارسی و عربی، بیش از ۱۴۰ هزار پایان نامه دفاع شده از جمله دادههای پشتیبان مشابه یاب سمیم نور است.
وی یادآور شد: رفتار کاربران در سالهای اخیرنشان میدهد بیشترین حجم اقتباس در متون در درجه اول از مقالات و بعد از آن صفحات وب، کتابها و در نهایت پایان نامهها است که به دلیل نوع دسترسی به این منابع است.
بهنیافر بیان کرد: سامانه سمیم نور متمرکز بر طیف وسیعی از علوم اسلامی و انسانی است و نوع داده ورودی که کاربران به سامانه ارائه میکنند اگر مربوط به علوم اسلامی و انسانی باشد طبیعتا پاسخ دقیقتری دریافت خواهند کرد بنابراین فعالیت تخصصی ارائه میکنیم و این یکی از نقاط قوت پایگاه محسوب شود.
وی اظهار کرد: سال گذشته در سامانه سمیم فارسی ۵۸ درصد اسنادی که به سامانه سپرده شدند بین صفر تا کمتر از ۲۰ درصد مطالب را عینا از منابع دیگر برداشتند، ۲۴ درصد اسناد ارائه شده به سامانه میزان مشابهت آنها بین ۲۰ تا ۵۰ درصد بوده است و حدود ۱۰ درصد از فایلها داده شده برای مشابه یابی بالای ۵۰ درصد مشابهت داشته است.
بهنیافر عنوان کرد: بخش عمدهای از متون کاربرانی که دچار مشابهت میشود ناشی از ناآگاهی از قوانین و عدم اطلاع دقیق از استاندارهای نگارش علمی است.
وی ادامه داد: چنین سامانههایی در دنیا با سامانههای کشف تقلب و سرقت علمی شناخته میشود اما در فارسی و عربی چنین نامگذاری نداشتیم زیرا در ایران و کشورهای عربی قوانین دقیقی برای تعیین این که چه درصدی از مشابهت مصداق سرقت علمی است نداریم بنابراین سامانه سمیم نور را مشابه یاب نامگذاری کردیم.
بهنیافر با بیان اینکه سامانه مشابه یاب سمیم نور ۱۱۶ هزار کاربر دارد، گفت: مهم ترین استفاده از این سامانه مربوط برای کشف مشابهت مقالات در نشریات علوم اسلامی و انسانی است.
وی تاکید کرد: پیک مراجعه کاربران به سامانه مشابهت یاب سمیم نور به دلیل زمان دفاع از پایاننامهها شهریور و بهمنماه است بنابراین در مواقع پیک مراجعه به سامانه ارائه گواهی میزان مشابهت یاب توسط سامانه زمان بیشتری نیاز دارد.