علیرضا یاری در نشست خبری همایش بررسی راهکارهای پیشگیری از سرقت های علمی که در مرکز تحقیقات مخابرات ایران برگزار شد، کمک به بهبود کیفیت محتوا در وب فارسی را از جمله اهداف طرح جویشگر بومی عنوان کرد و اظهار داشت: طی دو سال اخیر و با توسعه طرح جویشگر بومی، امکان خزش ۴ میلیارد صفحه وب فارسی از طریق موتور جستجوی بومی فراهم شده است.
رئیس پژوهشکده فناوری اطلاعات مرکز تحقیقات مخابرات ایران، از استفاده از ابزارهای فناوری اطلاعات برای تشخیص داده های علمی و مشابهت سنجی مقالات در طرح جویشگر بومی خبر داد و گفت: هم اکنون موتور جستجوی بومی با خزش در صفحات وب فارسی، این برآورد را داشته است که درصد بالایی از محتوای فارسی در وب کپی برداری بدون ارجاع و ذکر منبع است.
یاری با بیان اینکه برآوردها نشان می دهد که سهم محتوای اسپم و غیرمفید در وب فارسی ۷۰ درصد است، گفت: موتور جستجوی بومی، امکان مشابهت یابی مقالات علمی را با دقت بالا، به عنوان راهکاری برای آگاهی سازی و واکاوی سرقتهای علمی ممکن کرده است.