معاون پژوهشکده IT پژوهشگاه ارتباطات و فناوری اطلاعات از اضافه شدن قابلیت‌های موتور جستجوی “پارسی جو” خبر داد و گفت: این قابلیت‌ها با همکاری‌ شرکت‌های فناور و استارتاپ‌ها بوده است. راه اندازی جویشگرهای بومی را یکی از موضوعات محوری این پژوهشکده دانست و افزود: “پارسی‌جو” و “یوز” دو تا از جویشگرهای بومی هستند که تحت حمایت […]

معاون پژوهشکده IT پژوهشگاه ارتباطات و فناوری اطلاعات از اضافه شدن قابلیت‌های موتور جستجوی “پارسی جو” خبر داد و گفت: این قابلیت‌ها با همکاری‌ شرکت‌های فناور و استارتاپ‌ها بوده است.

راه اندازی جویشگرهای بومی را یکی از موضوعات محوری این پژوهشکده دانست و افزود: “پارسی‌جو” و “یوز” دو تا از جویشگرهای بومی هستند که تحت حمایت پژوهشگاه و با همکاری دو دانشگاه، راه‌اندازی و با همکاری برخی از شرکت‌ها به قابلیت‌های این موتورهای جستجوگر اضافه شده است.

وی اضافه شدن بخش ترجمه به این موتورها را از جمله قابلیت‌های جدید این موتور دانست و خاطر نشان کرد: به منظور تصحیح فرآیند جستجو، برخی از شرکت‌های فناوری که در حوزه نقشه فعال بودند، با پارسی‌جو در این زمینه همکاری کردند.

محمودی با بیان اینکه جویشگر پارسی‌جو یک موتور جستجوی فارسی‌زبان است، اظهار کرد: به منظور توسعه کاربردهای این موتور جستجو قابلیت ترجمه نیز به آن اضافه شد. این قابلیت موجب شده است تا کاربران به اطلاعات دیگری دسترسی داشته باشند.

معاون پژوهشکده IT پژوهشگاه ارتباطات و فناوری اطلاعات با اشاره به اهمیت راه‌اندازی موتور جستجوی فارسی، توضیح داد: در حال حاضر جویشگرهای زیادی مانند گوگل با قابلیت‌های زیاد وجود دارند و کمتر کاربران به سمت جویشگرهای فارسی‌زبان می‌روند، ولی از آنجایی که بسیاری از محتواها و مستنداتی که در سطح دانشگاه‌ها و سازمان‌ها و یا در سطح کشور وجود دارد که به دلایل فرهنگی و اجتماعی و امنیتی امکان جستجو و بازیابی اطلاعات آنها از طریق جویشگرهای موجود فراهم نیست، از این رو پیاده‌سازی جویشگرهای بومی ضروری بود.

طایفه محمودی، “کلان داده‌ها” (Big Data) را از دیگر پروژه‌های این پژوهشکده نام برد و یادآور شد: از آنجایی که روز به روز به صورت گسترده داده‌ها افزایش می‌یابند لازم است این داده‌ها مورد تحلیل و ارزیابی قرار گیرد تا داده‌های مورد نیاز استخراج شود و در اختیار کاربران قرار گیرد که در این راستا طرح “کلان‌داده‌ها” می‌تواند موثر باشد.

وی با بیان اینکه داده‌های موجود در این بخش شامل داده‌های متنی، صوتی، تصویری و ویدئویی است، ادامه داد: این داده‌ها قابل استفاده برای همه سازمان‌ها و مراکز است؛ چرا که بسیاری از این نهادها دارای داده‌های وسیعی هستند و تحلیل این داده‌ها می‌تواند قابل کاربرد برای این نهادها باشد.

محمودی در عین حال با تاکید بر اینکه ذخیره‌سازی این داده‌های کلان در یک مرکز امروزه منتفی شده است، اضافه کرد: از آنجایی که داده‌های هر دستگاه و نهادی بسیار زیاد است و از سوی دیگر تلاش می‌شود تا این داده‌های وسیع به بسترهای “ابری” و “مه” بارگذاری شود تا امکان دسترسی از هر مکانی و در هر زمانی فراهم باشد، از این رو راه‌اندازی کلان داده‌ در هر سازمانی به صورت جداگانه صورت می‌گیرد.

این محقق حوزه فناوری اطلاعات، “اینترنت اشیا” (IOT) را از دیگر موضوعات مطالعاتی این پژوهشکده نام برد و گفت: با توجه به توسعه کاربردهای این فناوری در کشور، با تعامل با شرکت‌ها و استارتاپ‌ها نسبت به تدوین نقشه راه اینترنت اشیا اقدام کردیم. ضمن آنکه آزمایشگاه‌های آن نیز در حال راه‌اندازی است.

وی بیشترین کاربرد این فناوری را در مصرف انرژی دانست.

به گزارش ایسنا، نسخه سازمانی موتور جستجوگر پارسی‌جو، قادر است میلیاردها سند با قالب‌های مختلف را خزش (Crawl) و پس از ذخیره‌سازی و نمایه‌سازی (Indexing) بر بستر توزیع شده در کمتر از یک ثانیه در آنها عملیات جستجو به زبان فارسی را انجام دهد.

سرویس جستجوی پارسی‌جو متناسب با نیاز سازمان‌ها و به‌صورت سفارشی نیز به ارائه خدمات می‌پردازد. با توجه به وجود اطلاعات متنوع در یک سازمان، سرویس مذکور نیز راهکارهای یکپارچه برای پاسخگویی به نیازهای موجود ارائه می‌دهد.

پوشش بیش از ۱۰ میلیارد سند وب (متن، تصویر، ویدئو و صوت)، مدیریت گراف وب با بیش از ۴۰۰ میلیارد یال، جستجوی همزمان روی داده با قالب‌های مختلف ورودی، ذخیره‌سازی ده‌ها میلیارد سند روی بستر Hadoop/HBase، پردازش و استخراج هوشمند اطلاعات و دانش از اسناد فارسی، جستجوی سریع در کم‌تر از یک ثانیه در مقیاس بزرگ و حجم زیاد داده (میلیاردها سند)، اتصال به واحد پردازشگر زبان (درک و گسترش پرس‌وجو، خطایابی) و جستجوی پیشرفته با فیلترهای مختلف زمان، نوع داده و مکان از قابلیت‌های این موتور جستجو است.

پارسی‌جو همچنین قابلیت بازیابی نتایج بر اساس پردازش‌های پیشرفته و هوشمند، دسته‌بندی اسناد با استفاده از روش‌های مدرن، ترکیب جستجو روی اسناد داخلی و وب، ارائه نتایج متناسب با نیاز کاربران و ارائه API سفارشی را دارد.

اخبار، آب وهوا، اوقات شرعی، تصاویر، آوا، ترجمه و نقشه از جمله خدمات این جویشگر فارسی است. 

سامانه پردازش کلان‌داده (سامپاد) نیز خدمات ذخیره‌سازی، مدل‌سازی و پردازش اطلاعات روی داده‌های حجیم را ارائه می‌دهد. این سامانه با فرمت‌های مختلف ورودی سازگار است، جستجو و پردازش اطلاعات را انجام می‌دهد، الگوها و آنومالی‌ها را کشف و دانش مورد نیاز را استخراج می‌کند. 

این سامانه قابلیت سازگاری با ورودی‌های ساختار یافته/نیافته، ذخیره‌سازی ده‌ها میلیارد داده با حجم چندین پتا بایت روی بستر Hadoop/Hbase، پردازش داده‌ها برای کشف آنومالی، خوشه‌بندی و دسته‌بندی روی بستر Spark، نمایه‌سازی سریع داده‌ها برای دسترسی سریع با استفاده از روش‌های نمایه‌سازی معکوس و پردازش‌های مربوط به گراف را دارد.

جستجوی همزمان روی داده‌ها با الگوهای مختلف ورودی، زبان پرس‌وجوی ساختار یافته، ارائه نتایج به شکل مناسب و خوانا با نمایش پویا و جستجوی ترکیبی با فیلترهای گوناگون (زمان، قالب و مکان) از دیگر قابلیت‌های این سامانه به شمار می‌رود.

  • منبع خبر : خبرگزاری ایسنا