• 1397/09/22

استخراج اطلاعات اماری از محتوای متنی :

سلام استاد

برای جستجوی full text  شما استفاده از lucene  رو اموزش دادید. سوال من اینه که برای استخراج اطلاعات اماری کلمات و عبارات موجود در محتوای متن ها از چه متد و مدلی باید استفاده کرد ..ایا برای بدست اوردن اطلاعات اماری کلمات و استفاده در جستجو، باید ابتدا بر روی متن پیش پردازش کردو نتایج را در بانک ذخیره کرد تا بشه از اطلاعات اماری  برای نمایش سریع اطلاعات ،استفاده کرد؟ و شاخص گذاری بخش های از محتوا متن (مثلا صحبت های افراد ) را چطور باید انجام داد؟ ممنون میشم راهنمایی کنید.

 منظورم ایجاد چنین سایتی هستش: http://mashruh.ir/search

  • 1397/09/23
  • ساعت 09:52

سلام 

معمولا برای اینکار آمار را بدست میاریم و اگر نیاز باشه آن را Cache میکنیم 

اگر باید real time باشه و اطلاعات سنگین باشه از sp استفاده میکنیم البته در db first


logo-samandehi