دقیقا مشکل همینه که هر کسی به که می میخواد یک موتور جستجو بومی ایجاد کنه. با چشم بسته و بدون نگاه اصولی به ساختار یک موتور جستجو استارت میزنه.
داده کاوی یکی مهمترین بخش یک موتور جستجو هست. اگر دقت کنید همین گوگل تا چند وقت پیش نتایج فارسیش مشکل داشت. شاید کلی رکورد محتوای فارسی داشت اما به درستی زبان فارسی رو پالایش نکرده بود. واسه همین سایت های تبلیغاتی همیشه صفحه اول بودن. اما الا فکر کنم ۳تا ایرانی متخصص در زمینه پالایش متون فارسی دارند رو این موضوع کار می کنند. می بینید که نتایج خیلی بهتر شده.
دقیقا این دوست عزیز خودش نمی دونه الان میخواد گل بکاره، درختچه یا درخت. الان داره دنبال گلدونش به یک اندازه خاص میگرده. بقول محسن اینقدر ابزار آزاد برای این کار هست. اما باید از همین ابزار به درستی استفاده بشه. چون داریم روی ترابایت ها داده صحبت میشه.