گوگل نه تنها میتونه صفحات مختلف یه وبسایت رو ایندکس کنه، بلکه میتونه متن های مختلف و ویژه ای از صفحات رو هم به طور دقیق crawl کنه و سپس اونها رو ایندکس (index) کنه. گوگل passage indexing صفحات رو به کمک هوش مصنوعی (Artificial Intelligence) انجام میده. در این مقاله به نحوه ایندکس شدن متن یا passage indexing یه صفحه در گوگل می پردازیم و بررسی می کنیم که این کار چه تأثیری بر سئو داره.
نحوه ایندکس شدن متن یا passage indexing در گوگل
شرکت گوگل همواره در تلاشه تا در موتور جستجوی خودش تغییرات ایجاد کنه و روز به روز اون رو ارتقاء بده. یکی از این تلاش ها در راستای ایندکس سازی مبتنی بر متن هست و گوگل این نوع از ایندکس شدن رو دائماً آپدیت و به روز رسانی میکنه. معمولاً جستجوهایی که بسیار خاص و جزئی هستن، می تونن از سخت ترین و دشوارترین جستجوها باشن. در واقع گاهی وقتا تنها یه جمله که به سوال یا جستجوی خاصتون پاسخ میده، ممکنه در عمق یه صفحه از وبسایتی نهفته شده باشه. اینجاست که passage indexing به کمک موتور جستجوی گوگل میاد و یه متن مرتبط با جستجو رو از دل صفحات مختلف پیدا میکنه.
شرکت گوگل اخیرا در رتبه بندی (ranking) پیشرفت بزرگی داشته و اکنون نه تنها میتونه صفحات وب رو ایندکس کنه، بلکه متن های منحصر بفرد و خاصی از اون صفحات رو هم ایندکس میکنه و این کار میشه گفت مثل پیدا کردن سوزن در انبار کاه هست. Google به طرز قدرتمندی با درک و فهم بهتر ارتباط متن های خاص و ویژه، نه تنها متون جزئی و منحصر بفرد رو پیدا میکنه، بلکه کل صفحه ای که متن در داخلش قرار داره رو هم پیدا میکنه و آدرس اون صفحه رو در اختیار کاربر قرار میده. به نظر من این توانایی های شگفت انگیز گوگل واقعاً قابل تحسین هست.
اگه بخوایم یه مثال براتون بزنیم تا بهتر متوجه این موضوع بشین باید یه جستجو به زبان انگلیسی رو بهتون نشون بدیم، چون هنوز قابلیت ایندکس شدن متن برای زبان فارسی تعریف نشده و همونطور که گفته شد در حال حاضر این قابلیت گوگل تنها برای زبان های انگلیسی به کار گرفته شده. خب حالا فرض کنین یه کاربر انگلیسی قصد داره پرسش «?How can I determine if my house windows are UV glass» (چجوری میتونم تشخیص بدم که پنجره های خونه من از نوع UV هستن؟) رو در گوگل جستجو کنه. این جستجو واقعاً خیلی خاص و جزئی هست و باید به طور دقیق توسط گوگل سرچ بشه. گوگل در این مورد با استفاده از passage indexing براحتی قادره موارد یافت شده رو به کاربر ارائه بده و متن هایی رو که در رابطه با پاسخ این پرسی هستن رو نشون میده.
درسته که شاید صفحات یا ویدئوهای زیادی وجود داشته باشن که درباره شیشه های UV صحبت می کنن اما شاید هیچ کدوم نتونن واقعاً به کاربر کمک کنن تا پاسخ دلخواهش رو پیدا کنه. الگوریتم جدید گوگل با استفاده از ایندکس سازی مبتنی بر متن بر روی یک یا چندین متن مرتبط با این جستجو زوم و تمرکز میکنه و اون متون رو به کاربر ارائه میده. کاربر به راحتی میتونه اون قسمتی از صفحه که دارای متن مورد نظرش هست رو استفاده کنه و بقیه صفحه که براش کاربردی و مفید نیست رو نادیده بگیره. این مورد تقریباً ممکنه برای هر کسی پیش بیاد که بعضی وقتا دنبال جستجوی موضوعات بسیار خاصی باشه. در این موارد با خیال راحت میتونین به گوگل اعتماد کنین و روی اون حساب کنین.
با کمک قابلیت ها و توانایی های جدید فهم و درک متن و ویژگی ایندکس شدن متن، گوگل میتونه تشخیص بده که یه متن خاص بیشتر مرتبط هست به یه جستجو و سوال خاص و جزئی در مقایسه با یه صفحه کلی مرتبط با اون موضوع.
تأثیر ایندکس شدن متن بر سئو
همونطور که گفته شد با ایندکس شدن متن یه صفحه از وبسایت، رتبه و جایگاه اون سایت در گوگل تغییر پیدا میکنه و مسلماً ارتقاء پیدا میکنه و توجه داشته باشین که passage indexing در افزایش ایندکس شدن صفحات سایت تأثیری نداره. بنابراین واقعاً indexing تغییری نکرده و تغییر بیشتر در ranking ایجاد شده و گوگل بر اساس چیزهایی که در صفحه وب شما یافته و پیدا کرده، محتوا رو رتبه بندی میکنه. توجه داشته باشین که گوگل به هیچ وجه متن های منحصر بفرد و خاص رو روی صفحات سایت ایندکس نمیکنه. گوگل به طور دقیق تری مشخص میکنه که ناحیه دسته بندی اون صفحه از وبسایت چیه و متن های اون صفحه برای اهداف رتبه بندی بهتر جلوه میکنه.
سیستم های گوگل، تعدادی از اجزای اصلی تر و مهم تر صفحه مانند عناوین صفحه یا هدینگ ها رو در نظر میگیرن و بر اساس اونها تشخیص میدن چه قسمت ها و چه متن هایی از اون صفحه، مرتبط ترین با جستجوی کاربر هستن و سپس اونها رو ایندکس می کنن. علاوه بر اجزایی که گفتیم از فاکتورهای مهم در ایندکس شدن متن به حساب میان، سیستم جدید گوگل این توانایی رو داره که همچنین صفحاتی رو شناسایی کنه که تنها یه قسمت منحصر بفرد و مرتبط با جستجوی خاص کاربر دارن و تنها همون قسمت خیلی خوب و کامل میتونه پاسخ جستجوی کاربر رو بده.
ما گفتیم که گوگل در ایندکس شدن متن، بیشتر به عناوین صفحه و هدینگ ها توجه میکنه. حالا اینکه بین عناوین صفحه و هدینگ ها کدوم مهم تر هستن کاملاً مشخص نیست. با این حال میشه گفت درسته که برچسب های عناوین از اجزای تقریباً مهم یه صفحه به حساب میان، اما برای passage indexing، هدینگ ها اهمیت بیشتری دارن.
با وجود اینکه گوگل همواره کلمات و عبارات کلیدی و مهم صفحه رو تشخیص میده و شناسایی میکنه، اما اغلب مواردی مانند عنوان صفحه از اجزای خیلی مهم و قوی به حساب میاد که کمک میکنه گوگل بهترین و مناسب ترین صفحات رو به کاربر ارائه بده. پس اگه کسی هستین که کار تولید محتوا انجام میدین یا وبمستر هستین، حتماً به عناوینی که برای صفحات خودتون انتخاب می کنین، دقت کنین و اهمیتی که عناوین در افزایش ایندکس شدن صفحات یا متون دارن رو نادیده نگیرین. به جرأت میتونیم بگیم که google قدرتمندترین موتور جستجویی هست که میتونه مرتبط ترین نتیجه رو بر اساس اطلاعات موجود در متن در اختیارتون قرار بده و همونطور که قبلاً گفتیم مثه پیدا کردن سوزن در انبار کاه میمونه.
شباهت بین ایندکس شدن متن و Featured Snippets
Featured Snippets که در اصطلاح بهشون پاسخ های برجسته گفته میشه، در واقع قسمت های کوتاهی از متن یه صفحه هستن که در صدر نتایج جستجوی گوگل ظاهر میشن تا به سرعت به سرچ خاص و جزئی یه کاربر پاسخ بدن. محتوایی که در یه Featured Snippet ظاهر میشه، به صورت خودکار از صفحات وب موجود در ایندکس گوگل حاصل میشه. انواع رایج پاسخ های برجسته شامل تعاریف، جدول ها، مراحل و لیست ها هستن.
خب حالا سوالی که ممکنه ذهنتون رو درگیر کرده باشه اینه که featured snippet با ایندکس شدن متن چه تفاوتی داره؟ ببینین در ایندکس شدن متن یا passage indexing، سیستم های گوگل متن هایی از چندین صفحه وب مختلف رو که مرتبط با جستجو جزئی کاربر هستن رو تشخیص میدن. اما در featured snippet، مربوط ترین متن از یه صفحه کلی مرتبط با جستجو تشخیص داده میشه و تنها یه متن در اختیار کاربر قرار داده میشه.
کاربرد الگوریتم ایندکس سازی مبتنی بر متن
وقتی که کاربر یه عبارت نسبتاً طولانی یا یه پرسش خاص و جزئی رو در گوگل سرچ میکنه ولی نمیتونه بین صفحاتی که از سایت های مختلف هست، پاسخ دقیق و کامل خودش رو پیدا کنه، passage indexing وارد عمل میشه و یه سری اطلاعات ویژه ای رو که در متن های منحصر بفردی از صفحه قرار دارن رو به کاربر ارائه میده.
یه مثال دیگه ای که در زمینه ایندکس شدن متن میتونیم بهش اشاره کنیم، جستجویی هست که به صورت یه سوال ویژه سرچ شده. توجه داشته باشین که گفتیم در حال حاضر قابلیت ایندکس سازی مبتنی بر متن تنها برای جستجوهایی به زبان انگلیسی تعریف شده. سوال جستجو اینه که «?How does BERT work in google search» و به معنی این هست که چجوری الگوریتم BERT در سرچ گوگل عمل میکنه؟ قبلاً گوگل در پاسخ به این جستجو یه سری نتایج رو که به نظر میرسید به طور خیلی کلی مرتبط با جستجو هستن رو نمایش میداد یا ممکن بود که یه سری از اخبار درباره ورود BERT به سرچ گوگل رو نشون بده، که در واقع هیچ کدوم از این نتایج نمیتونستن به درستی و مستقیماً پاسخ سوال کاربر رو بدن و نحوه عمل این الگوریتم در سرچ گوگل رو به طور دقیق بیان کنن.
قابلیت passage indexing، قسمت هایی از یه صفحه که به طور واضح و دقیق مربوط به نحوه عمل BERT در سرچ گوگل هستن رو شناسایی می کنن و اونها رو در رتبه های بالاتری قرار میده. در این صورت کاربر خیلی سریع و آسون به پاسخ سوال خودش میرسه و دیگه مجبور نیست بین صفحه های متعدد و مختلف بگرده و وقت زیادی رو صرف کنه تا بتونه دقیقاً اون چیزی رو که میخواد پیدا کنه.
امیدواریم هر چه زودتر ایندکس سازی مبتنی بر متن برای زبان فارسی هم تعریف بشه و کار ما رو در جستجوی عبارت های طولانی و پرسش های ویژه راحت تر کنه.