مقالات آموزشی

BERT ( برت ) بزرگترین وجدیدترین جهش جست و جوی تاریخ

مفید بود؟

BERT ، جدیدترین الگوریتم و بزرگ‌ترین جهش جست‌وجوییه که گوگل برای فهم بهترِ منظوری که هر کاربر از اصطلاح جست و جو شده داره، به‌وجود آورده و طبق این الگوریتم باید انتظار داشته باشیم که نتایج مرتبط‌تری پیدا کنیم. این شرکت اعلام کرده، BERT بر 10% سرچ ها اثر می‌ذاره و این یعنی که احتمالاََ برروی ترافیک برند شما و نمای ارگانیک اون هم تأثیر داره.

درواقع این اتفاق، بالاترین سطح انتظار ما از چیزیه که تاکنون گوگل بعنوان بزرگترین جهش، در تاریخ جستجو در حال انتشار دادنه، این یک الگوریتم بر پایه‌ هوش مصنوعیه و به هدف فهم بهتر زبان محاوره‌ای مخاطب شکل گرفته.

البته شاید این الگوریتم به اندازه بقیه الگوریتم های گوگل سروصدای زیادی به‌پا نکرده و خیلی محسوس نبوده باشه ولی انقدر مهمه که می‌تونه بر آینده سرچ‌ها تأثیر بسزایی بذاره.

( می‌تونین راجع به الگوریتم‌های قبلی گوگل در مقاله زیر مطالعه کنید. )

وقتشه یه بیوگرافی جذاب از الگوریتم جدیدمون به اشتراک بذاریم :

کار الگوریتم برت از 21 اکتبر،2019 برای جستجوهای انگلیسی زبان که شامل اسنیپت های برجسته، بود، آغاز شد. همونطوری که گوگل اعلام کرده این الگوریتم قراره برای تمامی زبان‌هایی که جست‌وجو می‌کنند اعمال بشه، همچنین این مدل برای بهبود اسنیپت‌ های برجسته در چندین کشور استفاده میشه.

ماهیت الگوریتم برتBERT چیه؟

برت (BERT) مخفف Bidirectional Encoder Representations from Transformer است. این الگو یه شبکه بر پایه‌ هوش مصنوعیه که برای پیش آموز فهم زبان محاوره شکل گرفته، اگه بخوام به زبان ساده‌تر بگم یعنی، برای کمک به گوگل در تشخیص بهتر کلمات سرچ شده استفاده میشه.

برای مثال، در عباراتی که کلمه “به” بجای “از” استفاده می‌شه، ما دو معنی متفاوت خواهیم داشت که تشخیصش برای انسان ساده است اما برای ربات‌های موتور جست‌وجو کمی سخت می‌شه در نتیجه الگوی برت به هدف تمیز دادن بین چنین کلماتی برای نتایج دقیق‌تر، طراحی شده، پس یجورایی شبیه یه ربات انسان نما شده!

در نوامبر 2018،گوگل،BERT رو بصورت منبع باز قرار داد، حالا منبع باز یعنی چی؟

درحقیقت این اصطلاح به این معناست که هرکسی می‌تونه از برت برای آموزش سیستم پردازش زبان خودش برای سؤال و جواب و سایر کارها استفاده کنه.

همونطور که می‌بینید گوگل خیلی وقتا پیشنهادش رو به زبان عامیانه ارائه میده:

آیا الگوریتم BERT جایگزینی برای Rank Brain است؟

کسانی با گوگل و تولید محتوا سر و کار دارند قطعاََ اسم الگوریتم رنک برین رو شنیدند.

این الگوریتم اولین الگوریتم هوش مصنوعی بود که گوگل در سال 2015 برای درک کوئری‌ها ارائه کرد در واقع Rank Brain محتوای صفحات ایندکس گوگل و عبارت جست‌وجو شده رو بررسی می‌کنه و در نهایت به یه فهمی از جمله می‌رسه!

حالا چیزی که می‌خوام به شما بگم اینه که فکر نکنین الگوریتم BERT جایگزین رنک برین شده! بلکه برت برای درک بهتر کوئری استفاده میشه درحالیکه رنک برین هنوز هم در بعضی از کوئری‌ها مورد استفاده‌ست.

گوگل الگوریتم برت رو به چه منظوری ارائه کرد؟ مگه رنک برین کافی نبود؟

باید که بگم که یه الگوریتم هیچوقت کافی نیست! چرا که هر کدوم کار خاصی انجام میدن و با پیشرفته‌تر شدن ربات‌ها و وضعیت هوش مصنوعی قطعاََ به الگوریتم‌های خفن‌تری نیاز داریم! در حقیقت گوگل هم وقتی از برت استفاده می‌کنه که حس کنه یه جمله به کمک این الگوریتم بهتر درک میشه و نتایج منطبق‌تری ارائه میکنه.

همونطور که گفتم گوگل برای درک مفهوم کوئری‌ها از چندین الگوریتم استفاده می‌کنه که رنک برین یکی از اونهاست ولی در این الگوریتم کلماتی مثل “با”، “به”، “اما” و غیره، حذف می‌شدند و گوگل متوجه شده بود که با حذف این کلمات به مفهوم جمله آسیب وارد میشه و نتیجه دقیقی به‌دست نمیاد، پس به یه الگوریتم هوشمندتر مثل برت نیاز داشت که نسبت به کلمات جزئی و ظریف حساسیت نشون بده و مخاطب رو راضی‌تر نگهداره.

پس این آپدیت الگوریتم گوگل، محصول جدید و شگفت انگیزی نیست، بلکه الگوریتمی هوشمندتره که با هوش مصنوعی می‌تونه جملات شما و زبان عامیانه رو بهتر درک کنه.

منظورمون از هوش مصنوعی چیه؟

هوش مصنوعی، به عبارت ساده برای فهم الگوها طراحی شده. دسته بندی محتوای تصاویر، شناسایی دستخط و حتی پیش بینی ترندها در بازار مالی برنامه‎های متداول هوش مصنوعی در دنیای واقعی هستند. اونها به داده‌ها آموزش میدن تا الگوها رو شناسایی کنند.

محققان هوش مصنوعی گوگل در سال 2018 در یه مقاله آموزشی معتبر درباره هوش مصنوعی گوگل و تأثیرش در درک زبان انسان بطور کلی اون رو معرفی کردند.

طبق اطلاعاتی که در این مقاله اومده، آپدیتBERT می‌تونه کاری کنه تا ماشین‌ها (مثل الگوریتم‌ ها، کامپیوترها و …) زبان محاوره رو با سرعت و آسانی بیشتری تحلیل کنند و در نتیجه درصد برداشت اشتباه از زبان انسان به شدت کاهش پیدا کنه. به این فرآیند در عمل Natural language processing / NLP می‌گیم که می‌تونیم از اون به عنوان هسته اصلی الگوریتم برت یاد کنیم.

گوگل بااستفاده ازاین موضوع می‌دونه شما چه چیزهایی رو جستجو می‌کنید حتی اگه عبارتتون از نظر قواعد نگارشی صحیح نباشه و یا معنی درستی نداشته باشه.

بنظرتون پروسه زبان طبیعی یا همون NLP چیه؟

پروسه زبان طبیعی یا Natural Language Processing/ NLP به شاخه‌ای از هوش مصنوعی برمی‌گرده که با امور وابسته به زبان سروکار داره و هدفش توانمند کردن کامپیوترها برای فهم زبان، به گونه‌ای که انسان‌ها در واقعیت با همدیگه صحبت می‌کنند، است.

نمونه‌هایی از پیشرفت‌های امکان پذیر توسط NLP شامل: ابزار شنود اجتماعی، چت بات‌ها و پیشنهاد کلمات در گوشی‌های هوشمند شماست. در حقیقتNLP به خودی خود یه ویژگی جدید برای موتورهای جستجو نیست، با این حال BERT پیشرفت‌هایی رو در NLP از طریق آموزش دوطرفه ارائه کرده است.

عملکرد برت BERT به چه صورته؟

پیشرفت برت رو در رسیدن به تواناییِ آموزش مدل‌های زبانی بر پایه تمامی کلمات در یه جمله یا کوئری (آموزش دوطرفه)، نسبت به روش سنتی که آموزش در توالی کلمات ( چپ به راست یا ترکیب چپ به راست و راست به چپ) بود، می‌بینیم.

خب یکم پیچیده شد نه؟ بهتره یه توضیح ساده‌تر از عملکردش بگم. ?

در واقع BERT به مدل زبانی آموزش میده که جایگاه استفاده از کلمه رو با توجه به پاراگرافی که واژه در اون قرار گرفته و همچنین کلمات اطرافش، یاد بگیره، یجورایی باید کل پارگراف رو در نظر بگیره نه این که فقط به کلمه‌ای که قبل یا بعد از اون میاد بسنده کنه. واس همین هم گوگل، برت رو عمیقاََ دوطرفه می‌خونه، چون هم از کلمه میشه ادامه جمله رو حدس زد و هم از یه جمله می‌شه کلمه موردنظر رو حدس زد!

برای مثال کلمه “بانک” ممکنه در فرم “حساب بانکی” نمود پیدا کنه. مدل‌های متنی، ارائه‌ای از هر کلمه که بر پایه کلمات دیگه‌ای در جمله آورده شده، میدن. مثلاََ کلمه “بانک” رو در جمله “من به حساب … دسترسی دارم” باتوجه به کلمات پیرامونش که در متن بکار برده شده حدس میزنه، نه تنها براساس کلمه “حساب”.

برای آنالیز دقیق‌تر و بهتر الگوریتم های گوگل بهتره یه سری هم به این پست بزنین!

آیا گوگل از برت برای معنادار کردن تمامی سرچ ها استفاده می‌کنه؟

خیر! درواقع BERT، گوگل رو در فهمیدن یک دهم سرچ‌ ها به زبان انگلیسی در آمریکا تقویت خواهدکرد. مخصوصاََ برای سرچ‌ هایی با سوالات طولانی‌تر، محاوره ای، یا اون‌هایی که کلماتی مثل “برای” یا “به” دارند و فهمیدنشون سخته، به این ترتیب گوگل منظورتون رو از کلمات استفاده شده در متن کوئری‌تون متوجه می‌شه.

هرچند تمامی سوالات کوئری محاوره ای نیستند و یا شامل کلماتی مثل “به”، “تا”، “از” و غیره نمی‌شن. مثلاََ سرچ‌ های برند شده و یا عبارات کوتاه فقط دو نمونه از کوئری‌هایی هستند که به الگوی NLP برت نیاز ندارد.

بنظرتون تأثیر BERT بر اسنیپت های برجسته چطوریه؟

برت ممکنه بر نتایج اسنیپت‌ های برجسته هم اثر بذاره، در مثالی گوگل، اسنیپت‌ های برجسته رو برای کوئری “پارک کردن در محلی بدون جدول” باهم مقایسه می‌کنه و توضیح میده که درگذشته چنین سرچی سیستم‌های ما رو دچار سردرگمی می‌کرد.

ما روی کلمه “جدول” خیلی تأکید کرده بودیم و کلمه “بدون” رو در نظر نمی‌گرفتیم، غافل از اینکه این کلمه چه تأثیر مهمی روی سرچ می‌ذاره. بنابراین نتایج با جمله ” پارک کردن در محلی با جدول” نشان داده می‌شد.

 

ولی حالا با کوچکترین تغییری در کوئری ممکنه نتیجه گوگل هم متفاوت بشه!

 

BERT دیگه روی کدوم یکی از محصولات گوگل تأثیر گذاشته؟

اعلان گوگل برای الگوریتم برت، فقط به جست‌وجو مربوطه، درحالیکه تأثیرات به سزایی بر Assistant نیز خواهد گذاشت. هنگامی‌که کوئری‌های هدایت شده به Google Assistant، اون رو برای ساختن اسنیپت‌ های برجسته یا نتایج وب از جستجو راه‌اندازی می‌کنند، این نتایج ممکنه تحت تأثیر برت باشند.

به گفته‌ی گوگل Search Engine Land درحال حاضر از برت برای تبلیغات استفاده نکرده است، اما اگه در آینده یکپارچه بشه ممکنه به کاهش برخی از گزینه‌های منطبقِ بسیار نزدیک که تبلیغ کنندگان رو اذیت می‌کنه، کمک کنه.

چطوری می‌تونم برای BERT بهینه سازی انجام بدم؟

به گفته ی Sullivan :

نقل قول
هیچ روش بهینه سازی برای BERT وجود نداره. درواقع به‌روزرسانی جدید، تنها الگوریتم‌های ما رو هوشمندتر کرده و این یعنی بهتر می‌تونن محتوایی که برای کاربر نوشته رو درک کنن و نتایج نزدیک‌تری ارائه کنن.

چرا باید برت برامون مهم باشه؟

ما باید حواسمون رو جمع این آپدیت بکنیم، نه فقط بخاطر گفته گوگل که اظهار داشته این بزرگترین آپدیت پنج سال اخیر و یکی از بزرگترین جهش‌های تاریخ جست‌وجوست، بلکه به این خاطر که قراره 10% از جست‌وجوها تحت تأثیر قرار بگیرند و ترافیک سایتتون رو تغییر بدن.

گوگل هر ساله تغییرات زیادی رو در الگوریتم‌ های خودش ایجاد می‌کنه و بسیاری از این تغییرات بقدری کوچیکه که کاربران متوجهش نمی‌شن و غالباََ نگرانن که نکنه رنکینگ اونها با آپدیت جدید افت کنه، ولی در واقع گوگل به دنبال بهبود تجربه کاربره و رضایت مخاطب، هدفشه.

الگوریتم‌ های جست‌وجو برای درک درست خیلی از کوئری‌های پیچیده، بسیار ساده‌اند و باعث بوجود اومدن مشکلاتی هم برای گوگل و هم برای وب‌مسترها شده پس نیاز به یه الگوریتم قوی و در عین‌حال ظریف حس می‌شد!

با درک بهتر تفاوت‌های ظریف زبانی، گوگل می‌تونه خیلی دقیق تر جست‌وجوگر رو به محتوای موردنظرش متصل کنه و این یه خبر خوب برای کساییه که نمایل دارن رنکینگ خودشون رو ارتقا بدن، پس حواستون رو شش دانگ جمع کنید و از این فرصت نهایت استفاده رو ببرید.

به‌طور خلاصه می‌تونیم چندتا مورد اساسی که الگوریتم برت تأثیر مهمی روشون گذاشته رو نام ببریم:

  • همونطور که گفتیم یکی از تأثیراتش روی ریزه کاریای زبانی مثل “به” یا “با” بود که باعث شد منظور کاربر رو بهتر درک کنه.
  • دومین تاثیرش روی ربات‌های گوگل بود که باعث شد زبان محاوره و کوئری‌های عامیانه ای که مردم سرچ می‌کردن رو بهتر درک کنه.
  • تاثیر سوم روی توجه ربات‌ها به جمله کامل و حدس زدن کلمه جا افتاده، باتوجه به کل متن بود و باعث شد ارتباط دوطرفه عمیق به‌وجود بیاد.
  • آخرین و شاید مهمترین تأثیری که داشت، انتخاب اسنیپت برجسته باتوجه به کلمات دقیقی که کاربر در کوئری استفاده کرده، بود. (مثال پارک کردن ماشین)

در پایان دقت کنیم که:

معمولاََ توصیه گوگل برای گرفتن رتبه خوب، این بوده که همیشه به کاربر توجه کنیم و به نحوی تولید محتوا کنیم که باعث رسیدن اون‌ها به اهداف جست‌وجوشون بشیم. از اون‌جایی که BERT به منظور تفسیر این اهداف طراحی شده، عاقلانه است که به کاربر چیزی که می‌خواهد رو ارائه بده.

پس میتونیم اینطور نتیجه بگیریم که هدف اصلی الگوریتم BERT، درک بهتر و دقیق‌تر هدف جست‌وجوی کاربره.

اکنون بهینه سازی به این معناست که شما می‌تونید بجای سازش بین تولید محتوا برای مخاطبتون و تفسیر اصطلاحات خطی برای ماشین‌ها، بیشتر بر خوب و واضح نوشتن تمرکز کنید و بدونین رعایت نکات زبانی و نوشتن محتوای جذاب و مفید می‌تونه باعث تغییر ترافیک شما و بهبود سئو سایتتون هم بشه!

راستی اگه تغییراتی در ترافیک سایتتون حس کردین که مربوط به الگوریتم BERT هست، حتما ما رو در جریان بذارین و بهمون اطلاع بدین. *-^

Author

مدیریت سایت

Leave a comment

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *


The reCAPTCHA verification period has expired. Please reload the page.