گوگل از يك سيستم هوش مصنوعي به نام “RankBrain” براي كمك به مرتب سازي نتايج جستجوي خود، استفاده ميكند. آيا شگفت زدهايد كه اين سيستم چگونه كار ميكند و چگونه با سيستم رتبه بندي گوگل هماهنگ است؟ در اينجا همه چيزهايي كه ما در مورد RankBrain ميدانيم را ميخوانيد.
اطلاعات اين مقاله از سه منبع اصلي به دست آمده است و به مرور زمان به روز رساني شدهاند كه همراه با يادداشتهايي در مورد بهروزرساني آنها ارائه ميشود. اين منابع عبارتند از:
- مقاله بلومبرگ كه اخبار مربوط به RankBrain را پوشش داده است.
- اطلاعات جانبي كه گوگل در حال حاضر مستقيما در گستره موتور جستجو ارائه ميدهد.
- دانش ما و بهترين فرضيات در مواردي كه گوگل پاسخي به آنها ارائه نميكند. همين طور برخي اطلاعات اين مقاله را تيم سئو نوين ماركتينگ آزمايش كرده و به نتايج جالبي در فارسي دست يافته است.
RankBrain چيست؟
RankBrain نام سيستم هوش مصنوعي گوگل در قالب يادگيري ماشين است؛ كه براي كمك به پردازش نتايج جستجو استفاده ميشود و توسط گزارشهاي بلومبرگ و همچنين توسط شركت گوگل تاييد شده است.
يادگيري ماشين چيست؟
يادگيري ماشين پديدهاي است كه يك كامپيوتر به خود و نه توسط افراد ديگر يا برنامه ريزيهاي دقيق، ميآموزد كه چگونه كارها را انجام دهد.
هوش مصنوعي چيست؟
هوش مصنوعي واقعي، يا به اختصار AI، پديدهاي است كه در آن كامپيوتر به اندازه يك فرد باهوش هوشمند ميشود. به عبارت ديگر دستيابي به دانش از طريق آموزش و يا از طريق ايجاد ساختارهايي بر مبناي چيزي كه ميداند و ارتباطات جديد را بر اساس آن برقرار مي كند.
البته AI واقعي فقط در رمانهاي علمي تخيلي وجود دارد. در عمل، AI به سيستمهاي كامپيوتري اشاره دارد كه براي يادگيري و ايجاد ارتباطات استفاده ميشوند.
AI چه تفاوتي با يادگيري ماشين دارد؟
يادگيري ماشين و هوش مصنوعي، به نظر نسبتا مترادفاند. شما ممكن است آنها را به جاي يكديگر استفاده كنيد و يا ميتوانيد از زبان ماشين براي توصيف نوع روش هوش مصنوعي استفاده كنيد.
بنابراين RankBrain روش جديدي است كه گوگل نتايج جستجوي خود را با آن رتبه بندي ميكند؟
خير، RankBrain بخشي از الگوريتم كلي گوگل است. يك برنامه كامپيوتري كه براي طبقهبندي ميلياردها صفحه و پيدا كردن صفحه مرتبط و متناسب با درخواست كاربر استفاده مي شود.
نام الگوريتم جستجوي گوگل چيست؟
، الگوريتم جستجوي گوگل مرغ مگس خوار ( Hummingbird ) نام دارد. براي چندين سال، الگوريتم كلي نام رسمي نداشت. اما در اواسط سال ۲۰۱۳، گوگل اين الگوريتم را بازسازي كرد و نام آن را ( Hummingbird) گذاشت.
بنابراين RankBrain بخشي از الگوريتم جستجوي مرغ مگس خوار است؟
اين درك ماست. مرغ مگس خوار الگوريتم جستجوي كلي است، درست مانند يك ماشين كه موتوري در درون خود دارد. خود موتور ممكن است از قطعات مختلف ساخته شده باشد، مانند فيلتر روغن، پمپ سوخت، رادياتور و غيره. به همين ترتيب، مرغ مگس خوار شامل بخشهاي مختلفي است كه RankBrain يكي از جديدترين آنهاست.
به طور خاص، ما ميدانيم RankBrain بخشي از الگوريتم كلي Hummingbird است، زيرا مقاله بلومبرگ روشن ميكند كه RankBrain تمام جستجوها را مديريت نميكند و فقط الگوريتم كلي قادر به انجام اين كار است.
مرغ مگس خوار همچنين حاوي قسمت هاي ديگري است كه سازگار با فضاي SEO است، مانند پاندا Panda ، پنگوئن Penguin و ديگر الگوريتمهايي مانند روز پرداخت (Payday) كه براي مبارزه با اسپم ساخته شده، كبوتر(Pigeon) كه براي بهبود نتايج محلي مأموريت دارد، Top Heavy براي بارگذاري صفحات سنگين شامل تبليغات زياد عمل ميكند، Mobile Friendly براي ايجاد صفحات موردپسند كاربر بر روي موبايل و Pirate (دزدان دريايي) براي مبارزه با نقض قانون كپي رايت طراحي شدهاند.
من فكر مي كردم كه الگوريتم كلي گوگل “PageRank” ناميده مي شود؟
PageRank بخشي از الگوريتم كلي مرغ مگس خوار است كه يك روش خاص براي ارائه اعتبار به صفحات بر اساس لينكهايي است كه به صفحه اشاره دارد.
PageRank اولين نامي است كه گوگل به يكي از بخشهاي الگوريتم رتبهبندي خود در شروع به كار موتور جستجوي خود در سال ۱۹۹۸ داده است.
گوگل از چه «سيگنالهايي » براي رتبه بندي خود استفاده مي كند؟
سيگنالها چيزهايي هستند كه Google براي كمك به تعيين نحوه رتبه بندي صفحات وب استفاده ميكند. به عنوان مثال، كلمات را در يك صفحه وب ميخواند، بنابراين كلمات يك سيگنال هستند. اگر بعضي از كلمات با فونت درشت نوشته شده باشند، ممكن است سيگنال متفاوتي داشته باشند. محاسباتي كه به عنوان بخشي از PageRank استفاده ميشود، به آن صفحه يك امتياز PageRank ميدهد كه باز هم يك سيگنال است. اگر يك صفحه سازگار با تلفن همراه باشد، يك سيگنال ديگري را ثبت ميكند.
تمام اين سيگنالها توسط بخشهاي مختلف در الگوريتم مرغ مگس خوار پردازش ميشوند تا شناسايي كنند كدام صفحات در نتيجه جستجوي شما پيدا شدهاند.
چند سيگنال در آنجا وجود دارد؟
گوگل به طور مداوم بيش از ۲۰۰ دسته بندي سيگنال عمده دارد كه ممكن است تا ۱۰،۰۰۰ زير مجموعه سيگنال داشته باشد. همانطور كه در مقاله بلومبرگ نيز گفته شد، “صدها” عامل در آن مشاركت دارد.
اين تفكر به نظر ما يك راهنماي مناسب است كه به طور كلي نشان ميدهد موتورهاي جستجو مانند گوگل چگونه به رتبه بندي صفحات وب كمك ميكنند.
آيا RankBrain سومين سيگنال مهم است؟
درست است. طبق گفته گوگل اين سومين عامل مهم براي رتبه بندي صفحات وب است. برگرفته شده از مقاله بلومبرگ:
RankBrain يكي از “صدها” سيگنالي است كه در يك الگوريتم براي تعيين نتايج جستجوي گوگل و رتبه بندي آنها استفاده ميشود. در چند ماه گذشته، RankBrain سومين عامل مهم براي كمك به دسته بندي نتايج جستجو بوده است.
سيگنالهاي مهم اول و دوم چيست؟
در هنگام نگارش نخست اين مقاله، گوگل در اين باره چيزي نگفت. فرض ما اين بود:
لينك مهم ترين سيگنال باقيمانده است و گوگل اين لينكها را در قالب راي شمارش ميكند. اين همچنين يك سيستم به شدت سالخورده است كه در لينكهاي خود آنها را پوشش دادهام: سيستم شكست خورده “Ballet Box ” كه توسط گوگل و بينگ در گذشته استفاده ميشد.
به عنوان دومين سيگنال مهم، حدس ميزنم كه «كلمات» باشند، چرا كه كلمات شامل همه چيز از كلمات موجود در صفحات وب گرفته تا آناليز و تحليل كلماتي كه كاربران در نوار ابزار جستجو وارد در خارج از RankBrain وارد ميكنند.[ البته اين نظر نويسنده مقاله سرچ انجين لند است و شايد كارشناسان خدمات سئو برجسته و متخصصان هوش مصنوعي نظر ديگري داشته باشند آن چيز كه روشن است گوگل هنوز بر روي اين دو بخش تأكيد ويژهاي دارد. ]
اين كاملا درست بود. در مارس ۲۰۱۶، گوگل دو عامل اول را رونمايي كرد كه شامل محتوا و لينكها بودند. اما بين دو عامل لينكها و محتوا گفته نشد كدام يك اول است.
RankBrain دقيقا چه كاري انجام مي دهد؟
با مكاتبه با گوگل، من متوجه شدم RankBrain عمدتا براي توصيف جستجوي كلمات استفاده ميشود تا صفحاتي كه داراي كلماتي هستند كه به صورت دقيق در عبارات جستجو نوشته نشدهاند را پيدا كنند.
آيا Google در حال حاضر راهي براي پيدا كردن صفحات فراتر از درخواست دقيق وارد شده ندارد؟
بله، گوگل صفحات فراتر از شرايط دقيق جستجو شده را براي مدتي طولاني پيدا ميكرد. به عنوان مثال، سالها پيش، اگر شما چيزي شبيه “كفش” را وارد ميكرديد، ممكن بود گوگل صفحاتي را كه كلمه “كفشها” در آن ذكر شده بود را پيدا نكند زيرا آنها از نظر فني دو كلمه متفاوتاند. اما “ريشه يابي كلمات” گوگل را دقيقتر و هوشمندتر كرد تا آن را قادر سازد تفاوتي بين كفش و كفشها قائل نشود درست مانند “دويدن” كه به نوعي مشتق شده از “بدو” است.
گوگل همچنين در مورد اصطلاحات مترادف نيز هوشمند شده است، بنابراين اگر شما “كفشهاي كتاني” را جستجو كنيد، ممكن است نتايجي در مورد “كفشهاي دويدن” نيز براي شما نمايش داده شود. همچنين به لحاظ مفهومي نيز اصلاحاتي صورت گرفته است تا بين كمپاني اپل و ميوه سيب نيز قادر به تمايز باشد.
در مورد گراف دانش چه نكته اي وجود دارد؟
نمودار دانش يا گراف دانش كه در سال ۲۰۱۲ راه اندازي شد، راهي بود كه گوگل را براي برقراري ارتباط بين كلمات هوشمندتر كرد. مهمتر از آن، گوگل همچنين ياد گرفته است بين رشتهها و عبارات تفكيك قائل شود.
رشتهها به معني جستجو تمامي صفحاتي است كه داراي كلمهاي با املاي درست مانند “اوباما” هستند. اما در مورد عبارات، با جستجوي كلمه “اوباما” گوگل متوجه ميشود كه احتمالا منظور شما “باراك اوباما” رئيس جمهور آمريكا است و يك فرد واقعي با ارتباط با اوباما، مكانها و چيزهاي ديگر را به شما نمايش ميدهد.
نمودار دانش پايگاهي از حقايق مربوط به جهان و روابط بين آنها است. به همين دليل است كه شما مي توانيد جملاتي مانند “همسر اوباما در چه زماني متولد شد” را جستجو كنيد و اطلاعاتي در مورد ميشل اوباما، بدون حتي استفاده از نام او، كسب كنيد.
چگونه RankBrain به پالايش درخواستهاي شما كمك مي كند؟
روشهايي كه گوگل در حال حاضر براي اصلاح پرسشها استفاده ميكند، بين افراد در اقصي نقاط جهان كه مشغول انجام كاري هستند، ليستهاي ريشهيابي كلمات ايجاد كردهاند؛ يا يك پايگاه داده از ارتباط بين اشيا را كشف كردهاند؛ جريان دارد. مطمئنا اين افراد، اغلب از اتوماسيون استفاده ميكنند. اما عمدتا مبتني بر كار انساني است.
مشكل اين است كه گوگل ۳ ميليارد جستجو در روز را پردازش ميكند. در سال ۲۰۰۷، گوگل اعلام كرد كه ۲۰ تا ۲۵ درصد از اين درخواستها هرگز ديده نشدهاند. در سال ۲۰۱۳، اين تعداد را به ۱۵ درصد كاهش داد، كه مجددا در مقاله بلومبرگ مورد استفاده قرار گرفت و گوگل نيز آن را تأييد كرد. اما هنوز هم ۱۵ درصد سه ميليارد، آمار بسيار بالايي است كه هرگز توسط يك انسان جستجوگر وارد نشده است – ۴۵۰ ميليون در روز.
در ميان آنها ممكن است درخواستهاي پيچيده، چند كلمهاي، تحت عنوان ” بلند امتداد (long-tail)” وجود داشته باشد. RankBrain طراحي شده است كه به شما كمك كند تا بهتر اين درخواستها را تفسير و به طور موثر ترجمه كنيد و در پشت صحنه تلاشهاي ميكند تا بهترين صفحات نتايج را براي جستجوگر نمايش دهد.
همانطور كه گوگل به ما گفت، شما ميتوانيد الگوهايي را مشاهده كنيد كه به ظاهر پيچيده و نامربوطاند اما ميتوانيد درك كنيد كه آنها واقعا چگونه با يكديگر همخواني دارند. اين يادگيري، به خودي خود، شما را قادر ميسازد تا جستجوهاي پيچيده آينده و اينكه آيا آنها مربوط به موضوعات خاص هستند را درك كنيد. مهمتر از همه طبق گفته گوگل، اين ميتواند نتايجي را براي گروههاي تحقيقاتي نمايش دهد كه بيشتر علاقهمند به ديدن آن هستند.
گوگل نمونههايي از گروههاي تحقيقاتي و جزئيات بيشتري در مورد نحوه رتبه بندي صفحات سازگار با علايق آنها را ارائه نميدهد. اما ممكن است با ترجمه و تعبير مناسب جستجوهاي مبهم آنها، به پايگاه داده خاصي دسترسي پيدا ميكند و قادر خواهد بود پاسخهاي بهتري را براي آنها نمايش دهد.
در اين مورد مثالي هست؟
[نويسنده مقاله سرچ انجين لند در اين مورد دست به تحقيق زده است و دو جمله پيچيده را در گوكل سرچ كرده است و به نتايج جالب دست پيدا كرده است. اما ترجمه اين جمله مستلزم ترجمه تمام نتايج به دست آمده گوگل است كه آوردن تمام اين نتايج را در مقاله خود لازم نميداند علاقهمندان به اين تست سرچ انجين لند به لينك اين مقاله در قسمت منابع رجوع كنند. اما باز نميتوان گفت كه رنك برين ميتواند از پس تمام ارتباطات مفهومي در همه زبانها برآيد و بين همه مفهوم ها به راحتي ارتباط برقرار كند. نتايج خاصي درباره گروه هاي جستجو در فارسي به دست نوين ماركتينگ نرسيده است. ولي اگر دوست داريد رنك برين را در فارسي امتحان كنيد در گوگل سرچ كنيد ” دستور پخت آن غذايي كه لپه و گوشت دارد ” و چند دستور پخت خورشت قيمه و شامي را به دست آوريد بي آن كه كلمه ” قيمه با خورش قيمه” را سرچ كرده باشيد.]
نمونه ديگر؟
گوگل به ما يك مثال تازه داد: در سرچ “چند قاشق غذا خوري در يك فنجان؟” گوگل گفت كه RankBrain نتايج مختلفي در استراليا در مقايسه با ايالات متحده براي اين نوع درخواست ارائه داده است، چرا كه اين نوع مجموعه كلمات در كشورهاي مختلف با وجود شباهت ظاهري، در مكانهاي گوناگون معاني متفاوتي دارند.
من سعي كردم اين را با جستجوي Google.com در مقابل گوگل استراليا آزمايش كنم. من خودم تفاوت زيادي نديدم. حتي بدون RankBrain، نتايج اغلب به اين شكل متفاوت خواهد بود، فقط به اين معني است كه «ابزار قديمي» به نفع صفحات شناخته شده در استرالياست كه از گوگل استفاده كردهاند.
آيا RankBrain واقعا كمك ميكند؟
بر خلاف دو مثال ذكر شده در بالا، من شديدا معتقدم كه اين كشف جديد طبق ادعاي گوگل، تاثير بزرگي داشته است. اين شركت در مورد الگوريتم رتبه بندي خود نسبتا محافظه كار است. گوگل هميشه تستهاي كوچكي را برگزار ميكند. اما فقط زماني كه به قطعيت بالايي در خصوص تغييري دست مييابد آن را اعمال ميكند.
به نظر ميرسد كه يكپارچه سازي RankBrain به درجه اي دست يافته است كه به عنوان سومين سيگنال مهم، بعد از لينك ها و كلمات كليدي، شناخته شود، و البته يك تغيير بزرگ به شمار ميرود. اين تاييد كننده حدس من بود كه گوگل پيش از اينكه از مفيد بودن تغييري مطمئن نشود از آن رونمايي نميكند.
RankBrain چه زماني شروع بكار كرد؟
گوگل اعلام كرد كه در اوايل سال ۲۰۱۵ RankBrain به آرامي در حال پيشرفت است و از تابستان ۱۳۹۵ (۲۰۱۶)چند ماه است كه به طور كامل زنده و جهاني مورد استفاده قرار مي گيرد.
چه درخواست هايي تحت تاثير قرار مي گيرند؟
در اكتبر سال ۲۰۱۵، گوگل به بلومبرگ اعلام كرد كه “بخش بسيار زيادي” از ۱۵ درصد از درخواست ها كه معمولا قبلا هرگز ديده نميشدند توسط RankBrain پردازش شدهاند در حقيقت ۱۵ درصد يا كمتر.
در ژوئن سال ۲۰۱۶، گوگل رسما اعلام كرد كه در حال استفاده از RankBrain براي همه درخواستهايي است كه گوگل با آنها سروكار دارد.
آيا RankBrain هميشه در حال يادگيري است؟
طبق گفته گوگل، همه آموزشي كه RankBrain دريافت ميكند آفلاين است. اين مجموعهاي از تاريخچه جستجوها را به شما نشان ميدهد و ياد ميگيرد تا پيشبينيهاي مربوطه را انجام دهد.
اين پيشبينيها مورد آزمايش قرار ميگيرند و اگر ثابت شود تاثيرگذارند، آخرين نسخه RankBrain به طور زنده بر روي آنها اجرا ميشود. سپس چرخه يادگيري آفلاين و تست تكرار ميشود.
آيا RankBrain كاري بيشتر از پالايش جستجو انجام مي دهد؟
به طور معمول، چگونگي پالايش و تصحيح يك درخواست – از طريق ريشه يابي كلمه، مترادف ها و در حال حاضر با RankBrain – به عنوان عامل رتبه بندي و يا سيگنال در نظر گرفته نشده است.
سيگنالها نوعي از عواملاند كه به محتوا مرتبطاند، مانند يك كلمه در صفحه وب، همچنين لينكهاي صفحات مختلف و اينكه آيا يك سرور امن است و غيره. سيگنال ها همچنين ميتوانند مربوط شوند به يك كاربر، مانند يك جستجوگر يا جايي كه جستجو و سابقه آن نمايش داده مي شوند.
بنابراين وقتي گوگل در مورد RankBrain به عنوان سومين سيگنال مهم صحبت ميكند، آيا واقعا منظورش سيگنال رتبه بندي است؟ بله، گوگل در اينجا ليستي را تائيد كرده است كه نشان ميدهد RankBrain به طور مستقيم به رتبه بندي صفحات كمك ميكند.
دقيقا چگونه؟ آيا نوعي امتياز بندي براي RankBrain وجود دارد كه ممكن است كيفيت را ارزيابي كند؟ شايد، اما به نظر ميرسد كه RankBrain به نوعي كمك ميكند تا گوگل بهتر بتواند صفحات را بر مبناي محتواي آنها رتبه بندي كند. RankBrain ممكن است بتواند به طور خلاصه نشان دهد كه سيستم هاي موجود گوگل ميتوانند چه كارهايي را انجام دهند.
يا نه ،گوگل چيزي جز يك رتبه بندي مبتني بر عوامل مختلف را شامل نميشود.
چگونه مي توانم بيشتر در مورد RankBrain ياد بگيرم؟
گوگل به ما گفت افرادي كه ميخواهند در مورد كلمه “بردار” مطالبي بياموزند – روشي كه كلمات و عبارات ميتوانند به صورت رياضي به يكديگر مرتبط شوند – بايد پستهاي وبلاگ گوگل را بررسي كنند. در اين پست توضيح داده شده است RankBrain با استفاده از مفاهيم رياضي توانسته است پايتخت هاي كشور ها را تنها با اسكن مقالات پيدا كند .
مقاله تحقيقاتي ديگر وجود دارد كه نتايجي بر مبناي آن بدست ميآيد. شما حتي مي توانيد با يادگيري ماشين، خود و با استفاده از ابزار word2vec گوگل اين كار را انجام دهيد. علاوه بر اين، شما ميتوانيد از دو ابزار entire area گوگل و as does مايكروسافت براي آزمايش هوش مصنوعي استفاده كنيد و با آن بيشتر آشنا شويد.