Google Podcast: كيف تختار Google الصفحة الأساسية


شارك Martin Splitt ثروة من المعلومات حول كيفية اكتشاف Google للصفحات المكررة ثم اختار الصفحة الأساسية لتضمينها في صفحات نتائج محرك البحث.

شارك أيضًا في كيفية ترجيح عشرين إشارة مختلفة على الأقل للمساعدة في تحديد الصفحة الأساسية ولماذا يتم استخدام التعلم الآلي لضبط الأوزان.

كيف تتعامل Google مع تحديد العنوان المتعارف عليه

يبدأ مارتن أولاً بتوضيح كيفية الزحف إلى المواقع وفهرسة المستندات. ثم انتقل إلى الخطوة التالية ، تحديد العنوان المتعارف عليه واكتشاف التكرارات.

يذهب إلى التفاصيل حول كيفية تقليل المحتوى إلى المجموع الاختباري ، وهو رقم ، ثم تتم مقارنته بالمجموعات الاختبارية في الصفحات الأخرى لتحديد مجاميع اختبارية متطابقة.

مارتن:

“لقد جمعنا الإشارات والآن انتهينا من الخطوة التالية ، وهي حقًا تحديد الاتجاه الصحيح واكتشاف الخداع.

… أولاً ، عليك تحديد المغفلين ، وتجميعهم معًا بشكل أساسي ، قائلاً إن كل هذه الصفحات مغفلة مع بعضها البعض. وبعد ذلك عليك أن تجد أساسًا صفحة رائدة لكل منهم.

وربما تكون الطريقة التي نقوم بها هي الطريقة التي يقوم بها معظم الأشخاص ، محركات البحث الأخرى ، والتي تقلل المحتوى إلى تجزئة أو مجموع اختباري ثم مقارنة المجاميع الاختبارية.

وذلك لأنه من الأسهل القيام بذلك بدلاً من مقارنة ربما ثلاثة آلاف كلمة

… ولذا فإننا نقوم بتقليص المحتوى إلى مجموع اختباري ونقوم بذلك لأننا لا نريد مسح النص بالكامل لأنه لا معنى له. في الأساس ، هناك حاجة إلى مزيد من الموارد وستكون النتيجة هي نفسها عمليًا. لذلك نحسب أنواعًا مختلفة من المجاميع الاختبارية على المحتوى النصي للصفحة ثم نقارنها بالمجموعات الاختبارية “.

ميلادي

أكمل القراءة أدناه

يستجيب مارتن أدناه إذا اكتشفت هذه العملية وجود تكرارات تقريبًا أو تكرارات دقيقة:

سؤال جيد. يمكنك التقاط كليهما. يمكنك أيضًا التقاط التكرارات القريبة.

لدينا خوارزميات مختلفة تحاول ، على سبيل المثال ، اكتشاف النص القياسي ثم إزالته من الصفحات.

لذلك ، على سبيل المثال ، نستبعد التنقل من حساب المجموع الاختباري. قمنا أيضًا بإزالة التذييل. وبعد ذلك يتبقى لك ما نسميه المحور ، وهو المحتوى الأساسي للصفحة ، نوعًا ما مثل لحم الصفحة.

عندما نحسب المجاميع الاختبارية ونقارنها ببعضها البعض ، تلك المتشابهة تمامًا ، أو المتشابهة قليلاً على الأقل ، سنجمعها معًا في مجموعة من التكرارات “.

ثم سُئل مارتن ما هو المجموع الاختباري:

“المجموع الاختباري هو في الأساس تجزئة للمحتوى. في الأساس بصمة. إنها في الأساس بصمة لشيء ما. في هذه الحالة ، هو محتوى الملف.

وبمجرد حساب هذه المجاميع الاختبارية ، لدينا مجموعة التكرارات. ثم يتعين علينا تحديد مستند نريد إظهاره في نتائج البحث “.

ميلادي

أكمل القراءة أدناه

ناقش مارتن بعد ذلك سبب منع Google للصفحات المكررة من الظهور في SERP:

“لماذا نفعل ذلك؟ نحن نفعل ذلك لأن المستخدمين عادةً لا يحبونه عندما يتكرر نفس المحتوى في العديد من نتائج البحث. ونفعل ذلك أيضًا لأن مساحة التخزين لدينا في الفهرس ليست لانهائية. أساسًا ، لماذا هل نريد تخزين نسخ مكررة في فهرسنا؟ “

ثم تعود إلى قلب الموضوع ، وتكتشف التكرارات وتختار الصفحة الأساسية:

“لكن حساب أيهما سيكون الصفحة الأساسية ، أي الصفحة لقيادة المجموعة ، ليس بهذه السهولة حقًا. نظرًا لوجود سيناريوهات يكون فيها من الصعب جدًا معرفة الصفحة التي يجب أن تظهر في نتائج البحث حتى بالنسبة إلى البشر.

لذلك استخدمنا ، على ما أعتقد ، أكثر من عشرين إشارة ، استخدمنا أكثر من عشرين إشارة ، لتحديد الصفحة التي نختارها كصفحة أساسية من مجموعة من الخدع.

وربما يستطيع معظمكم تخمين ما ستكون عليه هذه العلامات. كما هو واضح المحتوى.

ولكن يمكن أن تكون أيضًا أشياء مثل PageRank ، على سبيل المثال ، مثل الصفحة التي لديها ترتيب صفحات أعلى ، لأننا ما زلنا نستخدم PageRank بعد كل هذه السنوات.

قد يكون ، خاصة على نفس الموقع ، الصفحة الموجودة على عنوان URL https ، أو الصفحة التي تم تضمينها في خريطة الموقع ، أو إذا كانت إحدى الصفحات تعيد التوجيه إلى الصفحة الأخرى ، فهذه علامة واضحة جدًا على أن الصفحة الأخرى يجب أن تصبح القالب rel = canonical أساسية … إنها إشارة قوية جدًا مرة أخرى … لأن … شخصًا ما حدد أن تلك الصفحة الأخرى يجب أن تكون أساسية.

وبمجرد أن نقارن كل هذه الإشارات لجميع أزواج الصفحات ، نكون قد انتهينا من الأساسي الفعلي. ثم كل من هذه الإشارات التي نستخدمها لها وزنها الخاص. ونستخدم بعض أدوات الدودو للتعلم الآلي لحساب وزن هذه الإشارات “.

أصبح الآن دقيقًا ويشرح سبب منح Google لعمليات إعادة التوجيه وزنًا أكبر من إشارة عنوان url http / https:

“ولكن على سبيل المثال ، لإعطائك فكرة ، يجب أن يكون لإعادة التوجيه 301 أو أي نوع من إعادة التوجيه أهمية أكبر بكثير عندما يتعلق الأمر بتحديد العنوان الأساسي مما لو كانت الصفحة على عنوان URL http أو https.

لأنه في النهاية سيرى المستخدم هدف إعادة التوجيه. لذلك ليس من المنطقي تضمين مصدر إعادة التوجيه في نتائج البحث “.

يسأل مولر لماذا تستخدم Google التعلم الآلي لضبط أوزان الإشارة:

“إذن هل نحن مخطئون في بعض الأحيان؟ لماذا نحتاج إلى التعلم الآلي ، كما نكتب بوضوح هذه الأوزان مرة واحدة ثم إنها صحيحة تمامًا؟ “

شارك مارتن بعد ذلك حكاية عن العمل على تحديد العنوان المتعارف عليه ، في محاولة لإدخال hreflang في الحساب كإشارة. قال إن محاولة ضبط الأوزان يدويًا كانت كابوسًا. وقال إن ضبط الأوزان يدويًا يمكن أن يتخلص من الأوزان الأخرى ، مما يؤدي إلى نتائج غير متوقعة ، مثل نتائج بحث غريبة لا معنى لها.

ميلادي

أكمل القراءة أدناه

شارك مثالاً خطأً لصفحات ذات عناوين URL قصيرة مرتبة فجأة في مرتبة أعلى ، والتي وصفها مارتن بأنها سخيفة.

كما شارك أيضًا حكاية لتقليل الإشارة يدويًا من خريطة الموقع للتعامل مع خطأ متعلق بالتعريف المتعارف عليه ، ولكن هذا يجعل إشارة أخرى أقوى ، مما يتسبب بعد ذلك في مشاكل أخرى.

النقطة المهمة هي أن جميع إشارات الترجيح مترابطة بشكل وثيق وأن التعلم الآلي ضروري لإجراء تغييرات ناجحة في الوزن.

مارتن:

“لنفترض … أن وزن إشارة خريطة الموقع مرتفع للغاية. وبعد ذلك ، لنفترض أن فريق المغفلين يقول ، حسنًا ، لنقلل هذه الإشارة قليلاً.

ولكن بعد ذلك عندما يقللون هذه الإشارة قليلاً ، تصبح بعض الإشارات الأخرى أكثر قوة.

لكن لا يمكنك التحكم في أي إشارة لأن هناك عشرين.

ثم يقوم بتعديل تلك الإشارة الأخرى التي أصبحت فجأة أقوى أو أثقل ثم تلقي إشارة أخرى. وبعد ذلك تقوم بتعديلها وهي في الأساس لعبة لا نهاية لها ، إنها لعبة ضرب الخلد.

لذلك إذا قمت بإرسال كل هذه الإشارات إلى خوارزمية التعلم الآلي بالإضافة إلى جميع النتائج المرغوبة ، فيمكنك تدريبها على تعيين هذه الأوزان لك ثم استخدام تلك الأوزان التي تم حسابها أو اقتراحها بواسطة خوارزمية التعلم الآلي. “

ميلادي

أكمل القراءة أدناه

بعد ذلك ، يسأل جون مولر ما إذا كانت تلك العشرين بيزو ، مثل علامة خريطة الموقع المذكورة أعلاه ، يمكن اعتبارها علامات ترتيب.

مولر:

هل هذه الأوزان عامل ترتيب أيضًا؟ … أم أن تحديد العنوان المتعارف عليه مستقل عن التصنيف؟ “

أجاب مارتن:

“لذا فإن التطابق المتعارف عليه مستقل تمامًا عن الترتيب. لكن الصفحة التي نختار أن تكون الصفحة الأساسية ستنتهي في صفحات نتائج البحث وترتيبها ، ولكن ليس بناءً على هذه الإشارات “.

يبعد

شارك مارتن كثيرًا حول كيفية عمل تحديد العنوان المتعارف عليه ، بما في ذلك تعقيده. ناقشوا تدوين هذه المعلومات في وقت لاحق ، لكنهم بدوا محبطين من مهمة تدوينها بالكامل.

كانت حلقة البودكاست بعنوان “كيفية كتابة المحتوى الفني لبحث Google ونشره ، والمزيد.” لكن يجب أن أقول إن الجزء الأكثر إثارة للاهتمام كان وصف مارتن لتقنية تحديد العنوان المتعارف عليه داخل Google.

استمع إلى البودكاست كاملاً:

بحث بودكاست غير قابل للحفظ



Related Posts

اترك رد