نظام البحث. الفهم العام لمحركات البحث

نظام البحث عبارة عن مجمع من البرامج والأجهزة مصمم للبحث في الإنترنت والاستجابة لطلب المستخدم، المحدد في شكل عبارة نصية (استعلام بحث)، عن طريق إنتاج قائمة من الروابط إلى مصادر المعلومات، حسب الأهمية ( حسب الطلب). أكبر محركات البحث العالمية: "جوجل", "ياهو", "ام اس ان". على الإنترنت الروسي هو - "ياندكس", "متسكع", "مطار".

دعونا نصف الخصائص الرئيسية لمحركات البحث:

    الاكتمال

يعد الاكتمال أحد الخصائص الرئيسية لنظام البحث، وهو نسبة عدد المستندات التي تم العثور عليها حسب الطلب إلى إجمالي عدد المستندات الموجودة على الإنترنت التي تلبي الطلب المحدد. على سبيل المثال، إذا كان هناك 100 صفحة على الإنترنت تحتوي على عبارة "كيفية اختيار سيارة"، وتم العثور على 60 منها فقط للاستعلام المقابل، فإن اكتمال البحث سيكون 0.6. ومن الواضح أنه كلما كان البحث أكثر اكتمالا، قل احتمال عدم عثور المستخدم على الوثيقة التي يحتاجها، بشرط أن تكون موجودة على الإنترنت على الإطلاق.

    دقة

الدقة هي سمة رئيسية أخرى لمحرك البحث، والتي يتم تحديدها من خلال درجة تطابق المستندات التي تم العثور عليها مع استعلام المستخدم. على سبيل المثال، إذا كان الاستعلام "كيفية اختيار سيارة" يحتوي على 100 مستند، 50 منها تحتوي على عبارة "كيفية اختيار سيارة"، والباقي يحتوي ببساطة على هذه الكلمات ("كيفية اختيار الراديو المناسب وتثبيته في سيارة")، فإن دقة البحث تعتبر 50/100 (=0.5). كلما كان البحث أكثر دقة، كلما أسرع المستخدم في العثور على المستندات التي يحتاجها، وأقل أنواع مختلفة من "القمامة" التي سيتم العثور عليها فيما بينها، وأقل في كثير من الأحيان لن تتوافق المستندات التي تم العثور عليها مع الطلب.

    ملاءمة

تعد الملاءمة عنصرًا لا يقل أهمية في البحث، والذي يتميز بالوقت الذي يمر من لحظة نشر المستندات على الإنترنت حتى يتم إدخالها في قاعدة بيانات فهرس محرك البحث. على سبيل المثال، في اليوم التالي لظهور الأخبار المثيرة للاهتمام، تحول عدد كبير من المستخدمين إلى محركات البحث ذات الاستعلامات ذات الصلة. من الناحية الموضوعية، لقد مر أقل من يوم على نشر المعلومات الإخبارية حول هذا الموضوع، لكن الوثائق الرئيسية تمت فهرستها بالفعل وإتاحتها للبحث، وذلك بفضل وجود ما يسمى بـ "قاعدة البيانات السريعة" لمحركات البحث الكبيرة، والتي يتم تحديثه عدة مرات في اليوم.

    سرعة البحث

ترتبط سرعة البحث ارتباطًا وثيقًا بمقاومة الحمل. على سبيل المثال، وفقًا لشركة Rambler Internet Holding LLC، اليوم، خلال ساعات العمل، يتلقى محرك بحث Rambler حوالي 60 طلبًا في الثانية. يتطلب عبء العمل هذا تقليل وقت معالجة الطلب الفردي. هنا تتطابق مصالح المستخدم ومحرك البحث: يريد الزائر الحصول على النتائج في أسرع وقت ممكن، ويجب على محرك البحث معالجة الطلب في أسرع وقت ممكن، حتى لا يبطئ حساب الاستعلامات اللاحقة.

    الرؤية

يعد العرض المرئي للنتائج عنصرًا مهمًا للبحث المريح. بالنسبة لمعظم الاستعلامات، يعثر محرك البحث على مئات، أو حتى آلاف، المستندات. بسبب الاستعلامات غير الواضحة أو عمليات البحث غير الدقيقة، حتى الصفحات الأولى من نتائج البحث لا تحتوي دائمًا على المعلومات الضرورية فقط. وهذا يعني أنه يتعين على المستخدم في كثير من الأحيان إجراء بحثه الخاص ضمن القائمة التي تم العثور عليها. تساعدك العناصر المختلفة لصفحة نتائج محرك البحث على التنقل في نتائج البحث، ويمكن العثور على شرح تفصيلي لصفحة نتائج البحث، على سبيل المثال لـ Yandex، على الرابط http://help.yandex.ru/search/?id=481937.

4. تاريخ موجز لتطور محركات البحث

في الفترة الأولى من تطور الإنترنت، كان عدد مستخدميها صغيرًا، وكانت كمية المعلومات المتاحة صغيرة نسبيًا. بالنسبة للجزء الأكبر، كان طاقم البحث فقط هو الذي يمكنه الوصول إلى الإنترنت. في هذا الوقت، لم تكن مهمة البحث عن المعلومات على الإنترنت ملحة كما هي الآن.

كانت إحدى الطرق الأولى لتنظيم الوصول إلى موارد معلومات الشبكة هي إنشاء أدلة مفتوحة للمواقع، حيث تم تجميع الروابط إلى الموارد حسب الموضوع. وكان أول مشروع من هذا القبيل هو موقع Yahoo.com، الذي افتتح في ربيع عام 1994. وبعد زيادة عدد المواقع في دليل Yahoo بشكل ملحوظ، تمت إضافة إمكانية البحث عن المعلومات الضرورية في الدليل. بالمعنى الكامل، لم يكن بعد محرك بحث، لأن منطقة البحث تقتصر فقط على الموارد الموجودة في الكتالوج، وليس على جميع موارد الإنترنت.

تم استخدام أدلة الارتباط على نطاق واسع في الماضي، ولكنها فقدت شعبيتها بالكامل تقريبًا في الوقت الحاضر. نظرًا لأنه حتى الكتالوجات الحديثة ذات الحجم الضخم تحتوي على معلومات فقط حول جزء ضئيل من الإنترنت. يحتوي أكبر دليل لشبكة DMOZ (ويسمى أيضًا مشروع الدليل المفتوح) على معلومات حول 5 ملايين مصدر، بينما تتكون قاعدة بيانات محرك بحث Google من أكثر من 8 مليارات مستند.

كان أول محرك بحث متكامل هو مشروع WebCrawler، الذي تم نشره في عام 1994.

في عام 1995، ظهرت محركات البحث Lycos و AltaVista. كان الأخير رائداً في مجال البحث عن المعلومات على الإنترنت لسنوات عديدة.

في عام 1997، أنشأ سيرجي برين ولاري بيج محرك بحث جوجل كجزء من مشروع بحثي في ​​جامعة ستانفورد. يعد Google حاليًا محرك البحث الأكثر شعبية في العالم!

في سبتمبر 1997، تم الإعلان رسميًا عن محرك بحث Yandex، وهو الأكثر شهرة على الإنترنت باللغة الروسية.

يوجد حاليًا ثلاثة محركات بحث دولية رئيسية - Google وYahoo وMSN، والتي لديها قواعد بيانات وخوارزميات بحث خاصة بها. تستخدم معظم محركات البحث الأخرى (التي يوجد منها عدد كبير) بشكل أو بآخر نتائج المحركات الثلاثة المذكورة. على سبيل المثال، يستخدم بحث AOL (search.aol.com) قاعدة بيانات Google، بينما يستخدم AltaVista وLycos وAllTheWeb قاعدة بيانات Yahoo.

5. تكوين ومبادئ تشغيل نظام البحث

في روسيا، محرك البحث الرئيسي هو Yandex، يليه Rambler.ru، Google.ru، Aport.ru، Mail.ru. علاوة على ذلك، في الوقت الحالي، يستخدم Mail.ru محرك البحث وقاعدة البيانات Yandex.

تمتلك جميع محركات البحث الرئيسية تقريبًا هيكلها الخاص الذي يختلف عن محركات البحث الأخرى. ومع ذلك، فمن الممكن التعرف على المكونات الرئيسية المشتركة بين جميع محركات البحث. لا يمكن أن تكون الاختلافات في الهيكل إلا في شكل تنفيذ آليات التفاعل بين هذه المكونات.

وحدة الفهرسة

تتكون وحدة الفهرسة من ثلاثة برامج مساعدة (روبوتات):

Spider هو برنامج مصمم لتنزيل صفحات الويب. يقوم العنكبوت بتنزيل الصفحة واسترداد جميع الروابط الداخلية من تلك الصفحة. يتم تنزيل كود html لكل صفحة. تستخدم الروبوتات بروتوكولات HTTP لتنزيل الصفحات. العنكبوت يعمل على النحو التالي. يرسل الروبوت الطلب "get/path/document" وبعض أوامر طلب HTTP الأخرى إلى الخادم. ردًا على ذلك، يتلقى الروبوت دفقًا نصيًا يحتوي على معلومات الخدمة والمستند نفسه.

    رابط الصفحة

    تاريخ تنزيل الصفحة

    استجابة الخادم لرأس http

    نص الصفحة (رمز HTML)

الزاحف (العنكبوت "المسافر") هو برنامج يتتبع تلقائيًا جميع الروابط الموجودة على الصفحة. تحديد كافة الروابط الموجودة على الصفحة. وتتمثل مهمتها في تحديد المكان الذي يجب أن يذهب إليه العنكبوت بعد ذلك، بناءً على الروابط أو بناءً على قائمة عناوين محددة مسبقًا. يقوم الزاحف، باتباع الروابط الموجودة، بالبحث عن المستندات الجديدة التي لا تزال غير معروفة لمحرك البحث.

المفهرس (مفهرس الروبوت) هو برنامج يقوم بتحليل صفحات الويب التي تم تنزيلها بواسطة العناكب. يقوم المفهرس بتوزيع الصفحة إلى الأجزاء المكونة لها وتحليلها باستخدام الخوارزميات المعجمية والمورفولوجية الخاصة به. يتم تحليل عناصر الصفحة المختلفة، مثل النص والعناوين والروابط والميزات الهيكلية والنمطية وعلامات HTML الخاصة بالخدمة وما إلى ذلك.

وبالتالي، تسمح لك وحدة الفهرسة بالزحف إلى مجموعة معينة من الموارد باستخدام الروابط، وتنزيل الصفحات التي تمت مواجهتها، واستخراج الروابط إلى صفحات جديدة من المستندات المستلمة، وإجراء تحليل كامل لهذه المستندات.

قاعدة البيانات

قاعدة البيانات، أو فهرس محرك البحث، هي نظام تخزين بيانات، ومصفوفة معلومات يتم فيها تخزين المعلمات المحولة خصيصًا لجميع المستندات التي تم تنزيلها ومعالجتها بواسطة وحدة الفهرسة.

خادم البحث

يعد خادم البحث أهم عنصر في النظام بأكمله، حيث تعتمد جودة البحث وسرعته بشكل مباشر على الخوارزميات التي تكمن وراء عمله.

يعمل خادم البحث على النحو التالي:

    يخضع الطلب المستلم من المستخدم للتحليل الصرفي. يتم إنشاء بيئة المعلومات لكل مستند موجود في قاعدة البيانات (والتي سيتم عرضها لاحقًا في شكل مقتطف، أي معلومات نصية تتوافق مع الطلب في صفحة نتائج البحث).

    يتم تمرير البيانات المستلمة كمعلمات إدخال إلى وحدة تصنيف خاصة. تتم معالجة البيانات لجميع المستندات، ونتيجة لذلك يكون لكل مستند تصنيفه الخاص الذي يميز مدى ملاءمة الاستعلام الذي أدخله المستخدم والمكونات المختلفة لهذه الوثيقة المخزنة في فهرس محرك البحث.

    واعتماداً على اختيار المستخدم، يمكن تعديل هذا التصنيف من خلال شروط إضافية (على سبيل المثال، ما يسمى بـ “البحث المتقدم”).

    بعد ذلك، يتم إنشاء مقتطف، أي أنه لكل مستند يتم العثور عليه، يتم استخراج العنوان والملخص القصير الذي يطابق الاستعلام بشكل أفضل، ورابط للمستند نفسه من جدول المستندات، ويتم تمييز الكلمات التي تم العثور عليها.

    يتم إرسال نتائج البحث الناتجة إلى المستخدم في شكل SERP (صفحة نتائج محرك البحث) - صفحة نتائج البحث.

كما ترون، ترتبط جميع هذه المكونات ارتباطًا وثيقًا ببعضها البعض وتعمل في تفاعل، وتشكل آلية واضحة ومعقدة إلى حد ما لتشغيل نظام البحث، الأمر الذي يتطلب كميات هائلة من الموارد.

لا يوجد محرك بحث يغطي جميع موارد الإنترنت.

يقوم كل محرك بحث بجمع معلومات حول موارد الإنترنت باستخدام أساليبه الفريدة ويشكل قاعدة البيانات الخاصة به والتي يتم تحديثها دوريًا. يتم منح الوصول إلى قاعدة البيانات هذه للمستخدم.

تستخدم محركات البحث طريقتين للبحث عن الموارد:

    البحث حسب الموضوع كتالوجات - معلوماتيتم تقديمه في شكل هيكل هرمي. في المستوى الأعلى هناك فئات عامة ("الإنترنت"، "الأعمال"، "الفن"، "التعليم"، وما إلى ذلك)، وفي المستوى التالي يتم تقسيم الفئات إلى أقسام، وما إلى ذلك. المستوى الأدنى هو الروابط إلى صفحات ويب محددة أو موارد معلومات أخرى.

    البحث عن الكلمات الرئيسية (بحث الفهرس أو البحث التفصيلي) - يرسل المستخدم إلى محرك البحث طلب، تتكون من كلمات رئيسية. نظام عائداتللمستخدم قائمة بالموارد التي تم العثور عليها عند الطلب.

تجمع معظم محركات البحث بين طريقتي البحث.

يمكن أن تكون محركات البحث محلية وعالمية وإقليمية ومتخصصة.

في الجزء الروسي من الإنترنت (Runet)، محركات البحث ذات الأغراض العامة الأكثر شيوعًا هي Rambler (www.rambler.ru)، وYandex (www.yandex.ru)، وAport (www.aport.ru)، وGoogle (www. google.ru).

معظم محركات البحثتنفيذها في شكل بوابات.

البوابة (من الإنجليزية.منفذ- المدخل الرئيسي، البوابة) هو موقع إلكتروني يدمج خدمات الإنترنت المختلفة: أدوات البحث، البريد، الأخبار، القواميس وغيرها.

يمكن أن تكون البوابات متخصصة (مثل،شبكة الاتصالات العالمية. متحف. رو) وعامة (على سبيل المثال،شبكة الاتصالات العالمية. كم. رو).

البحث عن طريق الكلمات الرئيسية

تسمى مجموعة الكلمات الأساسية المستخدمة للبحث أيضًا بمعيار البحث أو موضوع البحث.

يمكن أن يتكون الطلب من كلمة واحدة أو مجموعة من الكلمات التي يجمعها عوامل التشغيل - وهي رموز يحدد النظام من خلالها الإجراء الذي يحتاج إلى تنفيذه. على سبيل المثال: يحتوي الطلب "موسكو سانت بطرسبرغ" على عامل التشغيل AND (هذه هي الطريقة التي يُنظر بها إلى المساحة)، مما يشير إلى أنه يجب على المرء البحث عن المستندات التي تحتوي على كلتا الكلمتين - موسكو وسانت بطرسبرغ.

لكي يكون البحث ذا صلة (من اللغة الإنجليزية ذات الصلة - ذات الصلة، ذات الصلة)، يجب مراعاة عدة قواعد عامة:

    وبغض النظر عن الشكل الذي تستخدم به الكلمة في الاستعلام، فإن البحث يأخذ بعين الاعتبار جميع أشكال كلماتها وفقا لقواعد اللغة الروسية. على سبيل المثال، سيبحث الاستعلام "تذكرة" أيضًا عن الكلمات "تذكرة"، "تذكرة"، وما إلى ذلك.

    يجب استخدام الأحرف الكبيرة فقط في الأسماء الصحيحة لتجنب عرض المراجع غير الضرورية. بناء على طلب "الحدادين"، على سبيل المثال، سيتم العثور على وثائق تتحدث عن كل من الحدادين وكوزنتسوف.

    يُنصح بتضييق نطاق البحث باستخدام بعض الكلمات الرئيسية.

    إذا لم يكن العنوان المطلوب من بين العناوين العشرين الأولى التي تم العثور عليها، فيجب عليك تغيير الطلب.

يستخدم كل محرك بحث لغة الاستعلام الخاصة به. للتعرف عليه، استخدم المساعدة المضمنة لمحرك البحث

قد تحتوي المواقع الكبيرة على أنظمة مدمجة لاسترجاع المعلومات ضمن صفحات الويب الخاصة بها.

يتم إنشاء الاستعلامات في أنظمة البحث هذه، كقاعدة عامة، وفقا لنفس القواعد كما هو الحال في محركات البحث العالمية، ومع ذلك، فإن الإلمام بالمساعدة هنا لن يكون غير ضروري.

البحث المتقدم

يمكن لمحركات البحث توفير آلية للمستخدم لإنشاء استعلام معقد. اتباع الرابط البحث المتقدميجعل من الممكن تحرير معلمات البحث وتحديد معلمات إضافية واختيار النموذج الأكثر ملاءمة لعرض نتائج البحث. فيما يلي وصف للمعلمات التي يمكن ضبطها أثناء البحث المتقدم في نظامي Yanex وRambler.

وصف المعلمة

الاسم في ياندكس

الاسم فيمتسكع

أين تبحث عن الكلمات الرئيسية (عنوان المستند، النص الأساسي، وما إلى ذلك)

مرشح القاموس

البحث بالنص...

ما هي الكلمات التي ينبغي أو لا ينبغي أن تكون موجودة في المستند ومدى دقة المطابقة

مرشح القاموس

البحث عن كلمات الاستعلام... استبعاد المستندات التي تحتوي على الكلمات التالية...

إلى أي مدى يجب أن تكون الكلمات الرئيسية متباعدة؟

مرشح القاموس

المسافة بين كلمات الاستعلام...

تقييد تاريخ الوثيقة

تاريخ الوثيقة...

قصر بحثك على موقع واحد أو أكثر

الموقع/الأعلى

البحث في المستندات فقط على المواقع التالية...

تقييد البحث حسب لغة الوثيقة

لغة الوثيقة...

البحث عن المستندات التي تحتوي على صورة باسم أو توقيع محدد

صورة

البحث عن الصفحات التي تحتوي على كائنات

كائنات خاصة

نموذج عرض نتائج البحث

تنسيق الإصدار

عرض نتائج البحث

تسمح لك بعض محركات البحث (على سبيل المثال، Yandex) بإدخال الاستعلامات باللغة الطبيعية. تكتب ما تحتاج إلى العثور عليه (على سبيل المثال: طلب تذاكر القطار من موسكو إلى سانت بطرسبرغ). يقوم النظام بتحليل الطلب وينتج النتيجة. إذا لم تكن راضيًا عنها، فانتقل إلى لغة الاستعلام.

لقد أصبحوا منذ فترة طويلة جزءًا لا يتجزأ من الإنترنت الروسي. أصبحت محركات البحث الآن آليات ضخمة ومعقدة لا تمثل أداة للبحث عن المعلومات فحسب، بل تمثل أيضًا مجالات مغرية للأعمال.

لم يفكر معظم مستخدمي محركات البحث مطلقًا (أو فكروا في ذلك، لكنهم لم يجدوا إجابة) في مبدأ تشغيل محركات البحث، وفي مخطط معالجة طلبات المستخدم، ومما تتكون هذه الأنظمة وكيف تعمل...

تم تصميم هذه الفئة الرئيسية للإجابة على سؤال حول كيفية عمل محركات البحث. ومع ذلك، لن تجد هنا العوامل التي تؤثر على ترتيب المستندات. علاوة على ذلك، لا يستحق الاعتماد على شرح مفصل لخوارزمية Yandex. هو، وفقا لإيليا سيجالوفيتش، مدير التكنولوجيا وتطوير محرك بحث ياندكس، لا يمكن التعرف عليه إلا "تحت التعذيب" من قبل إيليا سيجالوفيتش نفسه...

2. مفهوم ووظائف محرك البحث

نظام البحث عبارة عن مجمع من البرامج والأجهزة مصمم للبحث في الإنترنت والاستجابة لطلب المستخدم، المحدد في شكل عبارة نصية (استعلام بحث)، عن طريق إنتاج قائمة من الروابط إلى مصادر المعلومات، حسب الأهمية ( حسب الطلب). أكبر محركات البحث العالمية: "جوجل"، ياهو، ام اس ان. على الإنترنت الروسي، هذه هي Yandex، Rambler، Aport.

دعونا نلقي نظرة فاحصة على مفهوم استعلام البحث باستخدام محرك بحث Yandex كمثال. يجب أن يقوم المستخدم بصياغة استعلام البحث وفقًا لما يريد العثور عليه، بإيجاز وبساطة قدر الإمكان. لنفترض أننا نريد العثور على معلومات في Yandex حول كيفية اختيار سيارة. للقيام بذلك، افتح صفحة Yandex الرئيسية وأدخل نص استعلام البحث "كيفية اختيار سيارة". بعد ذلك، تتمثل مهمتنا في فتح الروابط المقدمة بناءً على طلبنا لمصادر المعلومات على الإنترنت. ومع ذلك، فمن المحتمل جدًا أننا لن نجد المعلومات التي نحتاجها. إذا حدث هذا، فإما أنك بحاجة إلى إعادة صياغة طلبك، أو أن قاعدة بيانات محرك البحث لا تحتوي حقًا على أي معلومات ذات صلة بطلبنا (يمكن أن يحدث هذا عند طرح استعلامات "ضيقة" للغاية، مثل، على سبيل المثال، "كيفية الاختيار" سيارة في أرخانجيلسك")

الهدف الأساسي لأي محرك بحث هو إيصال المعلومات التي يبحثون عنها بالضبط إلى الأشخاص. وتعليم المستخدمين كيفية تقديم الطلبات "الصحيحة" إلى النظام، أي. الاستعلامات التي تتوافق مع مبادئ تشغيل محركات البحث مستحيلة. ولذلك، يقوم المطورون بإنشاء خوارزميات ومبادئ تشغيل لمحركات البحث التي من شأنها أن تسمح للمستخدمين بالعثور على المعلومات التي يبحثون عنها.

وهذا يعني أن محرك البحث يجب أن "يفكر" بنفس الطريقة التي يفكر بها المستخدم عند البحث عن المعلومات. عندما يقوم المستخدم بتقديم طلب إلى محرك البحث، فهو يريد العثور على ما يحتاج إليه في أسرع وقت ممكن وبكل سهولة. بعد الحصول على النتيجة، يقوم بتقييم أداء النظام، مسترشدًا بالعديد من المعلمات الأساسية. فهل وجد ما كان يبحث عنه؟ إذا لم يجده، كم مرة كان عليه إعادة صياغة الاستعلام للعثور على ما كان يبحث عنه؟ ما مقدار المعلومات ذات الصلة التي يمكنه العثور عليها؟ ما مدى سرعة معالجة محرك البحث للطلب؟ ما مدى ملاءمة عرض نتائج البحث؟ هل كانت النتيجة التي كنت تبحث عنها هي الأولى أم المئة؟ ما مقدار القمامة غير الضرورية التي تم العثور عليها بالإضافة إلى المعلومات المفيدة؟ هل سيتم العثور على المعلومات الضرورية عند الوصول إلى محرك البحث، على سبيل المثال، في أسبوع أو في شهر؟

من أجل الإجابة على كل هذه الأسئلة بالإجابات، يعمل مطورو محركات البحث باستمرار على تحسين خوارزميات ومبادئ البحث، وإضافة وظائف وإمكانيات جديدة، ومحاولة تسريع تشغيل النظام بكل طريقة ممكنة.

3. الخصائص الرئيسية لمحرك البحث

دعونا نصف الخصائص الرئيسية لمحركات البحث:

  • الاكتمال

    يعد الاكتمال أحد الخصائص الرئيسية لنظام البحث، وهو نسبة عدد المستندات التي تم العثور عليها حسب الطلب إلى إجمالي عدد المستندات الموجودة على الإنترنت التي تلبي الطلب المحدد. على سبيل المثال، إذا كان هناك 100 صفحة على الإنترنت تحتوي على عبارة "كيفية اختيار سيارة"، وتم العثور على 60 منها فقط للاستعلام المقابل، فإن اكتمال البحث سيكون 0.6. ومن الواضح أنه كلما كان البحث أكثر اكتمالا، قل احتمال عدم عثور المستخدم على الوثيقة التي يحتاجها، بشرط أن تكون موجودة على الإنترنت على الإطلاق.

  • دقة

    الدقة هي سمة رئيسية أخرى لمحرك البحث، والتي يتم تحديدها من خلال درجة تطابق المستندات التي تم العثور عليها مع استعلام المستخدم. على سبيل المثال، إذا كان الاستعلام "كيفية اختيار سيارة" يحتوي على 100 مستند، 50 منها تحتوي على عبارة "كيفية اختيار سيارة"، والباقي يحتوي ببساطة على هذه الكلمات ("كيفية اختيار الراديو المناسب وتثبيته في "سيارة")، فإن دقة البحث تعتبر 50/100 (=0.5). كلما كان البحث أكثر دقة، كلما أسرع المستخدم في العثور على المستندات التي يحتاجها، وأقل أنواع مختلفة من "القمامة" التي سيتم العثور عليها فيما بينها، وأقل في كثير من الأحيان لن تتوافق المستندات التي تم العثور عليها مع الطلب.

  • ملاءمة

    تعد الملاءمة عنصرًا لا يقل أهمية في البحث، والذي يتميز بالوقت الذي يمر من لحظة نشر المستندات على الإنترنت حتى يتم إدخالها في قاعدة بيانات فهرس محرك البحث. على سبيل المثال، في اليوم التالي لظهور الأخبار المثيرة للاهتمام، لجأ عدد كبير من المستخدمين إلى محركات البحث ذات الاستعلامات ذات الصلة. من الناحية الموضوعية، لقد مر أقل من يوم على نشر المعلومات الإخبارية حول هذا الموضوع، لكن الوثائق الرئيسية تمت فهرستها بالفعل وإتاحتها للبحث، وذلك بفضل وجود ما يسمى بـ "قاعدة البيانات السريعة" لمحركات البحث الكبيرة، والتي يتم تحديثه عدة مرات في اليوم.

  • سرعة البحث

    ترتبط سرعة البحث ارتباطًا وثيقًا بمقاومة الحمل. على سبيل المثال، وفقا لشركة Rambler Internet Holding LLC، اليوم، خلال ساعات العمل، يتلقى محرك بحث Rambler حوالي 60 طلبا في الثانية. يتطلب عبء العمل هذا تقليل وقت معالجة الطلب الفردي. هنا تتطابق مصالح المستخدم ومحرك البحث: يريد الزائر الحصول على النتائج في أسرع وقت ممكن، ويجب على محرك البحث معالجة الطلب في أسرع وقت ممكن، حتى لا يبطئ حساب الاستعلامات اللاحقة.

  • الرؤية

4. تاريخ موجز لتطور محركات البحث

في الفترة الأولى من تطور الإنترنت، كان عدد مستخدميها صغيرًا، وكانت كمية المعلومات المتاحة صغيرة نسبيًا. بالنسبة للجزء الأكبر، كان طاقم البحث فقط هو الذي يمكنه الوصول إلى الإنترنت. في هذا الوقت، لم تكن مهمة البحث عن المعلومات على الإنترنت ملحة كما هي الآن.

كانت إحدى الطرق الأولى لتنظيم الوصول إلى موارد معلومات الشبكة هي إنشاء أدلة مفتوحة للمواقع، حيث تم تجميع الروابط إلى الموارد حسب الموضوع. وكان أول مشروع من هذا القبيل هو موقع Yahoo.com، الذي افتتح في ربيع عام 1994. وبعد زيادة عدد المواقع في الكتالوج بشكل ملحوظ، تمت إضافة إمكانية البحث عن المعلومات الضرورية في الكتالوج. بالمعنى الكامل، لم يكن بعد محرك بحث، لأن منطقة البحث تقتصر فقط على الموارد الموجودة في الكتالوج، وليس على جميع موارد الإنترنت.

تم استخدام أدلة الارتباط على نطاق واسع في الماضي، ولكنها فقدت شعبيتها بالكامل تقريبًا في الوقت الحاضر. نظرًا لأنه حتى الكتالوجات الحديثة ذات الحجم الضخم تحتوي على معلومات فقط حول جزء ضئيل من الإنترنت. يحتوي أكبر دليل لشبكة DMOZ (ويسمى أيضًا مشروع الدليل المفتوح) على معلومات حول 5 ملايين مصدر، بينما تتكون قاعدة بيانات محرك بحث Google من أكثر من 8 مليارات مستند.

في عام 1995، ظهرت محركات البحث Lycos و AltaVista. كان الأخير رائداً في مجال البحث عن المعلومات على الإنترنت لسنوات عديدة.

في عام 1997، أنشأ سيرجي برين ولاري بيج محرك بحث جوجل كجزء من مشروع بحثي في ​​جامعة ستانفورد. يعد Google حاليًا محرك البحث الأكثر شعبية في العالم!

في سبتمبر 1997، تم الإعلان رسميًا عن محرك بحث Yandex، وهو الأكثر شهرة على الإنترنت باللغة الروسية.

يوجد حاليًا ثلاثة محركات بحث رئيسية (دولية) - Google وYahoo والتي لها قواعد بيانات وخوارزميات بحث خاصة بها. تستخدم معظم محركات البحث الأخرى (التي يوجد منها عدد كبير) بشكل أو بآخر نتائج المحركات الثلاثة المذكورة. على سبيل المثال، يستخدم بحث AOL (search.aol.com) قاعدة بيانات Google، بينما يستخدم AltaVista وLycos وAllTheWeb قاعدة بيانات Yahoo.

5. تكوين ومبادئ تشغيل نظام البحث

في روسيا، محرك البحث الرئيسي هو Yandex، يليه Rambler.ru، Google.ru، Aport.ru، Mail.ru. علاوة على ذلك، في الوقت الحالي، يستخدم Mail.ru محرك البحث وقاعدة البيانات Yandex.

تمتلك جميع محركات البحث الرئيسية تقريبًا هيكلها الخاص الذي يختلف عن محركات البحث الأخرى. ومع ذلك، فمن الممكن التعرف على المكونات الرئيسية المشتركة بين جميع محركات البحث. لا يمكن أن تكون الاختلافات في الهيكل إلا في شكل تنفيذ آليات التفاعل بين هذه المكونات.

وحدة الفهرسة

تتكون وحدة الفهرسة من ثلاثة برامج مساعدة (روبوتات):

Spider هو برنامج مصمم لتنزيل صفحات الويب. يقوم العنكبوت بتنزيل الصفحة واسترداد جميع الروابط الداخلية من تلك الصفحة. يتم تنزيل كود html لكل صفحة. تستخدم الروبوتات بروتوكولات HTTP لتنزيل الصفحات. العنكبوت يعمل على النحو التالي. يرسل الروبوت الطلب "get/path/document" وبعض أوامر طلب HTTP الأخرى إلى الخادم. ردًا على ذلك، يتلقى الروبوت دفقًا نصيًا يحتوي على معلومات الخدمة والمستند نفسه.

  • رابط الصفحة
  • تاريخ تنزيل الصفحة
  • استجابة الخادم لرأس http
  • نص الصفحة (رمز HTML)

الزاحف (العنكبوت "المسافر") هو برنامج يتتبع تلقائيًا جميع الروابط الموجودة على الصفحة. تحديد كافة الروابط الموجودة على الصفحة. وتتمثل مهمتها في تحديد المكان الذي يجب أن يذهب إليه العنكبوت بعد ذلك، بناءً على الروابط أو بناءً على قائمة عناوين محددة مسبقًا. يقوم الزاحف، باتباع الروابط الموجودة، بالبحث عن المستندات الجديدة التي لا تزال غير معروفة لمحرك البحث.

المفهرس (مفهرس الروبوت) هو برنامج يقوم بتحليل صفحات الويب التي تم تنزيلها بواسطة العناكب. يقوم المفهرس بتوزيع الصفحة إلى الأجزاء المكونة لها وتحليلها باستخدام الخوارزميات المعجمية والمورفولوجية الخاصة به. يتم تحليل عناصر الصفحة المختلفة، مثل النص والعناوين والروابط والميزات الهيكلية والنمطية وعلامات HTML الخاصة بالخدمة وما إلى ذلك.

وبالتالي، تسمح لك وحدة الفهرسة بالزحف إلى مجموعة معينة من الموارد باستخدام الروابط، وتنزيل الصفحات التي تمت مواجهتها، واستخراج الروابط إلى صفحات جديدة من المستندات المستلمة، وإجراء تحليل كامل لهذه المستندات.

قاعدة البيانات

قاعدة البيانات، أو فهرس محرك البحث، هي نظام تخزين بيانات، ومصفوفة معلومات يتم فيها تخزين المعلمات المحولة خصيصًا لجميع المستندات التي تم تنزيلها ومعالجتها بواسطة وحدة الفهرسة.

خادم البحث

يعد خادم البحث أهم عنصر في النظام بأكمله، حيث تعتمد جودة البحث وسرعته بشكل مباشر على الخوارزميات التي تكمن وراء عمله.

يعمل خادم البحث على النحو التالي:

  • يخضع الطلب المستلم من المستخدم للتحليل الصرفي. يتم إنشاء بيئة المعلومات لكل مستند موجود في قاعدة البيانات (والتي سيتم عرضها لاحقًا في النموذج، أي معلومات نصية تتوافق مع الطلب في صفحة نتائج البحث).
  • يتم تمرير البيانات المستلمة كمعلمات إدخال إلى وحدة تصنيف خاصة. تتم معالجة البيانات لجميع المستندات، ونتيجة لذلك يكون لكل مستند تصنيفه الخاص الذي يميز مدى ملاءمة الاستعلام الذي أدخله المستخدم والمكونات المختلفة لهذه الوثيقة المخزنة في فهرس محرك البحث.
  • واعتماداً على اختيار المستخدم، يمكن تعديل هذا التصنيف من خلال شروط إضافية (على سبيل المثال، ما يسمى بـ “البحث المتقدم”).
  • بعد ذلك، يتم إنشاء مقتطف، أي أنه لكل مستند يتم العثور عليه، يتم استخراج العنوان والملخص القصير الذي يطابق الاستعلام بشكل أفضل، ورابط للمستند نفسه من جدول المستندات، ويتم تمييز الكلمات التي تم العثور عليها.
  • يتم إرسال نتائج البحث الناتجة إلى المستخدم في شكل SERP (صفحة نتائج محرك البحث) - صفحة نتائج البحث.

كما ترون، ترتبط جميع هذه المكونات ارتباطًا وثيقًا ببعضها البعض وتعمل في تفاعل، وتشكل آلية واضحة ومعقدة إلى حد ما لتشغيل نظام البحث، الأمر الذي يتطلب كميات هائلة من الموارد.

6. الاستنتاج

الآن دعونا نلخص كل ما سبق.

  • الهدف الأساسي لأي محرك بحث هو إيصال المعلومات التي يبحثون عنها بالضبط إلى الأشخاص.
  • الخصائص الرئيسية لمحركات البحث:
    1. الاكتمال
    2. دقة
    3. ملاءمة
    4. سرعة البحث
    5. الرؤية
  • كان أول محرك بحث متكامل هو مشروع WebCrawler، الذي تم نشره في عام 1994.
  • يشتمل نظام البحث على المكونات التالية:
    1. وحدة الفهرسة
    2. قاعدة البيانات
    3. خادم البحث

نأمل أن يسمح لك فصلنا الرئيسي بالتعرف أكثر على مفهوم محرك البحث وفهم الوظائف والخصائص ومبادئ التشغيل الرئيسية لمحركات البحث بشكل أفضل.

21.11.2017

مهما كان السؤال الذي يقلق الإنسان الحديث فهو لا يبحث عن الإجابات في الكتب. إنه يبحث عنهم على الإنترنت. علاوة على ذلك، لا تحتاج إلى معرفة عنوان الموقع الذي توجد به المعلومات التي تحتاجها. هناك الملايين من هذه المواقع، ومحرك البحث يساعدك في العثور على الموقع المناسب.

على اتساع شبكة الإنترنت المحلية لدينا، فإن محركي البحث الأكثر شعبية هما Google وYandex.

هل تساءلت يوما كيف يعمل محرك البحث؟ كيف تفهم الموقع الذي تريد عرضه، وأي من ملايين الموارد لديه بالتأكيد الإجابة على طلبك؟

ما هو محرك البحث؟

محرك البحث عبارة عن قاعدة بيانات ضخمة لمستندات الويب التي يتم تحديثها وتوسيعها باستمرار. يحتوي كل محرك بحث على عناكب بحث؛ وهي عبارة عن روبوتات خاصة تقوم بالزحف إلى المواقع، وفهرسة المحتوى المنشور عليها، ومن ثم ترتيبها وفقًا لجودتها وصلتها باستعلامات بحث المستخدم.

تعمل محركات البحث بحيث يمكن لأي شخص العثور على أي معلومات. ولهذا السبب يحاولون عرض مستندات الويب التي تحتوي على الإجابة الأكثر تفصيلاً لسؤال الشخص أولاً.

محرك البحث في جوهره هو دليل للمواقع، وهو دليل، وتتمثل وظيفته الرئيسية في البحث عن المعلومات في هذا الدليل بالذات.

كما كتبت أعلاه، لدينا نظامان شائعان - Google (عالمي) وياندكس (قطاع اللغة الروسية). ولكن هناك أيضًا أنظمة مثل Rambler وYahoo وBing وMail.Ru وغيرها. مبدأ التشغيل متشابه بالنسبة لهم جميعًا، فقط خوارزميات التصنيف تختلف (وحتى ذلك الحين ليس بشكل كبير).

كيف يعمل محرك البحث على الإنترنت؟

إن مبدأ كيفية عمل محركات البحث معقد للغاية، لكنني سأحاول شرحه بكلمات بسيطة.

يقوم روبوت البحث (العنكبوت) بالزحف إلى صفحات الموقع وتنزيل محتواها واستخراج الروابط. بعد ذلك، يبدأ المفهرس عمله - وهو برنامج يحلل جميع المواد التي تم تنزيلها بواسطة العناكب، بالاعتماد على خوارزمياته الخاصة.

وبالتالي، يتم إنشاء قاعدة بيانات محرك البحث، حيث يتم تخزين جميع المستندات التي تتم معالجتها بواسطة الخوارزمية.

يتم العمل مع استعلام البحث على النحو التالي:

  • يتم تحليل الاستعلام الذي أدخله المستخدم؛
  • يتم نقل نتائج التحليل إلى وحدة تصنيف خاصة؛
  • تتم معالجة بيانات كافة المستندات، ويتم اختيار المستندات الأكثر صلة بالطلب المُدخل؛
  • يتم إنشاء مقتطف - يتم تمييز العنوان والوصف والكلمات الواردة في الطلب بالخط العريض؛
  • يتم تقديم نتائج البحث للمستخدم في شكل SERP (صفحة النتائج).

كيف تعمل محركات البحث

تتمثل المهمة الرئيسية لأي محرك بحث في تزويد المستخدم بالمعلومات الأكثر فائدة ودقة بناءً على طلبه. لذلك، يقوم روبوت البحث بالزحف إلى المواقع باستمرار. مباشرة بعد إطلاقك، وفقا لجدول زمني معين، يأتي العنكبوت لزيارتك، ويزحف إلى عدد من الصفحات، وبعد ذلك يتم فهرستها.

يعتمد مبدأ تشغيل محركات البحث على مرحلتين رئيسيتين:

  • صفحات الزحف التي يتم من خلالها جمع البيانات؛
  • تعيين فهرس، والذي بفضله يمكن للنظام البحث بسرعة في محتويات صفحة معينة.

بمجرد فهرسة صفحة الموقع، ستظهر بالفعل في نتائج البحث لاستعلام بحث محدد. يمكنك التحقق من تضمين صفحة جديدة في فهرس محرك البحث باستخدام أدوات مشرفي المواقع. على سبيل المثال، في Yandex.Webmaster، يمكنك على الفور معرفة الصفحات التي تمت فهرستها ومتى، وأي الصفحات سقطت من الفهرس ولأي سبب.

لكن الصفحة التي سينتهي بها الأمر تعتمد على درجة الفهرسة وجودة محتواها. إذا كانت صفحتك تقدم الإجابة الأكثر دقة على أحد الاستعلامات، فستكون أعلى من جميع الصفحات الأخرى.

مبادئ ترتيب المواقع في محركات البحث

لقد اكتشفنا المبدأ الذي تعمل عليه روبوتات البحث. ولكن كيف يتم تصنيف المواقع؟

يعتمد التصنيف على ركيزتين أساسيتين - المحتوى النصي للصفحة والعوامل غير النصية.

محتوى النص– هذا هو سياق الصفحة. كلما كان الأمر أكثر اكتمالا، وأكثر دقة، وأكثر صلة بالطلب، كلما ارتفعت الصفحة في نتائج البحث. بالإضافة إلى النص نفسه، يهتم محرك البحث بملء علامات العنوان (عنوان الصفحة)، والوصف (وصف الصفحة)، وعلامات H1 (عنوان النص).

العوامل غير النصيةهذه هي الروابط الداخلية والروابط الخارجية. النقطة المهمة هي: إذا كان الموقع مثيرًا للاهتمام ومفيدًا، فإن الموارد المواضيعية الأخرى ترتبط به. وكلما زاد عدد هذه الروابط، أصبح المورد أكثر موثوقية.

لكن هذه هي المبادئ الأساسية، باختصار شديد. دعونا نتعمق قليلا.

أساسيعوامل تصنيف الموقع

هناك عدد من العوامل التي تؤثر على تصنيف موقع الويب. أهمها هي:

1. بعوامل تصنيف المواقع الداخلية

هذا هو النص الموجود في الموقع وتصميمه - عناوين فرعية تسلط الضوء على النقاط المهمة في النص. ينطبق هنا أيضًا استخدام الارتباط الداخلي. العناصر المرئية مهمة أيضًا: استخدام الصور والصور الفوتوغرافية ومقاطع الفيديو والرسوم البيانية. جودة النص نفسه ومحتواه مهمة أيضًا.

2. عوامل تصنيف المواقع الخارجيةالتي تحدد شعبيتها. هذه هي نفس الروابط الخارجية التي تؤدي إلى موقعك من مصادر أخرى. لا يتم تحديد عدد هذه المواقع فحسب، بل يتم تحديد جودتها (من المستحسن أن تحتوي المواقع على موضوع مشابه لموقعك)، بالإضافة إلى الجودة الإجمالية لملف تعريف الارتباط (مدى سرعة ظهور هذه الروابط، بشكل طبيعي أو من خلال عمليات الشراء على تبادل).

وبناء على ما سبق يمكن استخلاص نتيجة واحدة: تحاول محركات البحث العمل بطريقة تُظهر للمستخدم تلك المواقع التي تقدم الإجابة الأكثر اكتمالاً لطلبه والتي اكتسبت بالفعل سلطة معينة.في هذه الحالة، يتم أخذ مجموعة متنوعة من العوامل في الاعتبار: محتوى الموقع وإعداداته وموقف المستخدمين تجاهه. من المؤكد أن موقع الويب الجيد من جميع النواحي سيحتل مرتبة عالية في نتائج البحث.

خدمة الويب الأكثر شعبية في عصرنا هي محرك البحث. كل شيء مفهوم هنا، لأن الأيام التي كان فيها ممثلو مستخدمي الإنترنت الأوائل يمكنهم مراقبة المنتجات الجديدة على الإنترنت قد ولت منذ فترة طويلة.

تظهر وتتراكم الكثير من المعلومات بحيث أصبح من الصعب جدًا على الشخص العثور على ما يحتاج إليه بالضبط. تخيل كيف سيكون الأمر عند البحث على الإنترنت إذا كان على المستخدم العادي أن يبحث عن معلومات من أين الله أعلم. لكن لا تفهم أين، لأنك لن تجد الكثير من المعلومات من خلال البحث اليدوي.

محرك البحث، ما هو؟

من الجيد أن يعرف المستخدم بالفعل المواقع التي قد تحتوي على المعلومات الضرورية، ولكن ماذا يفعل بخلاف ذلك؟ من أجل تسهيل حياة الشخص في العثور على المعلومات الضرورية على الإنترنت، تم اختراع محركات البحث أو ببساطة محركات البحث. يؤدي محرك البحث وظيفة واحدة مهمة جدًا، والتي بدونها لن يكون الإنترنت كما اعتدنا على رؤيته - وهو البحث عن معلومات على الإنترنت.

نظام البحث- هذا موقع ويب خاص أو بمعنى آخر موقع يوفر للمستخدمين، بناءً على طلباتهم، روابط تشعبية لصفحات المواقع التي تستجيب لاستعلام بحث معين.

لكي نكون أكثر دقة، فهو بحث عن معلومات على الإنترنت، يتم إجراؤه بفضل مجموعة وظائف البرامج والأجهزة وواجهة الويب للتفاعل مع المستخدمين.

بالنسبة للتفاعل البشري مع محرك البحث، تم إنشاء واجهة ويب، أي قذيفة مرئية ومفهومة. هذا النهج الذي يتبعه مطورو محركات البحث يجعل البحث أسهل للعديد من الأشخاص. كقاعدة عامة، يتم إجراء عمليات البحث على الإنترنت باستخدام محركات البحث، ولكن هناك أيضًا أنظمة بحث لخوادم FTP، أو أنواع معينة من البضائع على شبكة الويب العالمية، أو معلومات الأخبار أو اتجاهات البحث الأخرى.

يمكن إجراء البحث ليس فقط من خلال المحتوى النصي للمواقع، ولكن أيضًا من خلال أنواع أخرى من المعلومات التي يمكن للشخص البحث عنها: الصور ومقاطع الفيديو وملفات الصوت وما إلى ذلك.

كيف يقوم محرك البحث بالبحث؟

من الممكن البحث في الإنترنت نفسه، تمامًا مثل تصفح مواقع الويب، باستخدام متصفح الإنترنت. فقط بعد أن يحدد المستخدم استعلامه في شريط البحث، يتم إجراء البحث نفسه مباشرة.

يحتوي أي نظام بحث على جزء برمجي تعتمد عليه آلية البحث بأكملها، ويسمى محرك البحث - وهي حزمة برامج توفر القدرة على البحث عن المعلومات. بعد الاتصال بمحرك بحث، يقوم الشخص بإنشاء استعلام بحث وإدخاله في شريط البحث، يقوم محرك البحث بإنشاء صفحة تحتوي على قائمة نتائج البحث، والأكثر صلة، في رأي محرك البحث، موجودة أعلى.

ملاءمة البحث - البحث عن المواد الأكثر صلة بطلب المستخدم ووضع روابط تشعبية عليها في صفحة نتائج البحث مع نتائج أكثر دقة عن غيرها. توزيع النتائج في حد ذاته يسمى تصنيف الموقع.

إذًا كيف يقوم محرك البحث بإعداد مواده للنشر وكيف يقوم محرك البحث نفسه بالبحث عن المعلومات؟ يتم تسهيل جمع المعلومات على الشبكة عن طريق روبوت أو بوت فريد لكل محرك بحث، والذي له أيضًا عدد من المرادفات الأخرى مثل الزاحف أو العنكبوت، ويمكن تقسيم عمل نظام البحث نفسه إلى ثلاث مراحل:

تتضمن المرحلة الأولى من تشغيل محرك البحث مسح المواقع الموجودة على الشبكة العالمية وجمع نسخ من صفحات الويب على خوادمه الخاصة. يؤدي هذا إلى إنشاء كمية هائلة من المعلومات التي لم تتم معالجتها بعد وغير مناسبة لنتائج البحث.

تتلخص المرحلة الثانية من عمل محرك البحث في ترتيب المعلومات الواردة مسبقًا، في المرحلة الأولى، من المواقع. يتم إجراء الفرز بطريقة تؤدي في أقل قدر من الوقت إلى البحث عالي الجودة الذي يتوقعه المستخدمون بالفعل من محرك البحث. تسمى المرحلة بالفهرسة، مما يعني أن الصفحات معدة بالفعل للإصدار، وستعتبر قاعدة البيانات الحالية فهرسًا.

وهي المرحلة الثالثة بالتحديد التي تحدد نتائج البحث، بعد تلقي طلب من عميلها، بناءً على الكلمات المفتاحية أو الكلمات المفتاحية القريبة المحددة في الطلب. وهذا يسهل اختيار المعلومات الأكثر صلة بالطلب وتسليمها لاحقًا. نظرًا لوجود الكثير والكثير من المعلومات، يقوم محرك البحث بالتصنيف وفقًا لخوارزمياته.
يعتبر أفضل محرك بحث هو المحرك الذي يمكنه توفير المواد التي تستجيب بشكل صحيح لطلب المستخدم. ولكن هنا أيضًا قد تكون هناك نتائج تأثرت بأشخاص مهتمين بالترويج لموقعهم مثل هذه المواقع، وإن لم يكن ذلك دائمًا، إلا أنها غالبًا ما تظهر في نتائج البحث، ولكن ليس لفترة طويلة؛

على الرغم من أنه تم بالفعل تحديد قادة العالم في العديد من المناطق، إلا أن محركات البحث تواصل تطوير بحثها عالي الجودة. كلما كان البحث أفضل يمكنهم تقديمه، كلما زاد عدد الأشخاص الذين يستخدمونه.

كيفية استخدام محرك البحث؟

ما هو محرك البحث وكيف يعمل واضح بالفعل، ولكن كيفية استخدامه بشكل صحيح؟ تحتوي معظم المواقع دائمًا على شريط بحث، وبجانبه يوجد زر بحث أو بحث. يتم إدخال استعلام في سطر البحث، وبعد ذلك تحتاج إلى الضغط على زر البحث أو، كما هو الحال في أغلب الأحيان، اضغط على مفتاح Enter على لوحة المفاتيح وفي غضون ثوان تتلقى نتيجة الاستعلام في النموذج من القائمة.

ولكن ليس من الممكن دائمًا الحصول على الإجابة الصحيحة لاستعلام البحث في المرة الأولى. للتأكد من أن البحث عما تريده لا يصبح مؤلمًا، يجب عليك إنشاء استعلام البحث الخاص بك بشكل صحيح واتباع التوصيات الموضحة أدناه.

نحن نؤلف استعلام البحث بشكل صحيح

فيما يلي نصائح حول استخدام محرك البحث. إن اتباع بعض الحيل والقواعد عند البحث عن المعلومات في محرك البحث سيجعل من الممكن الحصول على النتيجة المرجوة بشكل أسرع بكثير. اتبع هذه الإرشادات:

  1. يضمن التهجئة الصحيحة للكلمات الحد الأقصى لعدد التطابقات مع كائن المعلومات المطلوب (على الرغم من أن محركات البحث الحديثة قد تعلمت بالفعل تصحيح الأخطاء الإملائية، إلا أنه لا ينبغي إهمال هذه النصيحة).
  2. باستخدام المرادفات في الاستعلام الخاص بك، يمكنك تغطية نطاق بحث أوسع.
  3. في بعض الأحيان، قد يؤدي تغيير كلمة في نص الاستعلام إلى نتائج أفضل؛
  4. قم بإضفاء الخصوصية على استعلامك، واستخدم التكرارات الدقيقة للعبارات التي يجب أن تحدد الجوهر الرئيسي للبحث.
  5. تجربة مع الكلمات الرئيسية. يمكن أن يساعد استخدام الكلمات الرئيسية والعبارات في تحديد النقطة الرئيسية، وسيعرض محرك البحث نتائج أكثر صلة.

لذا فإن محرك البحث ليس أكثر من مجرد فرصة للعثور على المعلومات التي تهمك وعادةً ما تستخدمها مجانًا تمامًا أو تتعلم شيئًا ما أو تفهم شيئًا ما أو تتوصل إلى الاستنتاج الصحيح بنفسك. لم يعد بإمكان الكثير من الأشخاص تخيل حياتهم بدون البحث الصوتي، حيث ليست هناك حاجة لكتابة نص، ما عليك سوى نطق طلبك، وجهاز إدخال المعلومات هنا هو الميكروفون. كل هذا يشير إلى التطور المستمر لتقنيات البحث على الإنترنت والحاجة إليها.

مرحبا عزيزي القراء! إيكاترينا كالميكوفا معك. سيتم تخصيص مقالة اليوم لمفهوم مثل محرك البحث، ما هو عليه، ما هو مطلوب. سننظر أيضًا بالتفصيل في أنواع محركات البحث على الإنترنت.

إذا كان لديك سؤال: "لماذا أحتاج إلى معرفة محركات البحث هذه؟"، فسأجيب بهذه الطريقة. عندما تتناول حساءًا لذيذًا في أحد المطاعم، هل ترغب في معرفة المكونات المصنوعة منه حتى تتمكن من إعادة تحضيره بنفسك في المنزل؟ ففي نهاية المطاف، إذا كنت راضياً عن النتيجة النهائية، أي طعم الحساء، فمن المحتمل أن تكون مهتماً بمعرفة ما الذي أدى إلى هذه النتيجة؟

ويمكن قول الشيء نفسه عن العمل مع محرك البحث (SE). إذا قمت بإنشاء مدونتك الخاصة في المستقبل، فإن معرفة كيفية عمل PS، لن تضطر إلى اللجوء إلى المتخصصين للحصول على المساعدة. ستكون قادرًا على إدارة مشروعك بشكل مستقل بحيث يتمكن محرك البحث من رؤيته وإظهاره للمستخدمين الآخرين. بعد كل شيء، فإن حركة المرور إلى الموارد الخاصة بك، وبالتالي، ستعتمد أرباحك على هذا.

اذا هيا بنا نبدأ.

ما هو محرك البحث؟

محرك البحث هو مورد خاص على الإنترنت يوفر المعلومات للمستخدم وفقًا لطلبه. أي أن هذا المورد يجمع جميع البيانات الموجودة على الشبكة العالمية، وجميع مشاريع الويب، وعندما يتم تلقي طلب محدد من مستخدم، فإنه يوفر المعلومات اللازمة المطلوبة عن طريق توجيهها، على سبيل المثال، إلى مدونة أو موقع ويب موضوعي.

وبالتالي، بعد إنشاء مشروعك، ستكون مهمتك هي الدخول في نتائج البحث، أي في "القائمة" أو قاعدة بيانات محرك البحث. نظرا لأن الترويج لموقع الويب على الإنترنت غير ممكن ببساطة دون استخدام أي محرك بحث، فسوف تحتاج إلى الاهتمام بجودة مواردك وتحسينها الداخلي والخارجي. سنناقش كيفية القيام بذلك في المقالات التالية. لذلك لا تفوت.

في هذه الأثناء، إذا قررت إنشاء مدونتك الخاصة، فإنني أوصي بقراءة هذه المقالات:

وبما أن موارد الويب الجديدة تظهر كل يوم تقريبًا، فيجب تحديث قاعدة بيانات محرك البحث باستمرار. يجب أن تتم فهرسة كل موقع تم إنشاؤه حديثًا بواسطة روبوت. بكلمات بسيطة، يجب على مساعدي محرك البحث - الروبوتات - التعرف على المورد الجديد ونقل هذه البيانات إلى محرك البحث نفسه.

حسنًا، هنا ربما خمنت أنه عندما يزور الروبوت مدونتك، يجب أن يعجبه كل شيء. مصيرك المستقبلي سيعتمد على هذا الضيف.

سأخبرك بكيفية جعل الروبوت سعيدًا تمامًا بمشروعك في إحدى المقالات التالية. لا تفوتها، ستكون هناك معلومات مثيرة للاهتمام ومثيرة جدًا سأشاركها معك.

تعمل محركات البحث

تبدأ جميع الأعمال المتعلقة بـ PS بإدخال الاستعلام المطلوب في شريط البحث. ما الذي يمكن للمستخدمين البحث عنه؟ نعم، أي شيء، من وصفة فطائر الملفوف إلى السؤال الأبدي "كيفية كسب المزيد من المال دون القيام بأي شيء".

لكي يكون موردك هو الإجابة على السؤال، عليك أن تكون متقدمًا على منافسيك. للقيام بذلك، تحتاج إلى إيلاء اهتمام خاص للترويج لمشروعك، والذي يتضمن أنشطة مثل كتابة محتوى محسّن عالي الجودة، أي الاستجابة لطلبات المقالة، وتحسين العامل السلوكي، أي حتى يتمكن القارئ الخاص بك من مهتم بالتواجد على المورد، وهذا يؤدي إلى تحسين سهولة الاستخدام، وهذا هو راحة الزائر والعديد من العوامل الأخرى. سوف نتعلم جميعا أن نفعل هذا معك.

مكونات محرك البحث

وما الذي يساعد محركات البحث مثل جوجل على فهرسة موردك؟

  1. الوكلاء هم العمال الذين يقومون بالجزء الأكبر من العمل - فهرسة المواقع وتحليلها.
  2. العناكب هي برنامج يمكنه تنزيل صفحات مورد الويب وجمع معلومات عامة عنه.
  3. الزواحف (الزاحف) - برنامج يبحث عن جميع الروابط الموجودة على الصفحات، وبعد ذلك يبحث عن بيانات جديدة غير مألوفة لمحركات البحث.
  4. المفهرس – يحلل النص والعناوين والأسلوب وما إلى ذلك.
  5. الروبوتات - قم بفهرسة صفحات المحتوى الخاصة بك وكذلك دراسة الروابط المختلفة.

لكي تتم الفهرسة بالطريقة التي تريدها، قم بإنشاء مستند خاص "robots.txt". فهو يسمح للنظام بالتحقق فقط من تلك الصفحات التي تحتاجها وإزالة ما لا ينبغي لك رؤيته.

أنواع محركات البحث

هناك عدة خيارات لأنظمة استرجاع المعلومات:

  • الكتالوجات. مقارنة بحث بسيطة هي رف الكتب في المكتبة. يتم تخزين كل شيء هناك في فئات فرعية وفئات لموضوعات محددة. إذا وجدت نفسك في محرك البحث هذا، فصدقني، فإن المعلومات التي تجدها هناك ستكون أكثر من مفيدة ومفهومة لتصورك. هل يمكنك تخمين الموقع المشترك الذي نتحدث عنه؟ بالطبع، حول ويكيبيديا، التي جمعت دليلا كاملا للمعلومات المفيدة.
  • فهارس البحث. يتم البحث عن البيانات باستخدام العبارات الرئيسية. وهذا أمر مريح وغير مريح في نفس الوقت. أعتقد أن هؤلاء الأشخاص الذين يبحثون، على سبيل المثال، "فتاة تظهر فصلها" سوف يفهمونني، ليجدوا كيف تظهر فتاة إبهامها لأعلى، ولكن في البحث يظهر شيء غير لائق جدًا. 🙂 هذا النوع من البحث يميز معظم محركات البحث.
  • أنظمة التقييم. إنهم يحددون شعبيتك بناءً على عدد الزيارات. بالطبع، هذا ليس هو المعيار الأفضل، حيث لا يتم أخذ فائدة وجودة المورد نفسه في الاعتبار دائمًا. مثال على هذا النظام هو مورد الإنترنت Alexa.com.

وتنقسم خوادم البحث أيضًا إلى العامة والمتخصصة. تقوم محركات البحث العامة بفرز بيانات المعلومات دون أي اختيار عبر جميع موارد الويب المعروفة لها. وتشمل هذه ياندكس، رامبلر، جوجل. متخصص - فرز حسب اللغة المستخدمة.

يمكن أيضًا تقسيم محركات البحث إلى التوزيع الإقليمي والعالمي.

اليوم، تعمل جميع محركات البحث باستمرار على تحسين خوارزمياتها لاختيار موارد عالية الجودة وذات صلة.

قليلا من التاريخ

ظهرت PS على RuNet في عام 1996 - وهما Aport وRambler. بعد عام، في عام 1997، تم تشكيل ياندكس، وبعد عام، في عام 1998، ظهر منافس آخر - جوجل. الأكثر شعبية حاليًا هي Yandex و Google.

ما هي محركات البحث الأكثر شعبية الآن؟

وهنا الإحصائيات:

كما ترون، أصبحت Yandex الآن الأكثر شعبية في روسيا، إلى جانب Google وMail.

بهذه الطريقة، يمكنك رؤية أهم عمليات البحث التي يجب عليك التركيز عليها عند إنشاء مشروعك والترويج له.

محرك البحث ياندكس

مبدأ التشغيل هو كما يلي: أدخل الاستعلام المطلوب في شريط البحث، وانقر فوق "بحث" وانظر إلى النتائج. لقد اختارت Yandex 13 مليون ردًا على طلبك. يمكنك أيضًا البحث في الصور ومقاطع الفيديو والسوق (انظر العمود الأيسر).

بالإضافة إلى ذلك، يمكنك تكوين منطقة البحث. للقيام بذلك، انقر على الأيقونة الموجودة بجوار التقاطع في شريط البحث وحدد المنطقة المطلوبة في نافذة التصفية.

محرك بحث جوجل

يعمل Google بشكل مشابه لـ Yandex. يمكنك البحث عن المعلومات في أقسام مختلفة: الصور، مقاطع الفيديو، الأخبار، الخرائط، إلخ.

إذا قمت بالنقر فوق "أدوات البحث"، فسيتم فتح لوحة الإعدادات حيث يمكنك تحديد المنطقة واللغة ومدة البحث عن المعلومات.

الآن أنت تعرف ما هي محركات البحث الموجودة على الإنترنت، وقد شاهدت أيضًا أشهرها، والآن، مسلحًا بالمعلومات، يمكنك إنشاء اتصالاتك وتفاعلك مع محركات البحث.

هذا كل شيء لهذا اليوم. كيف تحب المقال؟

وداعا للجميع.

أنصحك بتحديث مدونتك حتى لا تفوت آخر الأخبار.

ايكاترينا كالميكوفا