נושמים מזרחית
שלום אורח, הרשמה לפורום | הוסף למועדפים
שם משתמש
סיסמה
זכור אותי | שכחתי סיסמה

[Nדר*ך]שליטת ברובוטי האינדוקס של מנועי החיפוש F2H הורדה ישירה מילים צלצול פלייבק רמיקס יוטיוב

עמוד ראשי חדשות המוסיקה מילים לשירים
עמוד ראשי » פורומים - דיון, פנאי, תמיכה והעשרת חווית המשתמש » פורום מדריכים, טיפים וטריקים




עמוד 1 מתוך 1 [ 11 הודעות ]
פרסם נושא חדש הגב לנושא

[Nדר*ך]שליטת ברובוטי האינדוקס של מנועי החיפוש

מחבר הודעה
 נושא ההודעה: [Nדר*ך]שליטת ברובוטי האינדוקס של מנועי החיפוש
הודעהפורסם: 14 פברואר 2006, 18:13 
מנותק
נושם זהב
נושם זהב
סמל אישי של המשתמש

הצטרף: 02 אוקטובר 2005, 16:39
הודעות: 34581
לייקים: 118 אוהבים
פידבקים: 0 (0%)




שליטת ברובוטי האינדוקס של מנועי החיפוש
כללי
חלק נכבד מן הרובוטים הפועלים כיום ברשת יחפשו קובץ בשם robots.txt בספרייה הראשית של האתר שלכם: http://www.domain.com/robots.txt. קובץ זה אמור לסייע להם להחליט לאילו חלקים באתר הם יכולים להיכנס, ומאילו חלקים הם אמורים להימנע מלהיכנס.

שימו לב: איסור גישה של מנוע חיפוש לדף מסויים אמנם ימנע את איסוף התוכן של הדף, אך לעיתים, אם יש הפניות לאותו דף בדפים בהם מנועי החיפוש כן יכולים להיכנס, אז הדף כן יופיע בתוצאות החיפוש, אך ללא המידע לגביו (כותרת, תיאור וכו'). אם אתם רוצים למנוע את הופעת הדף לחלוטין, יש להשתמש בתג המטה Robots.

הכנת קובץ Robots.txt
את הקובץ יש להכין בעורך טקסט רגיל (notepad) ולא בתוכנה אחרת.

על מנת להבין יותר כיצד בנוי קובץ זה, הבה נבדוק דוגמא לקוד:
User-agent: * Disallow: /cgi-bin/ Disallow: /images/

אם נסתכל על הקוד, נראה כי קיימים בו שני חלקים:

‏User-Agent: חלק זה מגדיר אל מי מופנות ההוראות שיגיעו מיד לאחריו.
‏Disallow: לאילו חלקים באתר אנו מעוניינים למנוע גישה ממי שהוגדר בשדה User-Agent.
במקרה שלמעלה, אנו ביקשנו מכל מנועי החיפוש (הסימון לכל מנועי החיפוש ביחד הוא (* להימנע מגישה לספריית cgi-bin ולספריית images.

הבה נבחן דוגמא נוספת לקוד:
User-agent: * Disallow: /
דוגמא זו תמנע את הגישה של כל מנועי החיפוש אל כל האתר, כלומר מנועי החיפוש לא יסרקו את האתר כלל.

עתה נבחן דוגמא מסובכת יותר:
User-agent: googlebot Disallow: /bonbons/ Disallow: bonbons.htm User-agent: bonboncrawler Disallow: /

בדוגמא זו נתנו הוראות שונות לשני רובוטים שונים. רובוט googlebot קיבל הוראה להימנע מגישה אל ספריית bonbons, ואל הקובץ bonbons.htm. ההוראה השניה מתייחסת לרובוט bonboncrawler, עליו אסרנו את הגישה לאתר כליל.

והדוגמא האחרונה:
User-agent: googlebot Disallow: User-agent: * Disallow: /

שימו לב כי האיסור הראשון (googlebot) הוא ריק! לכן, בעצם המשמעות היא ש-googlebot יכול לסרוק את כל דפי האתר. האיסור השני מונע מכל הרובוטים מלסרוק את האתר. לכאורה סתירה בין שתי ההוראות, אך למעשה כאשר יש סימן *, הנוגד הוראה יותר ספציפית, אז ההוראה היותר ספציפית מנצחת.

המשמעות של הקוד הקודם היא למעשה - גוגלבוט סורק את כל האתר, כל השאר לא.

מידע למפעילי פורומים
קובץ robots.txt יכול לסייע לכם למנוע מרובוטים לגלוש לחלקים בפורום שלכם שאינם כוללים מידע שימושי. דוגמא לדפים שכדאי למנוע אליהם גישה הוא דפי פרופיל משתמש, דף חיפוש, דף כתיבת הודעה חדשה ודף ההתחברות למערכת. כדי למנוע גישה לדפים אלו, אפשר לבנות קובץ כזה:
User-agent: * Disallow: /forum/post.asp Disallow: /forum/user_profile.asp Disallow: /forum/search.asp Disallow: /forum/password.asp

בהצלחה!


_________________
בשבילי את העולם בשבילך אני קיים ואיתך הכל מושלם
בלעדייך מי אני את החצי השני לעולם לעולםםםםםםםםםם
איתך רוצה לעוף למרחקים ובך אני בוחר כל החיים
bh:}

אור טובים מנהל ראשי - Admin


חזור למעלה
 פרופיל אישי  
 

הצג הודעות החל מה:  מיין לפי  

עמוד ראשי » פורומים - דיון, פנאי, תמיכה והעשרת חווית המשתמש » פורום מדריכים, טיפים וטריקים

עמוד 1 מתוך 1 [ 11 הודעות ]
פרסם נושא חדש הגב לנושא



עבור ל:  

[Nדר*ך]שליטת ברובוטי האינדוקס של מנועי החיפוש


היכל התהילה | דירוגים | הצוות
צור קשר | תנאי שימוש | רדיו מזרחית | מילים לשירים | חדשות המוסיקה | מוסיקה מזרחית | שירים במזרחית
Powered By PHPBB Copyright Noshmim Mizrahit 2003-2011 © All right reserved
שיווק הפרסומות באתר זה מופעל על ידי @.מ.י - שירותי מדיה וסליקה באינטרנט
רוצה לפרסם באתר זה? שלח אלינו מייל לקבלת הצעה משתלמת במיוחד