חיפשת ומצאת...
על מנועי חיפוש ואינדקסים בעברית
מאת: יהודית דרייר
yehuditd@cet.ac.il

תפקידה של הספרייה במשך אלפי שנים הוא לאחסן את הידע האנושי, לאגור אותו ולאפשר גישה נוחה לאחזור הידע. הספרייה משמשת בית קיבול לידע השמור באופנים שונים. בעבר נאגר ידע זה על חרסים או אבן, לאחר מכן הקלף שימש לצורך שמירת הידע, ומאז המצאת הנייר בסין, בשנת 105 לספירה, והתפשטותו לשאר מדינות העולם במאה השש-עשרה - משמש הנייר כאמצעי העיקרי לאגירת הידע. המהפכה של טכנולוגיית המידע עומדת לשנות את אמצעי האגירה העיקרי של הידע האנושי מנייר לבִיטים של מחשב (רשתי, 1997).

אגירת המידע האנושי באמצעים אלקטרוניים דורש מהמשתמש מיומנויות מידע, היא מֵידענוּת. מידענות הקניית שימוש מושכל, מוסרי ונכון במידע, על סוגיו וייצוגיו השונים, על מנת להשיג יעד מוגדר (משרד החינוך, 2001). חוקרים כוללים במידענות מיומנויות של שאילת שאלות, איתור מידע, סינון ובחירת פרטי מידע, הערכת מידע, ארגון המידע שנאסף והפקת המוצר שיוכל לעמוד לשימושם של אחרים.

מאגרי המידע הממוחשבים ובראשם רשת האינטרנט, הינם מקור המידע הרחב, המעודכן והנגיש שקיים כיום. הרשת הפכה את הפצת המידע ואת אחזורו לפשוט וקל. כמות המידע הקיימת ברשת נעמדת בביליוני דפי מידע, והצורך המיידי של המשתמשים הוא רכישת מיומנויות של חיפוש ואיתור מידע.

במיומנויות של חיפוש ואיתור מידע אנחנו מבחינים בין שני דפוסי חיפוש בסיסיים:
1. חיפוש שיטוט - חיפוש היוריסטי (Browsing), המתבצע באמצעות דילוגים בין פרטי מידע בצורה חופשית.
2. חיפוש מובנה - חיפוש אנליטי, המתבצע באמצעות ניסוח שאילתא במנוע החיפוש.

 
א. מהם מנועי חיפוש ?
מנועי חיפוש הם מאגרי מידע ענקי ממדים שבהם מקוטלגים דפי אינטרנט אשר נאספו באופן אוטומטי. ישנם שני סוגים של מנועי חיפוש:
מנועים אינדיבידואליים - מנועי חיפוש היוצרים מאגר מידע משלהם.
מנועים מקביליים - Met Searchers) ( מנועים המבצעים חיפוש במקביל במאגרי מידע שנוצרים על-ידי מנועים אינדיבידואליים.

ב. כיצד עובדים המנועים?
מנועי החיפוש משתמשים בתוכנה מסוג מיוחד בשם Spider אוCrawler , כדי לבצע סריקה אוטומטית של האינטרנט ולשלוח את תוצאות חיפושיה של התוכנה אל מאגר גדול של מחשבים. המחשבים יוצרים מסד נתונים ענק (כל מסד נתונים מכיל יותר מ- 150 מיליון פריטים). כאשר המשתמש מקליד שאילתה בתיבת החיפוש של מנוע החיפוש, שאילתה זו נשלחת אל מסד הנתונים שבמחשבים אלה, והמשתמש מקבל רשימה של דפים המכילים את התוצאות שנמצאו במסד הנתונים ותואמות את השאילתה.
דוגמאות למנועי חיפוש באנגלית הן: AskJeeves, Google , Teoma

ג. סקירה על מנועי חיפוש בעברית
מספר מנועי החיפוש בעברית הוא מועט, ועל קשיי החיפוש בשפה העברית תוכלו לקרוא במאמרו של פרופסור יעקב שויקה "קל למצוא, קשה לחפש":
http://www.ynet.co.il/articles/0,7340,L-1715828,FF.html

אף על פי כן ולמרות הכל - קיימים כיום מספר מנועי חיפוש בעברית:
1. מורפיקס - http://www.morfix.co.il/
השם Morfix מורכב מצירוף של שתי מילים: Morphology + Fix והמשמעות היא טיפול נכון בבעיות מחשוב שיוצרת המורפולוגיה הלשונית. מנוע מורפיקס עונה על הבעיות שיוצרת המורכבות המורפולוגית בעברית. הוא אינו מחפש רק את המילה כפי שהוקלדה בחלון החיפוש, אלא מבצע ניתוח לשוני גם למילות החיפוש וגם לטקסטים באתרים עצמם. הוא מביא בתוצאות החיפוש את כל צורות ההטיה האפשריות של המילה המבוקשת.

המנוע סורק כל דף הנמצא באינטרנט באופן אוטומטי, בניגוד למנועי החיפוש המוכרים ברשת הישראלית, הפועלים לפי אינדקס של אתרים. לפיכך, מנוע זה מוצא תכנים בתוך אתרים.

2. גוּגל בעברית - http://www.google.co.il/
מנוע החיפוש של גוגל סורק 1.3 מיליארד עמודי רשת מדי 28 יום, מנתח אותם ומקטלג אותם. כדי להמחיש את היקף המידע שתוכנה זו מסוגלת לעבד, מנוע החיפוש קיבל את השם Google על שם המונח המתמטי שמסמל מספר עם 100 אפסים.

נוסף לחיפוש הפשוט ניתן לבצע חיפוש מתקדם על-פי שפה, סוג הקובץ, תאריך, תמונות וגרפיקה.

3. בז - מנוע חיפוש לצעירים http://www.bazz.co.il/
בז הוא רשת מידע ומדריך אתרים, ובו ניתן לגלוש ולבצע חיפוש. הוא מיועד לבני נוער בגילאי 10-16. מנוע חיפוש של בז מכיל למעלה מ-3,000 פרטי מידע בעלי אוריינטציה חינוכית. הוא מכיל שש קטגוריות-על: תחומי דעת (כל המדעים הנלמדים בבתי-הספר), מסביב לעולם, ארץ ישראל, מחשבים, אמנות ובידור וספורט ופנאי, וכן גם "שולחן עבודה" המעניק לתלמידים קישורים למילון (עברי-אנגלי, אנגלי-אנגלי), לאנציקלופדיה בריטניקה, תנ"ך און-ליין, אטלס ומחשבון מדעי.

 
ד. מהם מדריכים - אינדקסים - ברשת?
האינטרנט מאורגן ברובו במדריכים - אינדקסים. בכל אחד מהמדריכים קיימים מנועי חיפוש. המדריכים אינם מחפשים בכל אתרי האינטרנט, אלא מקטלגים רק חלק קטן למדי של האינטרנט, אך הם מאורגנים היטב ונוחים במיוחד לשימוש. למעשה, הם פועלים ונראים כמו מדריכי "דפי זהב" מודפסים.

מספר דוגמאות למדריכים באנגלית: Yahoo , AltaVista , Dmoz ,
מספר דוגמאות למדריכים בעברית: נענע, וואלה, msn , Start ,

המדריך Start שונה מן האחרים בכך שהוא מדריך-על. מדריך-על "שותל" את השאילתות באינדקס שאותו ניתן לבחור מתוך רשימה נגללת. במדריך Start ניתן לבחור את רשימת מנועי החיפוש שבהם רוצים להשתמש (בחלון "התאמה אישית"). המדריך מצרף את כל דפי התוצאות שקיבל לדף תוצאות אחד.
 

במדריכים מסוימים ניתן לחפש קבצים מסוגים שונים: קובצי קול, גרפיקה, סרטים ועוד. אינדקסים אחרים מתמחים בנושא מסוים: רפואה, מפות או חינוך. לדוגמה:
הספרייה הווירטואלית של מטח היא מאגר מקוון של מקורות מידע המיועד לתלמידי בית-הספר היסודי והעל-יסודי, למוריהם ולהוריהם. בספרייה פריטי מידע והפניות לאתרי אינטרנט, הכתובים ברובם בשפה העברית בנושאים הנלמדים בבית-הספר, והיכולים לשמש להכנת שיעורי בית, לכתיבת עבודה וכן ולהעשרה אישית ולהרחבת הדעת. לפריטי המידע שבספרייה ייצוגים שונים, כמו טקסט, תמונות, מפות, גרפיקה, וידאו, וקול. ניתן לאתר פריטי מידע הן באמצעות עץ הנושאים המחולק לעשרה תחומי תוכן והן באמצעות מנוע החיפוש מורפיקס. כל פריט מידע שבאוסף הספרייה עובר מפתוח, ולכל פריט יש תעודת זהות. הספרייה מכילה גם קישורים לאתרי עיתונות יומית ואקטואליה, לאתרי לקסיקונים, לגופים העוסקים בנושאים של שימור הטבע ואיכות הסביבה, למפות ולגופים העוסקים בעזרה ובסיוע נפשי. אוסף הספרייה מונה כיום כ- 4,000 פריטים שמהם כשני-שליש הם פריטי טקסט ותמונות, וכשליש הם קישורים לאתרים. האוסף מתעדכן מספר פעמים בשבוע.

לאחר שחיפשנו, איתרנו, בחרנו וסיננו את המידע, עלינו להעריך את המידע, לארגן אותו ולהפיק מוצר שיוכל לעמוד לשימושם של אחרים. בנושאים אלה עוסקים מאמרים אחרים, כמו למשל: הערכת מקורות מידע ממוחשבים ו-קריטריונים להערכת מידע על-גבי תקליטורים באתר זה.


ביבליוגרפיה

מילר, מ. (2001). מידענות בקצות אצבעותיך, הוצאת אופוס.

משרד החינוך, המינהל למדע ולטכנולוגיה (2001). תכנית לימודים למידענות אתיקה וערכים ברשת, מהדורת ניסוי.

רשתי, ד. (1997). הספרייה הדיגיטלית -
 

שויקה, י. (2002 ) קל למצוא, קשה לחפש -

להורדת המאמר כקובץ Word